Мілашка Джова Вікі за допомогою ШІ створила «проєкт на відмінно»? Перевірка розробників: це справді змістовно чи перебільшене хайп-розкручування?

Система AI-пам’яті MemPalace, у розробці якої брала участь Мілла Йовович, заявляє, що тести були виконані на 100% і через це стала вірусною, проте спільнота викрила її: тестування нібито супроводжувалося шахрайством і маніпуляціями даними. Під час практичної перевірки з’ясувалося, що ефект переоцінено і виявлено багато помилок; команда визнала недоліки та вже працює над їхнім виправленням.

Мілла Йовович створила AI-палац пам’яті, що привернув увагу ззовні

Учора (4/7) у колі AI з’явилася велика новина: голлівудська акторка Мілла Йовович (Milla Jovovich), відома ролями у «Останній охороні», «П’ятому елементі», разом із розробником Ben Sigman використала Claude Code для допомоги в розробці відкритої «MemPalace» як системи AI-пам’яті.

Одразу поширилася думка «голлівудська зірка вийшла на інший рівень і створила проєкт на максимум балів», і донині MemPalace на GitHub має понад 20 000 зірок, але дуже швидко розробницька спільнота почала сумніватися: це справді щось вартісне чи просто піар?

Спочатку розберімо мотив появи MemPalace. У офіційній документації сказано, що команда хоче вирішити проблему, коли в поточних AI-системах вміст діалогів користувачів з AI, процес ухвалення рішень та обговорення архітектури зазвичай зникають після завершення робочого етапу, через що місячні зусилля фактично падають до нуля.

Для вирішення цієї проблеми MemPalace використовує просторову архітектуру для зберігання пам’яті: інформацію чітко групують у «крилові зони» для представників або проєктів, а також у різні рівні структури, як-от коридори, кімнати та шухляди, зберігаючи оригінальний текст діалогу для подальшого семантичного пошуку.

Команда розробників заявляє, що MemPalace досягла ідеальних 100% у довготривалому оціночному базисі пам’яті LongMemEval, і водночас отримала 96.6% точності без виклику будь-яких зовнішніх API, а також може повністю працювати локально, не потребуючи підписки на хмарні сервіси, і доповнена заявленою системою діалектів AAAK, що нібито здатна забезпечити 30-кратне безвтратне стиснення.

Джерело зображення: GitHub Голлівудська зірка Мілла Йовович створила AI-палац пам’яті, що привернув увагу ззовні

Колеги та спільнота одночасно піддали сумніву, тестування та просування мають недоліки

Однак, заявлена MemPalace ідеальна оцінка LongMemEval дуже швидко викликала сумніви з боку колег.

PenfieldLabs, компанія, що також створює системи AI-пам’яті, зазначила, що MemPalace стверджує: у датасеті LoCoMo вона отримала 100%, що математично не могло статися, адже стандарти відповідей у цьому датасеті самі містять 99 помилок.

У своєму аналізі PenfieldLabs виявила, що 100% результат MemPalace походить із встановлення кількості запитів на пошук на 50 разів, але для тестових діалогів максимальна кількість етапів становить лише 32, що означає: система напряму обходить етап пошуку й передає всі дані AI-моделі для читання.

Щодо 100% результату в LongMemEval команду розробників викрили: виявилося, що вона націлилася на 3 конкретні проблеми, які зосереджені на розробці та дали збій, написала спеціальний код для виправлення, і це створює підозру, що під час тестування було здійснено шахрайство з тестовим набором.

Джерело зображення: Reddit Колега PenfieldLabs вказує, що MemPalace стверджує: у датасеті LoCoMo отримала ідеальний результат, але математично цього не могло статися

Практична перевірка на GitHub: базові тести мають елементи введення в оману

Користувач GitHub hugooconnor після практичної перевірки прокоментував: MemPalace заявляє аж 96.6% точності пошуку, але насправді повністю не використовує архітектуру «AI-палацу пам’яті», яку вона рекламувала. hugooconnor каже, що їхнє тестування лише викликає стандартні можливості базового сховища ChromaDB і зовсім не стосується логіки категоризації, яку підкреслює проєкт, як-от крилові зони, кімнати або шухляди.

Після тестування hugooconnor з’ясував: коли система реально вмикає ці власні логіки категоризації палацу пам’яті, результат пошуку навпаки погіршується. Наприклад, у режимі «кімната» точність знижується до 89.4%, а після ввімкнення технології стиснення AAAK точність ще падає до 84.2%; у обох випадках це нижче, ніж показує стандартна робота бази даних.

hugooconnor також розкритикував методологію тестування: середовище тестування MemPalace навмисно звужує діапазон пошуку для кожного питання приблизно до 50 діалогових етапів, тож у дуже маленькій колекції зразків знайти відповідь надто легко.

Якщо розширити діапазон до понад 19,000 діалогових етапів у реальних сценаріях, точність традиційного пошуку за ключовими словами падає до 30%, що вказує: нинішній формат тестування MemPalace маскує реальну складність пошуку.

Джерело зображення: GitHub Практична перевірка користувача GitHub: у базовому тестуванні MemPalace є елементи введення в оману

Водночас, хоча команда розробників уже опублікувала заяву про виправлення і визнала, що технологія AAAK справді підтверджується як така, що є зі втратами, та пообіцяла на основі суворої критики спільноти відкоригувати документи й дизайн системи, головний опис проєкту досі зберігає кілька непідкоригованих перебільшень, зокрема заяви про 30-кратне безвтратне стиснення та 34% підвищення точності пошуку, а також порівняльні графіки з іншими конкурентами взагалі не містять джерел.

Вихідний код MemPalace стикається з багатьма Bug

Зі збільшенням кількості завантажень тестувань на GitHub з’явилася велика кількість звітів про Bug у вихідному коді MemPalace.

Користувач cktang88 навів низку серйозних недоліків: зокрема, команди для стиснення не працюють і спричиняють падіння системи, у логіці підрахунку кількості слів для підсумків є помилки, статистичні дані щодо «викопування кімнат» є неточними, а також сервер під час кожного виклику завантажує в пам’ять усі інтерпретаційні дані, що створює критичні проблеми зі споживанням ресурсів.

Серед інших вказаних проблем також є те, що система примусово записує назви домашніх членів розробника в типовий конфігураційний файл, а під час перевірки статусу існує обмеження на примусове відображення 10,000 записів даних.

Для цих проблем відкрита спільнота вже почала активно виправляти. Користувач adv3nt3 надіслав кільказапитів навиправлення, включно з виправленням статистичних даних «викопування», видаленням типових назв членів родини та відтермінуванням ініціалізації часу для знаннєвої граф-схеми. Після цього команда розробників також визнала ці помилки та поступово виправляє проблеми з кодом у співпраці з спільнотою.

Мілла Йовович Vibe Coding — це круто, а спосіб просування — ні

Щодо цього проєкту MemPalace користувач Hacker News darkhanakh зробив висновок: MemPalace залишає відчуття на кшталт OpenClaw, тобто штучно маніпулюють результатами базових тестів (benchmark), щоб вони виглядали ідеально бездоганними, а потім упаковують це як якусь велику проривну подію для маркетингу.

Він вважає, що базова технологія MemPalace може бути справді цікавою, але за умов, коли методика тестування має такі недоліки, а ще й продається як «найвищий публічно доступний результат в історії», це виглядає явно недоречно, «але, знаєте, з тією справою, що Мілла Йовович грає в Vibe Coding, я, мабуть, усе ж думаю, що це доволі круто».

Додаткове читання:
AI написала код і наробила проблем! Проблема з безпекою в додатку «Прагни не марнувати їжу» (дата продукції в супермаркеті на смітник), GPS вдома повністю «випав» в ефір

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

DownDetector: Користувачі повідомляють про збій у сервісі Claude AI

Новини з воріт, 13 квітня, за даними сайту моніторингу стану мережі DownDetector, користувачі повідомляють про проблеми в сервісі Claude AI. Claude — це продукт AI-помічника, запущений компанією Anthropic.

GateNews31хв. тому

Відповідай на запитання: AI дозволяє тобі підвищити ефективність у п’ять разів — ти зменшуєш витрати на 80% чи робиш у п’ять разів більше роботи?

Впровадження ШІ може значно підвищити продуктивність команди, але чи призведе це до безробіття — ключове питання полягає в уяві творчих людей і керівників, які ухвалюють рішення. У статті зазначається, що в історії технічний прогрес, навпаки, збільшував попит, а не зменшував його. Водночас технологічні революції підніматимуть рівень людської роботи до більшої абстракції: рутинні низькорівневі завдання стискатимуться, а можливості для високорівневих рішень посилюватимуться. У майбутньому конкурентоспроможність компаній визначатиметься ефективністю роботи агентів; і те, як застосувати ШІ для розширення можливостей, а не лише для оптимізації витрат, стане ключем до успіху чи поразки.

ChainNewsAbmedia37хв. тому

Дослідження Nous: глибокий розбір — децентралізована AI-лабораторія Paradigm, що ставить 1 млрд оцінки, Hermès-модель і мережа Psyche: повний розбір

Nous Research — це відкрита AI-лабораторія з відкритим вихідним кодом, яка спеціалізується на серії моделей Hermes. У 2025 році компанія отримала від Paradigm інвестиції в розмірі 50 млн доларів США та оцінила себе в 1 млрд. Її унікальність полягає в тому, що командою crypto native спочатку розробляються AI-технології, а потім вони інтегруються з блокчейном. Ключовий продукт — моделі Hermes — створено на основі ідеї зниження рівня відмов, а джерелами даних переважно є синтетичні дані. Паралельно Psyche Network будує децентралізовану AI-мережу для навчання на Solana, стимулюючи учасників через токенові механізми. Nous Research використовує стратегії відкритого коду та децентралізації, щоб продемонструвати свою технічну спроможність і життєздатність.

ChainNewsAbmedia55хв. тому

OpenAI у своїй службовій записці високо оцінила партнерську програму Amazon, заявивши, що Microsoft обмежує її можливості охоплювати клієнтів

Новини Gate News, 13 квітня, OpenAI у меморандумі високо оцінила альянс із Amazon, заявивши, що Microsoft «обмежила її здатність охоплювати своїх клієнтів». Новопризначена головна директорка з доходів OpenAI Деніз Дрессер у меморандумі зазначила, що альянс із Amazon розглядають як ключовий фактор зростання для корпоративного бізнесу OpenAI. Станом на цей час Microsoft ще не відповіла на запит щодо коментаря з цього приводу. (CNBC)

GateNews3год тому

Гонконгське бюро інновацій і технологій підписало меморандум про співпрацю з Національним офісом кіберпростору Китаю, який охоплює такі сфери, як ШІ, транскордонні дані, блокчейн тощо

Новини Gate News, 13 квітня, уряд Спеціального адміністративного району Гонконг у сфері інноваційних технологій та промисловості оголосив про підписання з Національним управлінням кіберпростору Китаю Меморандуму про взаєморозуміння щодо співпраці в розвитку інноваційних технологій. Метою є сприяння високоякісному розвитку цифрової економіки шляхом використання інновацій у сфері технологій. Меморандум про взаєморозуміння охоплює ключові напрямки, зокрема штучний інтелект, транскордонні дані та блокчейн. Мета цього меморандуму — глибоко реалізувати національне планування «п’ятнадцятий п’ятирічний план» (十五五), підтримати створення Гонконгом міжнародного центру інноваційних технологій і сприяти розвитку нової суб’єктної економіки, де технологічні інновації є основою.

GateNews4год тому

Оновлений розділ акцій Gate 4 квітня: стартує торгівля 5 пре-IPO безстроковими контрактами з первинним лістингом OpenAI, Anthropic тощо, доступна торгівля з кредитним плечем 1–10x

Gate News повідомлення, згідно з офіційним оголошенням Gate від 13 квітня 2026 року Розділ акцій Gate буде запущено 13 квітня 2026 року о 20:00 (UTC+8) з попередніми торгами для п’яти майбутніх торгів USDT-розрахунковими безстроковими контрактами на OPENAI, ANTHROPIC, ANDURIL, KALSHI та POLYMARKET, доступні операції як із плечем 1-10x для лонгів, так і для шортів. OpenAI — це лабораторія з дослідження штучного інтелекту, яка розробила такі продукти, як ChatGPT, DALL·E тощо, наразі вона перебуває на етапі Pre-IPO. Anthropic — це компанія з великих мовних моделей, заснована колишніми ключовими учасниками OpenAI, з фокусом на безпечний і надійний AI. Anduril Industries — це технологічна компанія у сфері AI та автономної оборони, заснована у співавторстві з Палмером Лакі, засновником Oculus. Kalshi — це біржа прогнозних ринків, що регулюється CFTC у США. Polymarket — найбільший у світі децентралізований прогнозний ринок. Усі контракти розраховуються за ціною з одиницею оцінки 1 мільярд доларів США. Наприклад, коли оцінка компанії становить 8000 мільярдів доларів США, одинична ціна дорівнює 800 доларів США.

GateAnnouncement4год тому
Прокоментувати
0/400
Немає коментарів