Дані викривають, що «Claude знижає рівень» — це не міський міф; нестабільність AI-моделі є ризиком для компанії

Після того, як ШІ став стандартним інструментом для підприємств, на поверхню швидко виходить явище, яке раніше вважали «проблемою відчуттів»: LLM (великі мовні моделі) «стають тупішими». Користувач Wisely Chen зазначив, що так зване «LLM-«пониження розуму»» — це не міський міф, а те, що вже можна постійно відстежувати за допомогою даних, і воно вже спричиняє відчутний вплив на робочі процеси компаній.

Він наводить приклад зі власного досвіду: 15 квітня в сервісах лінійки Claude від Anthropic стався повсюдний downgrade, зокрема claude.ai, API та Claude Code — усі вони показували «Degraded Performance». Це не просто уповільнення або поодинокі помилки, а помітне падіння якості відповідей; навіть траплялися випадки, коли сервіс неможливо було нормально використовувати, через що того дня всі три його розробницькі завдання було повністю перенесено.

За таких сценаріїв для індивідуальних розробників це, можливо, лише зниження ефективності, але для команд IT підприємств вплив багаторазово посилюється. Коли в команді кілька інженерів одночасно покладаються на інструменти ШІ для програмування, написання документів і автоматизації процесів, один раз — і модель знижується в якості — означає, що загальна продуктивність в той самий час падає колективно, перетворюючись на відчутні втрати часу та витрат.

ШІ відчутно «стало гірше з розумом»? Дані підтверджують: це сталося «давно»

Wisely Chen зазначив, що фрази на кшталт «GPT став тупішим», «Claude не такий, як раніше» ходять у спільноті давно, але довго бракувало об’єктивних даних, які б це підтверджували. Лише нещодавно поява платформ із постійним моніторингом якості моделей дозволила вперше це кількісно оцінити.

Зокрема, StupidMeter проводить 24-годинні автоматизовані тести для популярних моделей, включно з OpenAI, Anthropic, Google тощо, відстежуючи такі показники, як точність, здатність до міркувань і стабільність. На відміну від традиційних разових benchmark-ів, такі системи ближчі до підходу до моніторингу API або доступності сервісів у компаніях: спостерігають, як модель «плаває» за продуктивністю в умовах реального використання.

Результати даних дуже показові: наразі більшість основних моделей перебувають у стані попередження або downgrade, і лише небагато моделей зберігають нормальний режим. Це означає, що нестабільність якості моделей — не проблема одного конкретного продукту, а поширене явище всієї індустрії.

LLM непомітно «деградує в інтелекті», впливаючи на стабільність бізнесу, який використовує AI-процеси

Для підприємств такі зміни означають, що ШІ з «інструмента для підвищення ефективності» перетворюється на «змінну, яка впливає на стабільність». Якщо щоденні робочі процеси компанії — від написання програм до code review, а також випуск документів і аналітичних звітів — уже значною мірою залежать від LLM, то коли модель в один день демонструє падіння здатності до міркувань або погіршення якості відповідей, ці проблеми не виникатимуть локально, як звичайні баги традиційного програмного забезпечення: вони проникатимуть одночасно в усі етапи, де використовують ШІ.

Ще важливіше те, що такі коливання часто важко прогнозувати і так само важко вчасно помітити. У більшості компаній немає механізмів постійного моніторингу якості моделей; зазвичай вони усвідомлюють, що проблема походить саме від моделі, лише після того, як результати стають аномальними або знижується ефективність команди. За такої ситуації «пониження розуму» вже не є лише суб’єктивним відчуттям користувачів — це системний ризик, який безпосередньо впливає на ритм роботи та функціонування підприємства.

Коли ШІ стає як вода й електрика, стабільність стає новим ключовим показником

Wisely Chen порівняв роль LLM із «водою й електрикою сучасної компанії». Коли ШІ глибоко вбудувався в щоденну діяльність і став незамінною базовою здатністю, значення стабільності зростає ще більше.

Раніше, оцінюючи інструменти ШІ, компанії більше фокусувалися на можливостях моделі, ціні та функціях, але коли на поверхню спливає явище «пониження розуму», з’являється інший, ще важливіший показник — стабільність. Якщо якість моделі може змінюватися без попередження, компанії більше не просто «використовують ШІ» — їм доводиться брати на себе новий тип ризику для базової інфраструктури. І ще безнадійніше те, що якщо дивитися лише на передові великі мовні моделі, то майже напевно, доки не буде вирішено проблеми з обчислювальними ресурсами, це може продовжуватися.

Ця стаття «Дані: “Claude став тупішим” — це не міський міф, а нестабільність AI-моделей є ризиком для підприємств» вперше з’явилася на «Ланцюжкових новинах ABMedia».

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Фізична лабораторія Безоса зі ШІ Project Prometheus наближається до оцінки в $38 мільярда з раундом $10B

Повідомлення Gate News, 22 квітня — компанія Джеффа Безоса з ШІ Project Prometheus близька до завершення $10 мільярдного раунду зі збору коштів від JPMorgan, BlackRock та інших інституційних інвесторів, повідомляє The Financial Times із посиланням на людей, обізнаних із ситуацією. Раунд фінансування оцінює компанію в

GateNews19хв. тому

Tesla реєструє AI голосового асистента в Китаї та використовує локальні моделі від DeepSeek і Doubao

Повідомлення Gate News, 22 квітня — 21 квітня Tesla подала до регулятора кіберпростору Китаю заявку на свого генеративного AI голосового асистента, повідомляють органи Шанхаю. Подача є обов’язковою для AI-послуг, що працюють у Китаї, і є одним із 158 AI-продуктів та функцій, які завершили

GateNews19хв. тому

Adobe Схвалює Програму Викупу Акцій на $25 Мільярда Доларів До 2030 Року, Акції Зростають На 2%

Повідомлення Gate News, 22 квітня — Рада директорів Adobe 21 квітня схвалила програму викупу акцій на $25 мільярда. Вона діятиме до 30 квітня 2030 року. Акції компанії зросли приблизно на 2% у подовжених торгах після оголошення. Акції Adobe знизилися приблизно на 30% цього року, оскільки інвестори

GateNews19хв. тому

Claude Mythos від Anthropic Виявляє 271 Питому Загрозу Безпеці у Firefox

Міфос від Anthropic під назвою Claude Mythos під час внутрішнього тестування виявив 271 уразливість у Firefox, усі їх було виправлено цього тижня; раніше модель знайшла 22. Міфос, запущений у березні 2026 року, пропонується відібраним партнерам через проєкт Project Glasswing.

GateNews24хв. тому

Дохід HCLTech за 4-й квартал не виправдав оцінок на тлі уповільнення витрат клієнтів

Фінансова звітність HCLTech за 4-й квартал: дохід не виправдав очікувань через охолодження ІТ-видатків; послуги з AI різко зросли, тоді як замовлення впали, а прогноз був слабким. Бюджети зміщувалися в бік контролю витрат на тлі регіональної слабкості. Анотація: У цій статті підсумовуються результати HCLTech за четвертий квартал, з відзначенням того, що дохід був нижчим за очікування, попри зростання на 12,3% у річному вимірі. Нові замовлення знизилися, тоді як послуги з AI зросли у чотири рази — до US$620 млн. The компанія надала орієнтир щодо зростання на фіскальний 2027 рік у межах 1%–4%, що відображає ширше уповільнення в індійських ІТ-послугах, оскільки бюджети зміщуються з дискреційних цифрових проєктів на заходи з контролю витрат; слабкість у телекомунікаціях і Європі формує обережний прогноз.

GateNews39хв. тому

Фінансування сектору ШІ у Q1 досягає $242 млрд, але є зосередженим у мегараунтах під проводом OpenAI з $122 млрд

Повідомлення Gate News, 22 квітня — Компанії зі штучного інтелекту залучили приблизно $242 млрд у першому кварталі 2026 року, що становить близько 80% глобальних інвестицій венчурного капіталу, за даними криптоаналітика Ai. Однак фінансування залишалося вкрай зосередженим у декількох

GateNews40хв. тому
Прокоментувати
0/400
Немає коментарів