Дослідження MIT: перевірка фактів за допомогою ШІ підвищила точність на 21%, але знизила навички без сторонньої допомоги

Дослідники MIT Media Lab виявили, що люди, які використовують ШІ для оцінювання точності новин, можуть ставати менш ефективними у самостійному виявленні дезінформації, згідно з новим дослідженням, яке відстежувало 67 учасників упродовж чотирьох тижнів. Поки допомога ШІ підвищувала точність виявлення дезінформації на 21%, результати учасників під час нових оцінювань без ШІ знижувалися на 15,3 відсоткового пункта. Дослідження з’являється на тлі того, що ШІ-чатботи на кшталт ChatGPT, Claude та Grok дедалі частіше використовують для перевірки інформації онлайн, що викликає питання, чи ці інструменти допомагають користувачам розвивати критичне мислення, або ж формують залежність від систем ШІ.

Дослідники MIT відстежили 67 учасників, які використовували систему виявлення з ШІ

Дослідники створили систему, яка поєднувала GPT-4o від OpenAI та Google Search, щоб допомогти учасникам оцінювати новинні матеріали. Спочатку учасники незалежно визначали, чи є заголовок і зображення реальними або фейковими, а потім обговорювали цей матеріал із GPT-4o, перш ніж ухвалити остаточне рішення. Чотиритижневе дослідження згенерувало 7 203 розмови з ШІ та 4 536 оцінок достовірності новин.

Згодом дослідники протестували учасників на новому, раніше не баченому контенті без допомоги ШІ, щоб визначити, чи їхні навички виявлення дезінформації покращилися або погіршилися. Команда використала Claude 3.5 Sonnet від Anthropic для аналізу тисяч розмов між користувачами та ШІ.

Точність зросла на 21% із ШІ, знизилася на 15,3% без допомоги

У дослідженні встановили, що допомога ШІ підвищувала точність виявлення дезінформації на 21% під час сесій із підтримкою. Водночас під час нових оцінювань без ШІ результати учасників знижувалися на 15,3 відсоткового пункта. Зниження було зумовлене здебільшого зменшеною здатністю розпізнавати фейкові новини, тоді як точність щодо реальних новин залишалася тією самою.

Оскільки дослідження використовувало старіші версії GPT-4o та Claude 3.5 Sonnet, незрозуміло, чи дали б подібні результати новіші моделі ШІ, як-от GPT-5.5 або Claude Opus 4.8 із потужнішими можливостями міркування.

Дослідження виявляє ризик залежності замість розвитку навичок

Дослідники припускають, що хоча ШІ може покращувати результат «тут і зараз», він може спонукати до залежності від технології. «Наша лонгітюдна аналітика демонструє, що нинішні підходи пріоритезують корекцію переконань замість розвитку навичок, створюючи залежність, а не стійкі можливості розрізнення», — сказано в дослідженні. «Оскільки ШІ стає дедалі складнішим, критично важливо, щоб ці інструменти формували навички критичного мислення, а не когнітивну залежність, для збереження суспільної стійкості до дезінформації».

За даними дослідників MIT, дослідження виходить на тлі того, що ШІ-чатботи все частіше використовують для перевірки інформації онлайн. «ШІ-помічники на кшталт ChatGPT, Claude та Grok дедалі частіше використовують для оцінювання довіри до онлайн-інформації — від визначення автентичності новинних заголовків і вірусних зображень до відповіді на питання, чи є правдивими медичні твердження або політичні чутки», — написали дослідники. «Хоча недавні дослідження припускають, що такі системи можуть зменшувати віру в конкретні хибні твердження, залишається незрозумілим, чи ці розмови вчать людей виявляти дезінформацію, або ж просто зміщують переконання щодо хибної інформації за допомогою допомоги ШІ».

ШІ-згенеровані кадри війни поширюються в соцмережах

Дослідження з’являється тоді, коли генеративний ШІ зробив створення переконливої фейкової новинної інформації легшим, ніж будь-коли раніше: реалістичні зображення та відео можуть швидко поширюватися в соцмережах і користуватися тим, що люди схильні довіряти тому, що бачать.

Після ракетних ударів Ірану по Ізраїлю в червні 2025 року відео, які нібито демонстрували руйнування в Тель-Авіві та в районі аеропорту Бен-Гуріон, широко розійшлися в соцмережах, зібравши мільйони переглядів, перш ніж їх ідентифікували як згенеровані ШІ. Занепокоєння щодо поширення фейкових воєнних кадрів тривало на різних платформах соцмереж.

X оголосила про політику призупинення для авторів невідомих AI-відео конфліктів

У березні X оголосила, що призупинятиме авторів у своїй програмі розподілу доходів за публікацію відео конфліктів, згенерованих ШІ, без розкриття інформації. «Під час війни критично важливо, щоб люди мали доступ до автентичної інформації на місцях», — написав Head of Product X Нікіта Бір. «За сучасних технологій ШІ створити контент, який може ввести людей в оману, — елементарно».

Питання й відповіді

Що дослідники MIT з’ясували про AI-супровід для перевірки фактів? Дослідники MIT Media Lab виявили, що хоча допомога ШІ підвищувала точність виявлення дезінформації на 21% під час сесій із підтримкою, результати учасників під час нових оцінювань без ШІ знижувалися на 15,3 відсоткового пункта. Чотиритижневе дослідження відстежувало 67 учасників через 7 203 розмови з ШІ та 4 536 оцінок достовірності новин.

Як у дослідженні MIT перевіряли навички учасників із виявлення дезінформації? Дослідники створили систему, яка поєднувала GPT-4o від OpenAI з Google Search. Спочатку учасники незалежно визначали, чи є заголовок і зображення реальними або фейковими, а потім обговорювали цей матеріал із GPT-4o, перш ніж ухвалити остаточне рішення. Згодом дослідники протестували їх на новому, раніше не баченому контенті без допомоги ШІ, щоб оцінити розвиток навичок.

Чому X оголосила політику призупинення для AI-згенерованих відео про війну? У березні X оголосила, що призупинятиме авторів у своїй програмі розподілу доходів за публікацію відео конфліктів, згенерованих ШІ, без розкриття інформації. Політика з’явилася після поширення фейкових кадрів унаслідок ракетних ударів Ірану по Ізраїлю в червні 2025 року, коли AI-згенеровані відео із заявами про те, що показують руйнування в Тель-Авіві, зібрали мільйони переглядів, перш ніж їх ідентифікували як фейк.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів