Кархапі: ШІ не має зупинятися на Markdown! HTML — це майбутнє, а кінцева мета — досліджувані інтерактивні сценарії

Андрій Карпатьї 近日 на платформі X відреагував на погляди інженера команди Anthropic Claude Code Тхаріка Шихіпара. Він зазначив, що коли ставиш запитання великій мовній моделі, достатньо додати в підказці наприкінці одну фразу: «Будь ласка, оформіть відповідь у вигляді структури HTML», а потім згенерований файл переглянути в браузері — і ефект часто виходить дуже добрий. Він навіть сказав, що сам пробував вимагати від LLM оформити відповідь у вигляді слайдів і теж отримав непогані результати.

(Інженер Anthropic: HTML — найкращий формат виводу для Claude Code, а не Markdown)

Від простого тексту до HTML: AI-вивід рухається від «читабельного» до «візуалізованого»

Це висловлювання продовжує недавню дискусію серед розробницької спільноти AI про те, чи є HTML більш доречним форматом для виводу, ніж Markdown. Раніше Шихіпар у статті〈Using Claude Code: The Unreasonable Effectiveness of HTML〉стверджував, що для таких AI-кодингових агентів, як Claude Code, HTML — це не лише формат для розмітки, а інтерфейс виводу, який дозволяє відповіді AI перейти від лінійного тексту до інтерактивного документа.

Карпатьї натомість підняв цю тему до еволюції людських і AI-інтерфейсів введення та виводу. На його думку, наразі більшість LLM за замовчуванням лишається на етапі Markdown. Порівняно з первинним текстом Markdown уже покращує досвід читання через заголовки, жирний шрифт, курсив, таблиці тощо, але за своєю суттю він усе ще є лінійним представленням, де текст — основа.

У своїй класифікації він описує еволюційний шлях AI-форматів виводу приблизно так: перший етап — первинний текст, з найвищою вартістю читання; другий етап — Markdown, тобто нинішній типовий формат більшості AI-продуктів; третій етап — HTML. HTML, хоча й залишається програмованим продуктом, де базовою потребою є теги та структура, забезпечує набагато гнучкіші графіки, компонування, стилі й навіть можливість додавати інтерактивні елементи.

Markdown робить відповідь AI «легшою для читання», але HTML може перетворити відповідь AI на документ, який «можна переглядати, можна використовувати, можна візуально зрозуміти».

Ось ключова причина, чому Шихіпар раніше стверджував, що HTML кращий за Markdown: HTML здатен підтримувати SVG-графіки, кольорові коди, CSS-стилі, блоки-попередження, внутрішні якорі, інтерактивні елементи та таблиці для паралельного порівняння. Для сценаріїв на кшталт технічної документації, аналізу вразливостей, візуалізації даних, навчальних пояснень тощо HTML може перетворити текстову інформацію, яку читачеві доводиться поступово «перетравлювати», на візуальний документ, де рівні, ризики й зв’язки видно з першого погляду.

Карпатьї: люди більше люблять голосовий ввід, але ще більше — візуальний вивід для AI

Новий погляд Карпатьї — це не лише про HTML, а про майбутнє AI-інтерфейсів.

Він зазначив, що з боку введення люди, ймовірно, більше полюбляють голос і взаємодію з AI, бо говорити — це природний і маловитратний спосіб передавання інформації. Але з боку виводу люди насправді більше віддають перевагу візуальній інформації — включно з зображеннями, анімаціями та відео.

Його аргумент такий: приблизно третина мозку людини задіяна для обробки візуальної інформації. Тому, коли можливості AI зростають, AI не має просто пакувати відповіді в текст — він має поступово рухатися до більш високої щільності й більш інтуїтивного візуального виводу.

Це робить важливість HTML набагато конкретнішою. HTML — не кінцева точка, а радше перехідний етап, через який AI може перейти від текстового виводу до візуалізації. Він краще за Markdown передає зображення, компонування та інтерактивність, але все ще стабільніший і керованіший, ніж повністю згенеровані нейромережами відео чи симуляції.

Карпатьї також припустив: хоча відповідні технології наразі ще не існують, у довгостроковій перспективі кінцевою точкою AI-виводу можуть стати якісь інтерактивні відео або симуляції, згенеровані безпосередньо дифузійними моделями.

Тобто в майбутньому AI може бути не лише «відповіддю текстом», і не лише «створенням HTML-документа» — а прямим генеруванням візуального середовища, яке можна інтерактивно опрацьовувати, досліджувати та в якому можливі динамічні зміни. Користувач зможе ним керувати, дивитися на зміни й розуміти причинно-наслідкові зв’язки — наче поєднати навчальне відео, інтерактивні симуляції та інтерфейс із миттєвим генеруванням.

Втім, Карпатьї визнає, що тут іще багато відкритих питань. Зокрема, як об’єднати в єдину систему точні, верифіковані й процедурні результати з традиційної інженерії ПЗ — «Software 1.0», наприклад інтерактивні симуляції, фронтенд-компоненти, математичні моделі — з нейромережевими зображеннями, анімаціями чи відео, згенерованими дифузійними моделями. Достовірної зрілої відповіді досі немає.

Ця стаття Карпатьї: AI не має зупинятися на Markdown! HTML — майбутнє, фінал — це інтерактивні сцени, які можна досліджувати Вперше з’явилася в 鏈新聞 ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів