Кархапі: ШІ не має зупинятися на Markdown! HTML — це майбутнє, а кінцева мета — досліджувані інтерактивні сценарії

2026-05-12 04:05:39

Андрій Карпатьї 近日 на платформі X відреагував на погляди інженера команди Anthropic Claude Code Тхаріка Шихіпара. Він зазначив, що коли ставиш запитання великій мовній моделі, достатньо додати в підказці наприкінці одну фразу: «Будь ласка, оформіть відповідь у вигляді структури HTML», а потім згенерований файл переглянути в браузері — і ефект часто виходить дуже добрий. Він навіть сказав, що сам пробував вимагати від LLM оформити відповідь у вигляді слайдів і теж отримав непогані результати.

(Інженер Anthropic: HTML — найкращий формат виводу для Claude Code, а не Markdown)

Від простого тексту до HTML: AI-вивід рухається від «читабельного» до «візуалізованого»

Це висловлювання продовжує недавню дискусію серед розробницької спільноти AI про те, чи є HTML більш доречним форматом для виводу, ніж Markdown. Раніше Шихіпар у статті〈Using Claude Code: The Unreasonable Effectiveness of HTML〉стверджував, що для таких AI-кодингових агентів, як Claude Code, HTML — це не лише формат для розмітки, а інтерфейс виводу, який дозволяє відповіді AI перейти від лінійного тексту до інтерактивного документа.

Карпатьї натомість підняв цю тему до еволюції людських і AI-інтерфейсів введення та виводу. На його думку, наразі більшість LLM за замовчуванням лишається на етапі Markdown. Порівняно з первинним текстом Markdown уже покращує досвід читання через заголовки, жирний шрифт, курсив, таблиці тощо, але за своєю суттю він усе ще є лінійним представленням, де текст — основа.

У своїй класифікації він описує еволюційний шлях AI-форматів виводу приблизно так: перший етап — первинний текст, з найвищою вартістю читання; другий етап — Markdown, тобто нинішній типовий формат більшості AI-продуктів; третій етап — HTML. HTML, хоча й залишається програмованим продуктом, де базовою потребою є теги та структура, забезпечує набагато гнучкіші графіки, компонування, стилі й навіть можливість додавати інтерактивні елементи.

Markdown робить відповідь AI «легшою для читання», але HTML може перетворити відповідь AI на документ, який «можна переглядати, можна використовувати, можна візуально зрозуміти».

Ось ключова причина, чому Шихіпар раніше стверджував, що HTML кращий за Markdown: HTML здатен підтримувати SVG-графіки, кольорові коди, CSS-стилі, блоки-попередження, внутрішні якорі, інтерактивні елементи та таблиці для паралельного порівняння. Для сценаріїв на кшталт технічної документації, аналізу вразливостей, візуалізації даних, навчальних пояснень тощо HTML може перетворити текстову інформацію, яку читачеві доводиться поступово «перетравлювати», на візуальний документ, де рівні, ризики й зв’язки видно з першого погляду.

Карпатьї: люди більше люблять голосовий ввід, але ще більше — візуальний вивід для AI

Новий погляд Карпатьї — це не лише про HTML, а про майбутнє AI-інтерфейсів.

Він зазначив, що з боку введення люди, ймовірно, більше полюбляють голос і взаємодію з AI, бо говорити — це природний і маловитратний спосіб передавання інформації. Але з боку виводу люди насправді більше віддають перевагу візуальній інформації — включно з зображеннями, анімаціями та відео.

Його аргумент такий: приблизно третина мозку людини задіяна для обробки візуальної інформації. Тому, коли можливості AI зростають, AI не має просто пакувати відповіді в текст — він має поступово рухатися до більш високої щільності й більш інтуїтивного візуального виводу.

Це робить важливість HTML набагато конкретнішою. HTML — не кінцева точка, а радше перехідний етап, через який AI може перейти від текстового виводу до візуалізації. Він краще за Markdown передає зображення, компонування та інтерактивність, але все ще стабільніший і керованіший, ніж повністю згенеровані нейромережами відео чи симуляції.

Карпатьї також припустив: хоча відповідні технології наразі ще не існують, у довгостроковій перспективі кінцевою точкою AI-виводу можуть стати якісь інтерактивні відео або симуляції, згенеровані безпосередньо дифузійними моделями.

Тобто в майбутньому AI може бути не лише «відповіддю текстом», і не лише «створенням HTML-документа» — а прямим генеруванням візуального середовища, яке можна інтерактивно опрацьовувати, досліджувати та в якому можливі динамічні зміни. Користувач зможе ним керувати, дивитися на зміни й розуміти причинно-наслідкові зв’язки — наче поєднати навчальне відео, інтерактивні симуляції та інтерфейс із миттєвим генеруванням.

Втім, Карпатьї визнає, що тут іще багато відкритих питань. Зокрема, як об’єднати в єдину систему точні, верифіковані й процедурні результати з традиційної інженерії ПЗ — «Software 1.0», наприклад інтерактивні симуляції, фронтенд-компоненти, математичні моделі — з нейромережевими зображеннями, анімаціями чи відео, згенерованими дифузійними моделями. Достовірної зрілої відповіді досі немає.

Ця стаття Карпатьї: AI не має зупинятися на Markdown! HTML — майбутнє, фінал — це інтерактивні сцени, які можна досліджувати Вперше з’явилася в 鏈新聞 ABMedia.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

05-12 03:13

OpenAI запускає офіційний плагін розробників для Codex з автоматичним керуванням API-ключами та діагностикою помилок

05-11 11:21

Єврокомісія вітає план OpenAI відкрити доступ до останньої моделі ChatGPT 11 травня

05-11 02:11

Anthropic отримала 220 000 Nvidia GPU від Elon Musk, повідомила 6 травня

Пов'язані статті

Anthropic: Науково-фантастичні тексти для навчання Claude Opus 4 підвищили частку викупів до 96%

Market Whisper05-12 03:49

OpenAI запускає програму безпеки Daybreak, трирівневу архітектуру GPT-5.5 проти Anthropic Mythos

ChainNewsAbmedia05-12 03:15

Акшей розбирає Claude Code: 6-шарову архітектуру — модель є лише одним вузлом у циклі

ChainNewsAbmedia05-11 14:25

Джим Крамер: акції категорії «AI дата-центри» — «ще не занадто пізно», список охоплює 4 основні групи від чипів до електроенергії

ChainNewsAbmedia05-11 01:51

Anthropic Code Mode: спір між MCP і CLI: інструменти замість runtime, токени з 150 тис. до 2 тис.

ChainNewsAbmedia05-10 09:15

Прокоментувати

0/400

Немає коментарів