Сообщество искусственного интеллекта вовлечено в спор о его будущем и достаточности масштаба для создания учения о Боге.
Автор: Марио Габриеле
Компиляция: Блок единорог
!
Священная война искусственного интеллекта
Я предпочитаю прожить свою жизнь, как будто Бог существует, и только после смерти обнаружить, что Бога нет, чем прожить жизнь, как будто Бога нет, и только после смерти обнаружить, что Бог существует. - Блез Паскаль
Религия - это интересная вещь. Возможно, потому что она совершенно недоказуема в любом направлении, или, быть может, как в моем любимом высказывании: «Вы не можете противостоять чувствам фактами».
Одной из особенностей религиозной веры является то, что в процессе ее возрастания она развивается с удивительной скоростью до такой степени, что практически невозможно сомневаться в существовании Бога. Как можно сомневаться в священном существовании, когда все вокруг все больше верят в это? Когда весь мир перестраивается вокруг одной веры, где еще остается место для ереси? Когда храмы и соборы, законы и нормы устраиваются в соответствии с новым, непоколебимым евангелием, где здесь остается место для противодействия?
Когда религия Авраама впервые появилась и распространилась по всему миру, или буддизм распространился из Индии по всей Азии, огромная энергия веры создала самоусиливающийся цикл. С появлением все большего числа приверженцев и развитием сложных теологических систем и обрядов вокруг этих верований, становится все сложнее задавать вопросы этим основополагающим принципам. В океане легковерия не так просто оказаться еретиком. Величественные церкви, сложные религиозные тексты и процветающие монастыри служат физическим доказательством священного существования.
Но история религии также говорит нам, насколько легко такая структура может разрушиться. По мере распространения христианства на Скандинавский полуостров, древняя северная вера рухнула всего за несколько поколений. Религиозная система древнего Египта длилась тысячелетия, но в конечном итоге исчезла с появлением новой, более долговечной веры и появлением более крупных структур власти. Даже в рамках одной и той же религии мы видим драматическое расколотворение - Реформация разорвала Западное христианство, а Великое расколотворение привело к расколу Восточной и Западной церквей. Эти расколы часто начинались с казалось бы незначительных разногласий в доктринах, и постепенно превращались в совершенно различные системы веры.
Священное Писание
Бог - это метафора, превосходящая все уровни мышления. Это так просто. - Джозеф Кэмпбелл
Проще говоря, вера в Бога - это религия. Возможно, создание Бога тоже ничем не отличается.
С момента своего возникновения оптимистичные исследователи искусственного интеллекта представляли свою работу как богосоздание. Взрывное развитие крупных языковых моделей (LLMs) в последние годы дополнительно укрепило убеждение верующих в то, что мы идем по священному пути.
Он также подтверждает пост, написанный в 2019 году. Хотя люди вне области искусственного интеллекта узнали об этом только недавно, «Горький урок» канадского ученого по компьютерным наукам Ричарда Саттона стал все более важным текстом в сообществе, превращаясь из тайного знания в новые всеобъемлющие основы религии.
Саттон обобщил техническое наблюдение по 1,113 словам (каждая религия нуждается в священных числах): “Самый важный урок из 70-летнего исследования искусственного интеллекта - использование универсальных методов вычислений в конечном итоге является наиболее эффективным и огромным преимуществом”. Прогресс в моделях искусственного интеллекта обусловлен экспоненциальным ростом вычислительных ресурсов, подпитываемых огромной волной закона Мура. В то же время Саттон отмечает, что многие работы в области искусственного интеллекта сосредоточены на оптимизации производительности с помощью специализированных техник - увеличение человеческих знаний или узкоспециализированных инструментов. Хотя эти оптимизации могут быть полезны в краткосрочной перспективе, по мнению Саттона, в конечном итоге они являются временной и ресурсной потерей, подобно попыткам регулировать резину для серфинга или пробовать новый воск, когда наступает огромная волна.
Это основа того, что мы называем «горькой религией». У нее есть только одно заповедь, обычно называемое в сообществе «законом расширения»: вычислительная производительность, ускоряемая экспоненциальным ростом; все остальное - глупость.
Горькая религия распространяется от крупных языковых моделей (LLMs) до мировых моделей, теперь она быстро распространяется через биологию, химию и инкорпорированный интеллект (робототехнику и автономные транспортные средства), которые еще не были преобразованы.
Однако с распространением учения Саттона и определение начало меняться. Это является признаком всех активных и живых религий - дискуссий, расширения, комментариев. «Закон расширения» теперь не означает только расширения вычислений («арк» - это не просто корабль), он теперь относится ко всем методам, направленным на повышение производительности трансформаторов и вычислительных возможностей, включая некоторые хитрости.
!
Сейчас классика охватывает попытки оптимизации каждой части стека искусственного интеллекта, начиная от приемов, применяемых к основной модели (слияние моделей, смешанные эксперты (MoE) и извлечение знаний), и заканчивая созданием синтетических данных для кормления этих вечно голодных богов, проводя при этом множество экспериментов.
Секта боевых действий
Недавно в сообществе искусственного интеллекта возник вопрос, наполненный духом священной войны, о том, является ли «горькая религия» все еще правильной.
!
На этой неделе Гарвардский университет, Стэнфордский университет и Массачусетский технологический институт опубликовали новую статью под названием “Закон расширения точности”, что вызвало этот конфликт. Статья обсуждает завершение выгоды от использования квантовых технологий для увеличения эффективности моделей искусственного интеллекта, которые являются серией технологий, улучшающих производительность моделей искусственного интеллекта и оказывающих большое влияние на экосистему открытого исходного кода. Исследователь-ученый института искусственного интеллекта Аллена Тим Деттмерс в своем посте кратко описал его важность, назвав ее “самой важной статьей за долгое время”. Это продолжение разгорающегося на протяжении нескольких недель диалога и раскрытие заметной тенденции: укрепление двух религий.
!
Генеральный директор OpenAI Сэм Альтман и генеральный директор Anthropic Дарио Амодей принадлежат к одной конфессии. Оба с уверенностью заявляют, что мы достигнем общего искусственного интеллекта (AGI) в ближайшие 2-3 года или около того. И Альтман, и Амодей, возможно, являются двумя фигурами, которые больше всего полагаются на святость «религии горечи». Все их стимулы имеют тенденцию к чрезмерным обещаниям, создавая самый большой ажиотаж для того, чтобы накопить капитал в игре, в которой почти полностью доминирует эффект масштаба. Если Закон Расширения – это не «Альфа против Омеги», начало и конец, начало и конец, то для чего вам нужны 22 миллиарда долларов?
!
Бывший главный ученый OpenAI Илья Суцкевер придерживается других принципов. Он и другие исследователи (включая многих из внутренних сотрудников OpenAI, судя по недавно утечкам информации) считают, что расширение подходит к пределу. Эта группа считает, что для продвижения и введения ИИ общего назначения в реальный мир необходимы новые научные исследования.
Сутскевер правильно указывает на то, что концепция постоянного расширения Альтмана экономически невыгодна. Как спросил исследователь искусственного интеллекта Ноам Браун: “В конце концов, нам действительно нужно обучать модели, которые стоят несколько триллионов или триллиардов долларов?” Это не включает дополнительные расходы на вычислительные затраты на вывод в несколько миллиардов, необходимые для перемещения вычислительных затрат с обучения на вывод.
Но настоящие сторонники очень хорошо знакомы с аргументами противника. Миссионер у вашего дома легко справится с вашими трудностями эгоистичного удовольствия. Для Брауна и Сутскевера сторонники Сутскевера указывают на возможность расширения «времени испытаний». В отличие от ситуации до сих пор, «время испытаний» не улучшается за счет больших вычислений, а скорее использует больше ресурсов для выполнения. Когда модели искусственного интеллекта должны ответить на ваши вопросы или создать кусок кода или текст, они могут предоставить больше времени и вычислений. Это аналог того, чтобы перевести ваше внимание с подготовки по математике на уговорить учителя дать вам еще один час и разрешить взять калькулятор. Для многих в экосистеме это новая граница «горькой религии», поскольку команды переходят от традиционного предварительного обучения к последующему обучению / рассуждению.
Указать недостатки других вероучений, критиковать другие учения, не выставляя на показ свою позицию, это довольно легко. Но какова моя собственная вера? Во-первых, я верю, что эта группа моделей принесет очень высокий возврат инвестиций со временем. Когда люди научатся обходить ограничения и использовать существующие API, мы увидим появление и успешное развитие по-настоящему инновационного опыта использования продуктов. Мы преодолеем стадии имитации и инкрементального развития продуктов искусственного интеллекта. Мы не должны рассматривать его как «общий искусственный интеллект» (AGI), так как эта определение имеет конструктивные проблемы, а скорее считать его «минимально возможным интеллектом», который может быть настроен в соответствии с разными продуктами и сценариями использования.
Что касается достижения искусственного сверхинтеллекта (ASI), здесь требуется больше структуры. Более четкое определение и классификация помогут нам более эффективно обсудить баланс между возможной экономической ценностью и экономическими издержками каждого. Например, ИИ общего уровня может предоставить экономическую ценность для некоторых пользователей (всего лишь для части верующих), в то время как ASI может проявить неудержимые комплексные эффекты и изменить мир, наши верования и социальную структуру. Я не думаю, что расширение трансформаторов будет достаточно для достижения ASI; но, к сожалению, как могут сказать некоторые, это всего лишь моя атеистическая вера.
Потерянная вера
Искусственное интеллекта сообщество не может решить эту священную войну в короткие сроки; в этой борьбе эмоций нет фактических оснований, которые можно предъявить. Напротив, мы должны обратить внимание на то, что сомнения в искусственном интеллекте означают для расширения законов. Потеря веры может вызвать цепную реакцию, превышающую крупные языковые модели (LLM), и влиять на все отрасли и рынки.
Важно отметить, что в большинстве областей искусственного интеллекта и машинного обучения мы не исследовали закон масштабирования; Чудес будет еще больше. Тем не менее, если скептицизм все-таки закрадется, инвесторам и строителям будет сложнее поддерживать одинаково высокий уровень уверенности в конечном состоянии производительности в категориях «ранней кривой», таких как биотехнологии и робототехника. Другими словами, если мы увидим, что большие языковые модели начнут замедляться и отклоняться от выбранного пути, системы убеждений многих основателей и инвесторов в смежных областях рухнут.
Это ли справедливо - это уже другой вопрос.
Существует точка зрения, согласно которой ‘универсальный искусственный интеллект’ естественным образом требует большего масштаба, поэтому ‘качество’ специализированных моделей должно проявляться на более небольшом масштабе, чтобы они не сталкивались с узкими местами перед тем, как обеспечат практическую ценность. Если модель конкретной области принимает только часть данных и, следовательно, требует только часть вычислительных ресурсов для достижения выполнимости, не должно ли у нее быть достаточно места для улучшений? С виду это имеет смысл, но мы раз за разом обнаруживаем, что дело обстоит не так: включение связанных или кажущихся независимыми данных часто способно улучшить производительность кажущихся независимыми моделей. Например, включение данных о программировании, кажется, способствует улучшению более широкой способности рассуждения.
На долгосрочной основе дискуссия о специализированной модели может оказаться несущественной. Любой, кто создает ИИС (искусственный суперинтеллект), вероятно, стремится к созданию сущности, способной к самовоспроизводству и самосовершенствованию, обладающей бесконечной творческой мощью во всех областях. Холден Карнофски, бывший член совета директоров OpenAI и основатель Open Philanthropy, называет такое творение «PASTA» (процесс автоматизации научных и технологических достижений). Исходный план прибыли Сэма Альтмана, кажется, основан на аналогичных принципах: «Создать ИГИ, а затем спросить у него, как получить доход». Это ИИ эсхатологического уровня, это окончательная судьба.
Успех крупных лабораторий искусственного интеллекта, таких как OpenAI и Anthropic, вдохновил поддержку капитальных рынков подобных лабораторий вроде ‘OpenAI в области Х’, их долгосрочная цель - создание ‘AGI’ в пределах своей конкретной отрасли или области. Это декомпозиция масштаба выводит нас из симуляций OpenAI в сторону компаний, ориентированных на продукт - такую возможность я представил на ежегодной конференции Compound в 2023 году.
В отличие от модели конца света, эти компании должны продемонстрировать ряд достижений. Они будут компаниями, основанными на проблемах масштабирования инженерии, а не научных организациях, занимающихся прикладными исследованиями, со всемирной целью создания продукта.
В научной сфере, если вы знаете, что вы делаете, то вам не следует делать это. В инженерной сфере, если вы не знаете, что вы делаете, то вам тоже не следует делать это. - Ричард Хэмминг
Поклонники не слишком склонны потерять свою священную веру в ближайшее время. Как уже упоминалось, с увеличением религиозности они составили сценарий жизни и поклонения, а также набор вдохновляющих методов. Они построили материальные памятники и инфраструктуру, укрепили свою силу и мудрость, и показали, что они «знают, что делают».
В одном из последних интервью Сэм Альтман сказал такое о AGI (точка внимания на нас):
Это первый раз, когда я чувствую, что мы действительно знаем, что делать. Для создания AGI все еще требуется много работы. Мы знаем, что есть некоторые известные неизвестные, но я думаю, что в основном мы знаем, что делать, и это займет время; это будет сложно, но это также очень волнующе.
Пробная версия
Подвергая сомнению «Горькую религию», расширяющий скептик сейчас проводит одно из самых глубоких обсуждений последних лет. Каждый из нас хоть раз задумывался над подобными вещами. Что случится, если мы изобретем Бога? Как быстро появится этот Бог? Что произойдет, если ИИ общего назначения действительно и необратимо взойдет?
Как и со всеми неизвестными и сложными темами, мы скоро сохраняем свои собственные специфические реакции в мозге: некоторые люди отчаиваются от того, что они скоро перестанут иметь значение, большинство ожидают смешение разрушения и процветания, а остальные ожидают, что человечество продолжит заниматься тем, что мы делаем лучше всего, и будет продолжать искать проблемы для решения и решать проблемы, которые мы сами создали, достигая таким образом чистого изобилия.
Любой заинтересованный человек хотел бы предсказать, как будет выглядеть мир для него, если закон расширения справедлив, и ИИ обретет существование в течение нескольких лет. Как будете служить этому новому богу и как этот новый бог будет служить вам?
Но что, если замирание благовестия вытеснит оптимистов? Что, если мы начнем думать, что даже Бог может упасть? В предыдущей статье “FOMO роботов, закон масштаба и технологические прогнозы” я писал:
Иногда я задумываюсь, что произойдет, если закон расширения не сработает, и будет ли это похоже на влияние потери доходов, замедление роста и повышение процентных ставок на многие технологические области. Иногда я также думаю, сработает ли полностью закон расширения, и будет ли это похоже на кривые коммодификации для многих других областей их ранних пионеров и получения ими ценности.
«Польза капитализма заключается в том, что мы, какими бы ни были, потратим много денег, чтобы найти ответы».
Для основателей и инвесторов вопрос становится следующим: что произойдет дальше? Потенциальные кандидаты на роль великих строителей продуктов в каждой отрасли постепенно становятся известными. В каждой отрасли будет еще больше таких людей, но эта история уже началась. Откуда возникают новые возможности?
Если экспансия застопорится, я ожидаю увидеть волну закрытий и слияний. Остальные компании будут все больше смещать свое внимание на инженерию, и мы должны предвидеть эту эволюцию, отслеживая потоки талантов. Мы уже видим некоторые признаки того, что OpenAI движется в этом направлении, поскольку он все больше и больше совершенствуется. Этот сдвиг откроет пространство для следующего поколения стартапов, которые смогут «обгонять в углах», полагаясь на инновационные прикладные исследования и науку, а не на инженерию, чтобы превзойти действующих игроков в их попытках проложить новые пути.
!
Уроки религии
Мой взгляд на технологии заключается в том, что все, что кажется очевидно обладающим эффектом восходящей кривой, обычно не длится долго, а то, что все считают очевидно обладающим эффектом восходящей кривой в бизнесе, странно развивается гораздо медленнее и масштабируется, чем ожидалось.
!
Ранние признаки раскола в религии обычно следуют за предсказуемыми шаблонами, которые можно использовать в качестве рамки для отслеживания эволюции «горькой религии».
Это обычно начинается с появления конкурирующих интерпретаций, будь то по капиталистическим или идеологическим причинам. В раннем христианстве различные точки зрения на божественность Христа и суть Троицы привели к расколу и кардинально различным толкованиям Библии. Помимо раскола, о котором мы уже упоминали в отношении искусственного интеллекта, наблюдаются и другие трещины. Например, некоторые исследователи в области искусственного интеллекта отвергли основополагающую концепцию трансформаторов и обратились к другим архитектурам, таким как модели пространства состояний (State Space Models), Mamba, RWKV, жидкие модели (Liquid Models) и т. д. Хотя это пока только мягкие сигналы, они показывают зарождение еретических идей и готовность пересматривать эту область с точки зрения первоначальных принципов.
С течением времени нетерпеливые высказывания пророка также могут привести к недоверию людей. Когда пророчества религиозных лидеров не сбываются или божественное вмешательство не происходит, как ожидалось, они сеют сомнения.
Движение Миллера пророчило, что Христос вернется в 1844 году, но когда Иисус не пришел по плану, это движение рухнуло. В технологической сфере мы обычно молча погребаем неудачные предсказания и позволяем нашим пророкам продолжать рисовать оптимистичные, долгосрочные версии будущего, несмотря на то, что назначенные сроки постоянно пропускаются (привет, Илон). Однако, если вера в Закон расширения не подкрепляется улучшением производительности исходной модели, она также может столкнуться с подобным крахом.
Коррумпированная, громоздкая или нестабильная религия легко подвергается влиянию отступников. Прогресс реформационного движения, несомненно, обусловлен не только теологическими взглядами Лютера, но и появлением в период упадка и беспорядков католической церкви. Когда основные институты начинают трещать, долгоживущие «еретические» идеи внезапно находят плодородную почву.
В области искусственного интеллекта мы можем обратить внимание на более масштабные модели или альтернативные методы, которые достигают подобных результатов с меньшим вычислительным или данных, например, работы, выполняемые различными китайскими корпорациями и командами с открытым исходным кодом (например, Nous Research). Те, кто преодолевает пределы биологического интеллекта и преодолевает долгие препятствия, которые ранее считались непреодолимыми, также могут создать новую историю.
Самым прямым и актуальным способом отслеживания начала изменений является наблюдение за движением практикующих. До любого официального раскола религиозные ученые и духовенство обычно склонны к еретическим взглядам в частной жизни, но в общественности они ведут себя послушно. Сегодняшнее соответствующее явление может быть связано с некоторыми исследователями в области искусственного интеллекта, которые, кажется, следуют закону расширения, но на самом деле стремятся к совершенно другим методам, ожидая подходящего момента для оспаривания консенсуса или ухода из своей лаборатории в поисках более широкого теоретического пространства.
Одной из проблем, связанных с религией и технологическими догмами, является то, что они часто правы лишь частично, и не в такой степени, как это предполагают самые преданные последователи. Как и религия, которая интегрирует основные истины человечества в свой метафизический каркас, законы расширения ясно описывают реальную ситуацию в области обучения нейронных сетей. Однако вопрос заключается в том, является ли эта реальность полной и неизменной, как это предполагается в настоящее время, а также способны ли эти религиозные организации (лаборатории искусственного интеллекта) быть достаточно гибкими и стратегическими, чтобы возглавить армию энтузиастов. В то же время необходимо создать принтеры знаний (чат-интерфейсы и API), чтобы распространять их знания.
Финал
«Религия истинна в глазах простых людей, ложна в глазах мудрецов и полезна в глазах правителей». – Луций Анней Сенега**
Один из возможно устаревших взглядов на религиозные организации - когда они достигают определенного масштаба, они, как и многие человеческие организации, подвержены мотиву выживания и стремятся выжить в конкурентной борьбе. В процессе они игнорируют мотив истины и величия (которые не являются взаимоисключающими).
Я когда-то написал статью о том, как рынок капитала стал коконом информационной жести, движимой повествованием, а стимулирующие механизмы часто позволяют этим историям продолжаться. Консенсус закона расширения дает нехорошее ощущение похожести - корневой убежденности в вероучении, которое математически элегантно и крайне полезно для координации развертывания крупномасштабного капитала. Как многие религиозные каркасы, он может быть более ценен как координационный механизм, чем как основная истина.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Горькая религия: священная война, развивающаяся вокруг закона расширения искусственного интеллекта
Автор: Марио Габриеле
Компиляция: Блок единорог
!
Священная война искусственного интеллекта
Я предпочитаю прожить свою жизнь, как будто Бог существует, и только после смерти обнаружить, что Бога нет, чем прожить жизнь, как будто Бога нет, и только после смерти обнаружить, что Бог существует. - Блез Паскаль
Религия - это интересная вещь. Возможно, потому что она совершенно недоказуема в любом направлении, или, быть может, как в моем любимом высказывании: «Вы не можете противостоять чувствам фактами».
Одной из особенностей религиозной веры является то, что в процессе ее возрастания она развивается с удивительной скоростью до такой степени, что практически невозможно сомневаться в существовании Бога. Как можно сомневаться в священном существовании, когда все вокруг все больше верят в это? Когда весь мир перестраивается вокруг одной веры, где еще остается место для ереси? Когда храмы и соборы, законы и нормы устраиваются в соответствии с новым, непоколебимым евангелием, где здесь остается место для противодействия?
Когда религия Авраама впервые появилась и распространилась по всему миру, или буддизм распространился из Индии по всей Азии, огромная энергия веры создала самоусиливающийся цикл. С появлением все большего числа приверженцев и развитием сложных теологических систем и обрядов вокруг этих верований, становится все сложнее задавать вопросы этим основополагающим принципам. В океане легковерия не так просто оказаться еретиком. Величественные церкви, сложные религиозные тексты и процветающие монастыри служат физическим доказательством священного существования.
Но история религии также говорит нам, насколько легко такая структура может разрушиться. По мере распространения христианства на Скандинавский полуостров, древняя северная вера рухнула всего за несколько поколений. Религиозная система древнего Египта длилась тысячелетия, но в конечном итоге исчезла с появлением новой, более долговечной веры и появлением более крупных структур власти. Даже в рамках одной и той же религии мы видим драматическое расколотворение - Реформация разорвала Западное христианство, а Великое расколотворение привело к расколу Восточной и Западной церквей. Эти расколы часто начинались с казалось бы незначительных разногласий в доктринах, и постепенно превращались в совершенно различные системы веры.
Священное Писание
Бог - это метафора, превосходящая все уровни мышления. Это так просто. - Джозеф Кэмпбелл
Проще говоря, вера в Бога - это религия. Возможно, создание Бога тоже ничем не отличается.
С момента своего возникновения оптимистичные исследователи искусственного интеллекта представляли свою работу как богосоздание. Взрывное развитие крупных языковых моделей (LLMs) в последние годы дополнительно укрепило убеждение верующих в то, что мы идем по священному пути.
Он также подтверждает пост, написанный в 2019 году. Хотя люди вне области искусственного интеллекта узнали об этом только недавно, «Горький урок» канадского ученого по компьютерным наукам Ричарда Саттона стал все более важным текстом в сообществе, превращаясь из тайного знания в новые всеобъемлющие основы религии.
Саттон обобщил техническое наблюдение по 1,113 словам (каждая религия нуждается в священных числах): “Самый важный урок из 70-летнего исследования искусственного интеллекта - использование универсальных методов вычислений в конечном итоге является наиболее эффективным и огромным преимуществом”. Прогресс в моделях искусственного интеллекта обусловлен экспоненциальным ростом вычислительных ресурсов, подпитываемых огромной волной закона Мура. В то же время Саттон отмечает, что многие работы в области искусственного интеллекта сосредоточены на оптимизации производительности с помощью специализированных техник - увеличение человеческих знаний или узкоспециализированных инструментов. Хотя эти оптимизации могут быть полезны в краткосрочной перспективе, по мнению Саттона, в конечном итоге они являются временной и ресурсной потерей, подобно попыткам регулировать резину для серфинга или пробовать новый воск, когда наступает огромная волна.
Это основа того, что мы называем «горькой религией». У нее есть только одно заповедь, обычно называемое в сообществе «законом расширения»: вычислительная производительность, ускоряемая экспоненциальным ростом; все остальное - глупость.
Горькая религия распространяется от крупных языковых моделей (LLMs) до мировых моделей, теперь она быстро распространяется через биологию, химию и инкорпорированный интеллект (робототехнику и автономные транспортные средства), которые еще не были преобразованы.
Однако с распространением учения Саттона и определение начало меняться. Это является признаком всех активных и живых религий - дискуссий, расширения, комментариев. «Закон расширения» теперь не означает только расширения вычислений («арк» - это не просто корабль), он теперь относится ко всем методам, направленным на повышение производительности трансформаторов и вычислительных возможностей, включая некоторые хитрости.
!
Сейчас классика охватывает попытки оптимизации каждой части стека искусственного интеллекта, начиная от приемов, применяемых к основной модели (слияние моделей, смешанные эксперты (MoE) и извлечение знаний), и заканчивая созданием синтетических данных для кормления этих вечно голодных богов, проводя при этом множество экспериментов.
Секта боевых действий
Недавно в сообществе искусственного интеллекта возник вопрос, наполненный духом священной войны, о том, является ли «горькая религия» все еще правильной.
!
На этой неделе Гарвардский университет, Стэнфордский университет и Массачусетский технологический институт опубликовали новую статью под названием “Закон расширения точности”, что вызвало этот конфликт. Статья обсуждает завершение выгоды от использования квантовых технологий для увеличения эффективности моделей искусственного интеллекта, которые являются серией технологий, улучшающих производительность моделей искусственного интеллекта и оказывающих большое влияние на экосистему открытого исходного кода. Исследователь-ученый института искусственного интеллекта Аллена Тим Деттмерс в своем посте кратко описал его важность, назвав ее “самой важной статьей за долгое время”. Это продолжение разгорающегося на протяжении нескольких недель диалога и раскрытие заметной тенденции: укрепление двух религий.
!
Генеральный директор OpenAI Сэм Альтман и генеральный директор Anthropic Дарио Амодей принадлежат к одной конфессии. Оба с уверенностью заявляют, что мы достигнем общего искусственного интеллекта (AGI) в ближайшие 2-3 года или около того. И Альтман, и Амодей, возможно, являются двумя фигурами, которые больше всего полагаются на святость «религии горечи». Все их стимулы имеют тенденцию к чрезмерным обещаниям, создавая самый большой ажиотаж для того, чтобы накопить капитал в игре, в которой почти полностью доминирует эффект масштаба. Если Закон Расширения – это не «Альфа против Омеги», начало и конец, начало и конец, то для чего вам нужны 22 миллиарда долларов?
!
Бывший главный ученый OpenAI Илья Суцкевер придерживается других принципов. Он и другие исследователи (включая многих из внутренних сотрудников OpenAI, судя по недавно утечкам информации) считают, что расширение подходит к пределу. Эта группа считает, что для продвижения и введения ИИ общего назначения в реальный мир необходимы новые научные исследования.
Сутскевер правильно указывает на то, что концепция постоянного расширения Альтмана экономически невыгодна. Как спросил исследователь искусственного интеллекта Ноам Браун: “В конце концов, нам действительно нужно обучать модели, которые стоят несколько триллионов или триллиардов долларов?” Это не включает дополнительные расходы на вычислительные затраты на вывод в несколько миллиардов, необходимые для перемещения вычислительных затрат с обучения на вывод.
Но настоящие сторонники очень хорошо знакомы с аргументами противника. Миссионер у вашего дома легко справится с вашими трудностями эгоистичного удовольствия. Для Брауна и Сутскевера сторонники Сутскевера указывают на возможность расширения «времени испытаний». В отличие от ситуации до сих пор, «время испытаний» не улучшается за счет больших вычислений, а скорее использует больше ресурсов для выполнения. Когда модели искусственного интеллекта должны ответить на ваши вопросы или создать кусок кода или текст, они могут предоставить больше времени и вычислений. Это аналог того, чтобы перевести ваше внимание с подготовки по математике на уговорить учителя дать вам еще один час и разрешить взять калькулятор. Для многих в экосистеме это новая граница «горькой религии», поскольку команды переходят от традиционного предварительного обучения к последующему обучению / рассуждению.
Указать недостатки других вероучений, критиковать другие учения, не выставляя на показ свою позицию, это довольно легко. Но какова моя собственная вера? Во-первых, я верю, что эта группа моделей принесет очень высокий возврат инвестиций со временем. Когда люди научатся обходить ограничения и использовать существующие API, мы увидим появление и успешное развитие по-настоящему инновационного опыта использования продуктов. Мы преодолеем стадии имитации и инкрементального развития продуктов искусственного интеллекта. Мы не должны рассматривать его как «общий искусственный интеллект» (AGI), так как эта определение имеет конструктивные проблемы, а скорее считать его «минимально возможным интеллектом», который может быть настроен в соответствии с разными продуктами и сценариями использования.
Что касается достижения искусственного сверхинтеллекта (ASI), здесь требуется больше структуры. Более четкое определение и классификация помогут нам более эффективно обсудить баланс между возможной экономической ценностью и экономическими издержками каждого. Например, ИИ общего уровня может предоставить экономическую ценность для некоторых пользователей (всего лишь для части верующих), в то время как ASI может проявить неудержимые комплексные эффекты и изменить мир, наши верования и социальную структуру. Я не думаю, что расширение трансформаторов будет достаточно для достижения ASI; но, к сожалению, как могут сказать некоторые, это всего лишь моя атеистическая вера.
Потерянная вера
Искусственное интеллекта сообщество не может решить эту священную войну в короткие сроки; в этой борьбе эмоций нет фактических оснований, которые можно предъявить. Напротив, мы должны обратить внимание на то, что сомнения в искусственном интеллекте означают для расширения законов. Потеря веры может вызвать цепную реакцию, превышающую крупные языковые модели (LLM), и влиять на все отрасли и рынки.
Важно отметить, что в большинстве областей искусственного интеллекта и машинного обучения мы не исследовали закон масштабирования; Чудес будет еще больше. Тем не менее, если скептицизм все-таки закрадется, инвесторам и строителям будет сложнее поддерживать одинаково высокий уровень уверенности в конечном состоянии производительности в категориях «ранней кривой», таких как биотехнологии и робототехника. Другими словами, если мы увидим, что большие языковые модели начнут замедляться и отклоняться от выбранного пути, системы убеждений многих основателей и инвесторов в смежных областях рухнут.
Это ли справедливо - это уже другой вопрос.
Существует точка зрения, согласно которой ‘универсальный искусственный интеллект’ естественным образом требует большего масштаба, поэтому ‘качество’ специализированных моделей должно проявляться на более небольшом масштабе, чтобы они не сталкивались с узкими местами перед тем, как обеспечат практическую ценность. Если модель конкретной области принимает только часть данных и, следовательно, требует только часть вычислительных ресурсов для достижения выполнимости, не должно ли у нее быть достаточно места для улучшений? С виду это имеет смысл, но мы раз за разом обнаруживаем, что дело обстоит не так: включение связанных или кажущихся независимыми данных часто способно улучшить производительность кажущихся независимыми моделей. Например, включение данных о программировании, кажется, способствует улучшению более широкой способности рассуждения.
На долгосрочной основе дискуссия о специализированной модели может оказаться несущественной. Любой, кто создает ИИС (искусственный суперинтеллект), вероятно, стремится к созданию сущности, способной к самовоспроизводству и самосовершенствованию, обладающей бесконечной творческой мощью во всех областях. Холден Карнофски, бывший член совета директоров OpenAI и основатель Open Philanthropy, называет такое творение «PASTA» (процесс автоматизации научных и технологических достижений). Исходный план прибыли Сэма Альтмана, кажется, основан на аналогичных принципах: «Создать ИГИ, а затем спросить у него, как получить доход». Это ИИ эсхатологического уровня, это окончательная судьба.
Успех крупных лабораторий искусственного интеллекта, таких как OpenAI и Anthropic, вдохновил поддержку капитальных рынков подобных лабораторий вроде ‘OpenAI в области Х’, их долгосрочная цель - создание ‘AGI’ в пределах своей конкретной отрасли или области. Это декомпозиция масштаба выводит нас из симуляций OpenAI в сторону компаний, ориентированных на продукт - такую возможность я представил на ежегодной конференции Compound в 2023 году.
В отличие от модели конца света, эти компании должны продемонстрировать ряд достижений. Они будут компаниями, основанными на проблемах масштабирования инженерии, а не научных организациях, занимающихся прикладными исследованиями, со всемирной целью создания продукта.
В научной сфере, если вы знаете, что вы делаете, то вам не следует делать это. В инженерной сфере, если вы не знаете, что вы делаете, то вам тоже не следует делать это. - Ричард Хэмминг
Поклонники не слишком склонны потерять свою священную веру в ближайшее время. Как уже упоминалось, с увеличением религиозности они составили сценарий жизни и поклонения, а также набор вдохновляющих методов. Они построили материальные памятники и инфраструктуру, укрепили свою силу и мудрость, и показали, что они «знают, что делают».
В одном из последних интервью Сэм Альтман сказал такое о AGI (точка внимания на нас):
Это первый раз, когда я чувствую, что мы действительно знаем, что делать. Для создания AGI все еще требуется много работы. Мы знаем, что есть некоторые известные неизвестные, но я думаю, что в основном мы знаем, что делать, и это займет время; это будет сложно, но это также очень волнующе.
Пробная версия
Подвергая сомнению «Горькую религию», расширяющий скептик сейчас проводит одно из самых глубоких обсуждений последних лет. Каждый из нас хоть раз задумывался над подобными вещами. Что случится, если мы изобретем Бога? Как быстро появится этот Бог? Что произойдет, если ИИ общего назначения действительно и необратимо взойдет?
Как и со всеми неизвестными и сложными темами, мы скоро сохраняем свои собственные специфические реакции в мозге: некоторые люди отчаиваются от того, что они скоро перестанут иметь значение, большинство ожидают смешение разрушения и процветания, а остальные ожидают, что человечество продолжит заниматься тем, что мы делаем лучше всего, и будет продолжать искать проблемы для решения и решать проблемы, которые мы сами создали, достигая таким образом чистого изобилия.
Любой заинтересованный человек хотел бы предсказать, как будет выглядеть мир для него, если закон расширения справедлив, и ИИ обретет существование в течение нескольких лет. Как будете служить этому новому богу и как этот новый бог будет служить вам?
Но что, если замирание благовестия вытеснит оптимистов? Что, если мы начнем думать, что даже Бог может упасть? В предыдущей статье “FOMO роботов, закон масштаба и технологические прогнозы” я писал:
Иногда я задумываюсь, что произойдет, если закон расширения не сработает, и будет ли это похоже на влияние потери доходов, замедление роста и повышение процентных ставок на многие технологические области. Иногда я также думаю, сработает ли полностью закон расширения, и будет ли это похоже на кривые коммодификации для многих других областей их ранних пионеров и получения ими ценности.
«Польза капитализма заключается в том, что мы, какими бы ни были, потратим много денег, чтобы найти ответы».
Для основателей и инвесторов вопрос становится следующим: что произойдет дальше? Потенциальные кандидаты на роль великих строителей продуктов в каждой отрасли постепенно становятся известными. В каждой отрасли будет еще больше таких людей, но эта история уже началась. Откуда возникают новые возможности?
Если экспансия застопорится, я ожидаю увидеть волну закрытий и слияний. Остальные компании будут все больше смещать свое внимание на инженерию, и мы должны предвидеть эту эволюцию, отслеживая потоки талантов. Мы уже видим некоторые признаки того, что OpenAI движется в этом направлении, поскольку он все больше и больше совершенствуется. Этот сдвиг откроет пространство для следующего поколения стартапов, которые смогут «обгонять в углах», полагаясь на инновационные прикладные исследования и науку, а не на инженерию, чтобы превзойти действующих игроков в их попытках проложить новые пути.
!
Уроки религии
Мой взгляд на технологии заключается в том, что все, что кажется очевидно обладающим эффектом восходящей кривой, обычно не длится долго, а то, что все считают очевидно обладающим эффектом восходящей кривой в бизнесе, странно развивается гораздо медленнее и масштабируется, чем ожидалось.
!
Ранние признаки раскола в религии обычно следуют за предсказуемыми шаблонами, которые можно использовать в качестве рамки для отслеживания эволюции «горькой религии».
Это обычно начинается с появления конкурирующих интерпретаций, будь то по капиталистическим или идеологическим причинам. В раннем христианстве различные точки зрения на божественность Христа и суть Троицы привели к расколу и кардинально различным толкованиям Библии. Помимо раскола, о котором мы уже упоминали в отношении искусственного интеллекта, наблюдаются и другие трещины. Например, некоторые исследователи в области искусственного интеллекта отвергли основополагающую концепцию трансформаторов и обратились к другим архитектурам, таким как модели пространства состояний (State Space Models), Mamba, RWKV, жидкие модели (Liquid Models) и т. д. Хотя это пока только мягкие сигналы, они показывают зарождение еретических идей и готовность пересматривать эту область с точки зрения первоначальных принципов.
С течением времени нетерпеливые высказывания пророка также могут привести к недоверию людей. Когда пророчества религиозных лидеров не сбываются или божественное вмешательство не происходит, как ожидалось, они сеют сомнения.
Движение Миллера пророчило, что Христос вернется в 1844 году, но когда Иисус не пришел по плану, это движение рухнуло. В технологической сфере мы обычно молча погребаем неудачные предсказания и позволяем нашим пророкам продолжать рисовать оптимистичные, долгосрочные версии будущего, несмотря на то, что назначенные сроки постоянно пропускаются (привет, Илон). Однако, если вера в Закон расширения не подкрепляется улучшением производительности исходной модели, она также может столкнуться с подобным крахом.
Коррумпированная, громоздкая или нестабильная религия легко подвергается влиянию отступников. Прогресс реформационного движения, несомненно, обусловлен не только теологическими взглядами Лютера, но и появлением в период упадка и беспорядков католической церкви. Когда основные институты начинают трещать, долгоживущие «еретические» идеи внезапно находят плодородную почву.
В области искусственного интеллекта мы можем обратить внимание на более масштабные модели или альтернативные методы, которые достигают подобных результатов с меньшим вычислительным или данных, например, работы, выполняемые различными китайскими корпорациями и командами с открытым исходным кодом (например, Nous Research). Те, кто преодолевает пределы биологического интеллекта и преодолевает долгие препятствия, которые ранее считались непреодолимыми, также могут создать новую историю.
Самым прямым и актуальным способом отслеживания начала изменений является наблюдение за движением практикующих. До любого официального раскола религиозные ученые и духовенство обычно склонны к еретическим взглядам в частной жизни, но в общественности они ведут себя послушно. Сегодняшнее соответствующее явление может быть связано с некоторыми исследователями в области искусственного интеллекта, которые, кажется, следуют закону расширения, но на самом деле стремятся к совершенно другим методам, ожидая подходящего момента для оспаривания консенсуса или ухода из своей лаборатории в поисках более широкого теоретического пространства.
Одной из проблем, связанных с религией и технологическими догмами, является то, что они часто правы лишь частично, и не в такой степени, как это предполагают самые преданные последователи. Как и религия, которая интегрирует основные истины человечества в свой метафизический каркас, законы расширения ясно описывают реальную ситуацию в области обучения нейронных сетей. Однако вопрос заключается в том, является ли эта реальность полной и неизменной, как это предполагается в настоящее время, а также способны ли эти религиозные организации (лаборатории искусственного интеллекта) быть достаточно гибкими и стратегическими, чтобы возглавить армию энтузиастов. В то же время необходимо создать принтеры знаний (чат-интерфейсы и API), чтобы распространять их знания.
Финал
«Религия истинна в глазах простых людей, ложна в глазах мудрецов и полезна в глазах правителей». – Луций Анней Сенега**
Один из возможно устаревших взглядов на религиозные организации - когда они достигают определенного масштаба, они, как и многие человеческие организации, подвержены мотиву выживания и стремятся выжить в конкурентной борьбе. В процессе они игнорируют мотив истины и величия (которые не являются взаимоисключающими).
Я когда-то написал статью о том, как рынок капитала стал коконом информационной жести, движимой повествованием, а стимулирующие механизмы часто позволяют этим историям продолжаться. Консенсус закона расширения дает нехорошее ощущение похожести - корневой убежденности в вероучении, которое математически элегантно и крайне полезно для координации развертывания крупномасштабного капитала. Как многие религиозные каркасы, он может быть более ценен как координационный механизм, чем как основная истина.