今週、ハーバード大学、スタンフォード大学、およびマサチューセッツ工科大学は、『精度の拡張法則』という新しい論文を発表し、この論争を引き起こしました。この論文では、量子化技術の効率の向上について議論されており、量子化は人工知能モデルの性能向上に役立ち、オープンソースエコシステムに大きな利益をもたらす技術です。Allen Institute for Artificial Intelligenceの研究科学者であるTim Dettmersは、その重要性を以下の投稿で概説し、これまでで「最も重要な論文の一つ」と評しています。これは、最近の議論の継続であり、注目すべきトレンドを明らかにしています:2つの宗教のますます強固な結束。
それは通常、競合する説明が現れることから始まります、それが資本主義的またはイデオロギー的な理由からであろうとも。初期のキリスト教では、キリストの神性や三位一体の本質に関する異なる見解が分裂を引き起こし、まったく異なる聖書の解釈が生まれました。 AIの分裂に言及した以外にも、他にも現れつつある亀裂があります。例えば、一部のAI研究者はトランスフォーマーの中核的な正統派の考え方を拒否し、State Space Models、Mamba、RWKV、Liquid Modelsなどの他のアーキテクチャに向かっています。これらはまだソフトサインに過ぎませんが、異端の思想の萌芽を示し、この分野を基本原則から再考する意欲を表しています。
苦い宗教:膨張の法則をめぐるAIの聖戦
文:マリオ・ガブリエレ
翻訳:ブロックユニコーン
!
人工知能によるジハード
私は一生を神様のように過ごして、死んで初めて神様が存在しないことに気付くよりも、神様の存在しないように過ごして、死んで初めて神様が存在することに気付く方が良いと思う。- ブレーズ・パスカル
宗教は興味深いものです。それはどの方向でも完全に証明できないからかもしれませんし、私のお気に入りの言葉のように、「事実で感情に立ち向かうことはできない」からかもしれません。
宗教の特徴は、信仰が高まるにつれて信仰が信じられない速さで成長し、神の存在を疑うことがほぼ不可能であることです。周囲の人々がますますそれを信じるようになると、神聖な存在を疑うことはできません。教義が再編成されると、異端の立場はどこにもありません。寺院や大聖堂、法律や規範が新しい、揺るぎない福音に従って配置されると、反対の余地はどこにもありません。
アブラハム宗教が最初に登場し、大陸全体に広まったとき、または仏教がインドからアジア全体に広まったとき、信仰の大きな力が自己強化のサイクルを生み出しました。多くの人々が改宗し、これらの信仰を中心に複雑な神学体系と儀式を築いたことで、これらの基本的な前提を疑問視することはますます困難になっていきました。信じることが容易な環境の中で異端になることは簡単ではありません。壮大な教会、複雑な宗教経典、そして繁栄する修道院は、神聖な存在の物理的な証拠として存在しています。
しかし、宗教の歴史は、このような構造がどれほど簡単に崩壊するかを私たちに教えてくれます。キリスト教がスカンディナヴィア半島に広がると、古代の北欧の信仰はわずか数世代で崩壊しました。古代エジプトの宗教体系は何千年も続き、最終的には新しい、より持続可能な信仰が台頭し、より大きな権力構造が現れると消えてしまいました。同じ宗教の中でも、劇的な分裂が見られます - 宗教改革が西方キリスト教を引き裂き、大いなる分裂は東西教会の分裂をもたらしました。これらの分裂は、些細な教義の相違から始まり、徐々にまったく異なる信仰体系に発展していきます。
聖なる写本
神はすべての知的思考レベルを超越した隠喩である。それだけのことです。-ジョセフ・キャンベル
簡単に言えば、神を信じることは宗教です。神を創造することも同じです。
誕生以来、楽観的なAI研究者たちは、自分たちの仕事を神の創造と想像してきました。過去数年間、大規模な言語モデル(LLMs)の爆発的な発展は、信者たちの信念を一層強め、私たちは神聖な道を歩んでいると考えています。
それは、2019年に書かれたブログ記事を証明するものでもあります。人工知能の領域外の人々には最近まで知られていませんでしたが、カナダのコンピュータ科学者リチャード・サットンの「苦い教訓」は、秘密の知識から徐々に新しい、万能的な宗教的基盤に発展してきました。
1,113文字(すべての宗教には神聖な数字が必要です)で、サットンは技術の観察をまとめました。「人工知能の研究70年間から得られた最大の教訓は、計算の一般的な方法を利用することが最終的に最も効果的であり、そして大きな利点をもたらすということです。」人工知能モデルの進歩は、指数関数的に増加する計算リソースと、モールの法則に乗る大きな波によって促進されています。同時に、サットンは、人工知能の研究では、多くの仕事がパフォーマンスを最適化するための特定のテクニックに集中していると指摘しています。これらの最適化は、短期的には役立つかもしれませんが、サットンにとっては時間とリソースの浪費であり、まるで巨大な波がやってくる時にサーフボードのフィンを調整したり新しいワックスを試したりしているようなものです。
これが私たちが「苦い宗教」と呼んでいるものの基礎です。それにはただ1つの戒律があり、コミュニティでは通常「拡張の法則」と呼ばれています:指数関数の成長によって計算能力が推進されるべきであり、それ以外は愚かなものです。
苦い宗教は、大型言語モデル(LLM)からワールドモデルに拡張され、今では未転換の聖域である生物学、化学、具体的知能(ロボット工学と自動運転車)を通じて急速に広がっています。
しかし、サトンの教えの広まりとともに、定義も変化し始めました。これはすべての活発で活気に満ちた宗教の特徴です-討論、拡張、注釈。 「拡張原則」はもはや計算の拡張を意味するだけではありません(ノアの箱舟は単なる船ではありません)。それは今やトランスフォーマーや計算パフォーマンスを向上させるためのさまざまな方法を指し、いくつかのテクニックも含まれています。
!
現在、クラシックはAIスタックの各部分を最適化するために試されてきました。モデル自体に適用されるテクニック(モデルのマージ、エキスパートの混合(MoE)、知識の抽出)から、これらの常に空腹な神々に餌を与えるための合成データの生成まで、さまざまな実験が行われています。
交戦中の宗派
最近、人工知能コミュニティで巻き起こった聖戦のような問題は、「苦い宗教」がまだ正しいかどうかです。
!
今週、ハーバード大学、スタンフォード大学、およびマサチューセッツ工科大学は、『精度の拡張法則』という新しい論文を発表し、この論争を引き起こしました。この論文では、量子化技術の効率の向上について議論されており、量子化は人工知能モデルの性能向上に役立ち、オープンソースエコシステムに大きな利益をもたらす技術です。Allen Institute for Artificial Intelligenceの研究科学者であるTim Dettmersは、その重要性を以下の投稿で概説し、これまでで「最も重要な論文の一つ」と評しています。これは、最近の議論の継続であり、注目すべきトレンドを明らかにしています:2つの宗教のますます強固な結束。
!
OpenAIのCEOであるSam AltmanとAnthropicのCEOであるDario Amodeiは、同じ教派に属しています。 2〜3年以内に一般的な人工知能(AGI)を実現すると自信を持って述べています。AltmanとAmodeiは、「苦い宗教」の神聖性に最も依存していると言えるでしょう。彼らのすべての動機付け措置は、過度な約束をすることで、このほぼ完全に規模の経済に支配されたゲームで資本を蓄積することを意図しています。「アルファとオメガ」が拡張規則でなければ、最初で最後、始まりで終わりでなければ、あなたは何をするために220億ドルを必要としますか?
!
前OpenAIの元チーフサイエンティストであるIlya Sutskeverは、異なる一連の原則を主張しています。彼は、他の研究者たち(最近のリーク情報によると、OpenAI内の多くの研究者も含まれます)とともに、拡張が限界に近づいていると考えています。このグループは、進歩を維持し、AGIを現実世界にもたらすために、新しい科学と研究が必要だと信じています。
Sutskeverは理にかなってAltmanは経済的に実現不可能な拡張の考えを示しています。人工知能研究者のNoam Brownが尋ねたように、「本当に何千億ドルまたは何兆ドルものモデルを訓練する必要がありますか?」これには推論計算に必要な数十億ドルの追加推論計算支出が含まれていません。
しかし、真の信者は相手の議論に非常に精通しています。あなたの玄関先の宣教師は、あなたの享楽主義の三つのジレンマに簡単に対処できます。BrownとSutskeverは、「テスト時計算」の拡張の可能性を指摘しています。これまでの場合とは異なり、「テスト時計算」は、トレーニングを改善するためにより大きな計算に頼るのではなく、実行により多くのリソースを割り当てます。人工知能モデルがあなたの質問に答えたり、コードやテキストを生成する必要がある場合、それはより多くの時間と計算を提供できます。これは、数学の勉強から教師にもう1時間与えて計算機を使うことを説得することに注意を向けることに相当します。多くの人々にとって、これは「苦い宗教」の新しいフロンティアであり、チームは正統な事前トレーニングから後のトレーニング/推論の方法に移行しています。
他の信念体系の欠陥を指摘し、他の教義を批判することで、自分の立場を明らかにしないことは非常に簡単です。では、私自身の信念は何でしょうか?まず、私は現在のモデルが時間の経過とともに非常に高い投資利益をもたらすと信じています。制約を回避し、既存のAPIを活用する方法を学ぶことで、本当の革新的な製品体験が現れ、成功を収めることができるでしょう。私たちは人工知能製品の模倣と増分の段階を超えるでしょう。それを「汎用人工知能」(AGI)と見なすべきではなく、さまざまな製品や使用シナリオに合わせてカスタマイズできる「最小限の利用可能な知能」と見なすべきです。
超級人工知能(ASI)を実現するには、より多くの構造が必要です。より明確な定義と区分は、それぞれがもたらす経済的価値と経済的コストのトレードオフを効果的に議論するのに役立ちます。例えば、AGIは一部のユーザーに経済的価値を提供するかもしれませんが(それは一部の信仰体系に過ぎません)、ASIは抑えられない複合効果を示し、世界、信仰体系、社会構造を変える可能性があります。私は変圧器の拡張だけではASIを実現できないと思っていますが、残念ながら、それは私の無神論の信念にすぎません。
失われた信念
人工知能コミュニティはこの聖戦を短期間で解決することはできません。この感情の争いには、提示できる事実的根拠がありません。それどころか、人工知能が拡張の法則への信仰を疑問視することに焦点を当てるべきです。信仰の喪失は連鎖反応を引き起こし、大規模言語モデル(LLM)を超えて、あらゆる産業や市場に影響を与える可能性があります。
人工知能/機械学習のほとんどの分野では、拡張法則を徹底的に探求していないことを強調しなければなりません。将来、さらなる奇跡が起こるでしょう。しかし、疑念が静かに現れ始めた場合、生物技術やロボットなどの「曲線初期」カテゴリの究極のパフォーマンス状態に対する投資家や建設者の信頼を維持することはさらに困難になるでしょう。言い換えれば、大規模な言語モデルが遅れを見せ、選択された道筋から外れ始めると、多くの創業者や投資家の信念体系が隣接する領域で崩壊するでしょう。
これが公平かどうかは別の問題です。
「汎用人工知能」に関しては、より大規模なものが必要であるという見方があります。そのため、専門化されたモデルの「品質」は、より小規模なスケールで示される必要があり、実際の価値を提供する前にボトルネックに遭遇することがないようにする必要があります。特定の領域のモデルが一部のデータしか取り込まない場合、それに対応する計算リソースも一部しか必要としないため、改善の余地があると思われますが、私たちは何度も見てきましたが、重要なのはそれだけではありません。関連するか、関連しないように見えるデータを含めると、関連しないように見えるモデルのパフォーマンスを向上させることができます。たとえば、プログラミングデータを含めることで、より広範な推論能力を向上させることができます。
長期的な視点では、専門化モデルに関する議論は重要ではないかもしれません。 ASI(スーパー人工知能)を構築する人々の最終目標は、あらゆる領域で無限の創造力を発揮できる、自己複製・自己改善のエンティティである可能性が高いです。 Holden Karnofsky氏、前OpenAI理事会メンバーおよびOpen Philanthropyの創設者は、このような創造物を「PASTA」(自動化科学と技術進歩のプロセス)と呼んでいます。 Sam Altman氏の元の利益計画も同様の原則に依存しているようです。「AGIを構築し、それがどのように収益を上げるかを尋ねる」というのは、人工知能の最終的な運命である末日論です。
OpenAI や Anthropic などの大規模 AI 研究所の成功は、資本市場が「X 領域の OpenAI」研究所を支援することに熱心になるきっかけとなりました。これらの研究所の長期目標は、特定の業界や領域に焦点を当てて「AGI」を構築することです。このようなスケールダウンされた推論は、パラダイムの転換をもたらし、OpenAI のシミュレーションから離れ、製品を中心とした企業に移行します。これについては、私が Compound の2023年の年次総会で提案しました。
終末論のモデルとは異なり、これらの企業は一連の進展を示さなければなりません。それらは規模のエンジニアリング問題に基づいて構築された企業であり、科学組織が応用研究を行うのではなく、最終目標は製品の構築です。
科学の領域では、自分が何をしているか分かっているなら、それをするべきではありません。エンジニアリングの領域では、自分が何をしているか分からないなら、それもするべきではありません。-リチャード·ハミング
信者が短期的に神聖な信仰を失うことはまずありません。 前述したように、宗教が増殖するにつれて、彼らは人生と崇拝のための一連の台本と一連のヒューリスティックを成文化しました。 彼らは実体の記念碑やインフラを建設し、権力と知性を強化し、「自分たちが何をしているのかを知っている」ことを示します。
最近のインタビューで、Sam Altman は AGI について次のように述べました(重要なのは私たちです):
これは初めて、私たちは本当に何をすべきかを知っていると感じました。AGIを構築するにはまだ多くの作業が必要です。私たちはいくつかの既知の未知数があることを知っていますが、基本的に何をすべきかはわかっています。時間がかかるかもしれませんが、これは困難ですが非常にエキサイティングでもあります。
トライアル
『苦い宗教』に疑問を投げかけることで、拡張的な疑い論者は過去数年間で最も深い議論の一つを解決しようとしています。私たちの誰もが、ある形式でこのような考えをしたことがあります。もし私たちが神を創造したら、どうなるでしょうか?その神はどれくらい早く現れるでしょうか?もしAGI(人類普遍的人工知能)が本当に、不可逆的に台頭したら、どうなるでしょうか?
未知かつ複雑なトピックのように、私たちはすぐに特定の反応を脳に記憶します:一部の人々はそれらが間もなく無関係になると絶望する一方、ほとんどの人々は破滅と繁栄の混合になると予想し、最後の一部の人々は人類が私たちが最も得意とすることをすると予想し、解決すべき問題を見つけ続け、私たち自身が作り出した問題を解決することで、純粋な豊かさを実現するでしょう。
利害関係のある人々は、拡張定律が成立し、AGIが数年以内に到来した場合、世界がどのようなものになるかを予測したいと願っています。新しい神にどのように仕え、新しい神があなたにどのように仕えるのか、どうでしょうか?
しかし、停滞した福音が楽観主義者を追い出したら、どうすればいいですか?もし、神さえ衰退するかもしれないと考え始めたら、どうすればいいですか?以前の記事「ロボットのFOMO、スケールの法則、そして技術予測」で、私は書いています:
私は時々、拡張定理が成り立たない場合に何が起こるのか、それが所得の減少、成長の鈍化、金利の上昇など、多くの技術領域にどのような影響を与えるかを考えます。また、時々、拡張定理が完全に成り立つのか、他の多くの領域の先駆者とその価値の取得の商品化曲線とは似ているのかを考えます。
「資本主義の利点は、どのような場合でも答えを見つけるために多額のお金を費やすことです。」
創業者や投資家にとって、問題は次に何が起こるかということになります。各業界には素晴らしい製品を作る可能性のある候補者が徐々に知られるようになっています。さらに多くの人が各業界でこのような存在になるかもしれませんが、この物語は既に始まっています。新たな機会はどこから生まれるのでしょうか?
拡張が停滞すると、多くの倒産や合併の波が見られると予想しています。残りの企業はますますエンジニアリングに焦点を当てるようになるでしょう。この進化を予測するためには、人材の動向を追跡する必要があります。いくつかの兆候が、OpenAIが自社製品化に向かっていることを示しています。この変化は、次世代のスタートアップ企業に新たな可能性を切り拓くことになります。これにより、イノベーションに依存したアプリケーションの研究や科学による「迂回超車」が可能となり、既存の企業を超える新たな道を切り開く試みが可能になります。
!
宗教的なレッスン
私の技術に対する考えは、明らかに複利効果を持っているように見えるものは通常長続きしないというものであり、一般的には、明らかに複利効果を持っていると思われるビジネスは、奇妙なことに予想よりもはるかに遅い速度と規模で成長するという見解が広く受け入れられています。
!
宗教の分裂の初期の兆候は通常、予測可能なパターンに従います。これらのパターンは、『苦い宗教』の進化を追跡するためのフレームワークとして利用できます。
それは通常、競合する説明が現れることから始まります、それが資本主義的またはイデオロギー的な理由からであろうとも。初期のキリスト教では、キリストの神性や三位一体の本質に関する異なる見解が分裂を引き起こし、まったく異なる聖書の解釈が生まれました。 AIの分裂に言及した以外にも、他にも現れつつある亀裂があります。例えば、一部のAI研究者はトランスフォーマーの中核的な正統派の考え方を拒否し、State Space Models、Mamba、RWKV、Liquid Modelsなどの他のアーキテクチャに向かっています。これらはまだソフトサインに過ぎませんが、異端の思想の萌芽を示し、この分野を基本原則から再考する意欲を表しています。
時間の経過とともに、先生のイライラした発言は人々の不信感を引き起こす可能性もあります。宗教の指導者の予言が実現しないか、神の介入が約束どおりになかった場合、疑念の種が植え付けられることもあります。
ミライト派の運動はかつて、キリストが 1844 年に戻ってくると予言していましたが、イエスが予定通りに来なかったため、その運動は崩壊しました。 科学技術界では、失敗した予言を静かに埋葬し、私たちの預言者に楽観的で長期的な未来のビジョンを描かせることが一般的ですが、予定された締め切り日を何度も逃すことがあります(こんにちは、Elon)。 ただし、拡張定律の信仰を支えるために元のモデルの性能を継続的に改善しないと、それも同様の崩壊に直面する可能性があります。
腐敗、肥満または不安定な宗教は、離脱者の影響を受けやすいです。新教改革運動が進展した理由は、ルターの神学的な見解だけでなく、カトリック教会の衰退と混乱の時期に現れたからです。主流の機関に亀裂が生じると、長期間存在している「異端」とされる思想が突然肥沃な土壌を見つけます。
人工知能の領域では、私たちはより小規模なモデルや代替手法に注目することがあります。これらはより少ない計算やデータで類似の結果を実現するものであり、中国の企業研究所やオープンソースチーム(例えばNous Researchなど)が行っている仕事も含まれます。生物的な知能の限界を突破し、長い間越えられないと考えられていた障壁を克服した人々は、新しい物語を創り出す可能性もあります。
変化の始まりを最も直接的でタイムリーな方法で観察するには、実務者の動向を追跡することです。公式の分裂の前に、宗教学者や聖職者は通常、秘密裏に異端の見解を持っており、一方で一般の人々の前では従順に振る舞います。現在の対応する現象は、一部のAI研究者が、表面上は拡張法則に従っているように見えるが、密かにまったく異なる方法を追求し、一致を挑戦する適切な時を待っているか、または彼らの研究室を離れて、理論的により広い場所を探し求めることかもしれません。
宗教と技術の正統性に関する問題は、それらがしばしば正しい部分を持っていることですが、最も忠実な信者が信じるように普遍的に正しいわけではないことです。宗教が人類の基本的な真理を形而上学的な枠組みに組み込むように、拡張法則は神経ネットワークの学習の実際の状況を明確に説明しています。問題は、この現実が現在の熱狂的な推進者が示唆するように完全で不変であるか、そしてこれらの宗教的機関(人工知能研究所)が十分に柔軟で、十分に戦略的であるかどうか、熱狂的な信者を共に引っ張っていけるかどうかにあります。同時に、彼らの知識を広めるために知識を伝えるための印刷機(チャットインターフェースとAPI)を構築し、それらを広めることができるようにします。
エンドゲーム
「宗教は一般の人々の目には現実的であり、知者の目には虚構であり、支配者の目には有用です。」-ルキウス·アンナウス·セネカ
宗教機関に対する一つの可能性のある時代遅れの見方は、一定の規模に達すると、人間が運営する多くの組織と同様に、生存の動機に屈し、競争で生き残ろうとすることです。その過程で、彼らは真実と偉大な動機(両方とも互いに排他的ではない)を無視しています。
私は以前、資本市場が物語中心の情報の繭となる方法についての記事を書いたことがありますが、インセンティブのメカニズムはこれらの物語を継続させることがあります。拡張定律の合意は何か不吉な類似性を感じさせます-これは数学的に優雅で、大規模な資本の展開を調整するのに非常に役立ちます。多くの宗教フレームワークと同様に、それは基本的な真理としてよりも調整メカニズムとしての価値があるかもしれません。