小さな言語モデル(SLM)は、AIの次の大きなトレンドとされています

企業は大規模言語モデル(LLM)に資金を投入している一方で、AIセクターの一部の業界専門家は、小規模言語モデル(SLM)が次の大きなトレンドになると考えています。

これは、祭りの季節が訪れ、テック企業がより多くの資金調達を行って自社の技術を開発する中で、業界の活動がますます盛んになっていることを示しています。

将来は小さな言語モデルにあります

xAIなどのようなマルチビリオネアのElon マスクが運営するxAIは、Andreessen Horowitz、カタール投資庁、シーキョイア、およびValor Equity Partnersからさらに50億ドルを調達しました。アマゾンは、OpenAIのライバルであるAnthropicに40億ドルを追加投資しました。

これらの大手テック企業やその他の企業が数十億ドルを投資し、さまざまなタスクを処理する大規模なLLMを開発することに焦点を当てている一方で、AIの現実は、ビジネス向けのタスク固有のモデルが必要なため、ワンサイズフィットオールではないということです。

AWSの最高経営責任者であるマット・ガーマンは、彼らのパートナーシップと投資の拡大に関するリリースで、既にAnthropicによって駆動された創発的AIを開発しているAWSの顧客から圧倒的な反応があると述べています。

多くの企業にとって、LLMは特定のプロジェクトにおいてはまだ最も適した選択肢ですが、他の場合には、コスト、エネルギー、およびコンピューティングリソースが高価になる可能性があります。

スティーブン・マクミランは、テラデータの社長兼CEOであり、一部の企業にとっては別の道を提供してきたが、彼は他にも考えがある。 彼は未来がSLMにあると肯定的だ。

「私たちが将来を見据えるにつれて、小規模および中規模の言語モデルや特定のドメインに制御された環境など、ドメイン固有のLLMなどが、はるかに優れた解決策を提供すると考えています。」

~マクミラン

SLMは、言語モデルがそれに特化してトレーニングされている特定のタイプのデータにカスタマイズされた出力を生成します。 SLMによって生成されたデータは内部的に保持されるため、言語モデルは潜在的に機密性の高いデータに基づいてトレーニングされます。

LLM(言語モデル)はエネルギーを消費するため、小規模な言語バージョンは、計算とエネルギー使用量をプロジェクトの実際のニーズに合わせてスケーリングするように訓練されています。このような調整により、SLM(小規模言語モデル)は現行の大規模モデルよりも低コストで効率的です。

特定の知識にAIを使用したいユーザーには、広範な知識を提供しないドメイン特化型LLMのオプションがあります。それは、情報のカテゴリーを深く理解し、例えばCMOとCFOのようなドメインにおいてより正確に応答するために訓練されています。

なぜSLMが好ましい選択肢なのか

データサイエンティスト協会(ADaSci)によると、100万人のユーザー向けに70億のパラメータを持つSLMを完全に開発するには、わずか55.1MWh(メガワット時)が必要です。

ADaSciは、1750億のパラメータでGPT-3をトレーニングすると、推定1,287MWhの電力を消費し、公式に一般に使用される場合を含んでいません。したがって、SLMはLLMのトレーニングを通じて消費されるエネルギーの約5%を使用します。

大規模なモデルは通常、個々のデバイスでは利用可能な計算能力をはるかに超えるため、クラウドコンピュータで実行されることが多い。これにより、情報がクラウドに移動するため企業がそのコントロールを失い、インターネットを通じて移動する際に遅延が生じるため、企業にとって複雑さが生じます。

将来に進むと、企業によるAIの採用は一括適用ではありません。効率とタスクの完了に最適で最も費用対効果の高いツールの選択が重要になります。つまり、各プロジェクトに適したサイズのモデルを選ぶことが求められます。

これはすべてのモデルに対して行われます。汎用LLMであろうと、より小さなドメイン固有のLLMであろうと、どのモデルがより良い結果を提供し、より少ないリソースを必要とし、クラウドへのデータの移行の必要性を減らすかに応じて。

次のフェーズでは、AIはビジネス上の意思決定に不可欠となります。一般の人々はAIによる回答に高い信頼を寄せています。

「AIモデルのトレーニングを考えると、それは優れたデータの基盤の上に構築されなければなりません。」

~マクミラン

「それが私たちのすべてであり、信頼できるデータセットを提供し、そして顧客とその顧客が出力を信頼できるようにする能力と分析能力を提供することです」とマクミランは付け加えました。

世界で効率と正確さが高い需要を持つ中、小規模で特定のLLMは企業や一般の信頼できる結果を提供する別の選択肢を提供します。

あなたのWeb3キャリアを立ち上げ、90日で高収入暗号資産の仕事を得るための段階的手順。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン