小語言模型（SLMs）被吹捧為人工智能的下一個大事

Cryptopolitan

2024-11-25 20:24:31

儘管公司正在向大語言模型(LLMs)投入大量資金，但人工智能行業的一些專家認為小語言模型(SLMs)將成為下一個大事件。

這是由於行業中的活動在節日季節的到來時繼續增長，科技公司投資更多資金費用來開發他們的技術。

未來在於小型語言模型

由億萬富翁埃隆·馬斯克（Elon Musk）運營的xAI等公司設法從Andreessen Horowitz，卡塔爾投資局，紅杉和Valor Equity Partners那裡籌集了50億美元，而亞馬遜則向OpenAI的競爭對手Anthropic額外投資了40億美元。

儘管這些大型科技公司和其他公司正在投資數十億美元，致力於開發能夠處理多種不同任務的大型LLM，但人工智能的現實是，沒有一種大小適合所有的解決方案，因為企業需要針對特定任務的模型。

根據AWS首席執行官Matt Garman在發佈其擴展合作與投資的聲明中所說，已經有許多AWS客戶正在開發由Anthropic驅動的生成式人工智能，並取得了壓倒性的反響。

對於大多數公司來說，LLMs仍然是某些項目的首選，但對於其他項目來說，這種選擇可能在成本、能源和計算資源方面昂貴。

Teradata的總裁兼首席執行官Steven McMillan為一些企業提供了另一種選擇，並持有其他觀點。他認為未來在SLM中是積極的。

“在展望未來時，我們認為小型和中型語言模型以及受控環境（如特定領域的LLM）將提供更好的解決方案。”

~ 麥克米蘭

SLMs根據特定類型的數據生成定製輸出，因為語言模型經過特定訓練以實現該目的。由於SLMs生成的數據被內部保留，因此語言模型是在潛在敏感數據上進行訓練的。

由於LLMs能耗高，因此小型語言版本經過訓練，可以根據項目實際需求調整計算和能源使用規模。經過這樣的調整，意味著SLMs在比當前大型模型更低的成本下更加高效。

對於希望使用人工智能進行特定知識的用戶來說，有特定領域的LLM選項，因為它們不提供廣泛的知識。它經過深入的培訓，只深入瞭解一類信息，並能更準確地回答，例如在該領域中，抵押貸款債券(CMO)與首席財務官(CFO)的區別。

為什麼 SLM 是首選選項

根據數據科學家協會（ADaSci）的說法，為一百萬用戶完全開發具有70億參數的SLM只需要55.1兆瓦時（MWh）。

ADaSci 發現訓練 1750億參數的 GPT-3 消耗了約 1,287 兆瓦時的電力，該電力不包括公眾正式使用時的電力。因此，一個 SLM 大約使用了訓練 LLM 消耗能量的 5%。

通常在雲計算機上運行大型模型，因為它們使用的計算能力比個人設備上可用的計算能力更多。這導致公司面臨複雜情況，因為它們在信息轉移到雲端時失去了對信息的控制，並且在信息通過互聯網傳輸時會出現緩慢的響應。

走向未來，企業對人工智能的採用不會是一刀切的，因為效率和選擇最佳和最便宜的工具來完成任務將成為焦點，這意味著為每個項目選擇合適大小的模型。

這將適用於所有型號，無論是通用的LLM還是更小和特定領域的LLM，取決於哪種型號能夠提供更好的結果，需要更少的資源，並減少數據遷移到雲端的需求。

在接下來的階段，人工智能將對業務決策至關重要，因為公眾對人工智能生成的答案非常有信心。

“當你考慮訓練AI模型時，它們必須建立在優質數據的基礎上。”

~ 麥克米蘭

“這就是我們的全部內容，提供可信賴的數據集，然後提供能力和分析能力，讓客戶及其客戶可以信任輸出，” McMillan補充道。

在世界上對效率和準確性的需求很高時，更小且特定領域的LLM為提供公司和廣大公眾可靠結果的另一種選擇。

在90天內啟動您的Web3職業生涯並獲得高薪的工作的逐步指南。

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

留言

0/400

暫無留言