儘管公司正在向大語言模型(LLMs)投入大量資金,但人工智能行業的一些專家認為小語言模型(SLMs)將成為下一個大事件。
這是由於行業中的活動在節日季節的到來時繼續增長,科技公司投資更多資金費用來開發他們的技術。
未來在於小型語言模型
由億萬富翁埃隆·馬斯克(Elon Musk)運營的xAI等公司設法從Andreessen Horowitz,卡塔爾投資局,紅杉和Valor Equity Partners那裡籌集了50億美元,而亞馬遜則向OpenAI的競爭對手Anthropic額外投資了40億美元。
儘管這些大型科技公司和其他公司正在投資數十億美元,致力於開發能夠處理多種不同任務的大型LLM,但人工智能的現實是,沒有一種大小適合所有的解決方案,因為企業需要針對特定任務的模型。
根據AWS首席執行官Matt Garman在發佈其擴展合作與投資的聲明中所說,已經有許多AWS客戶正在開發由Anthropic驅動的生成式人工智能,並取得了壓倒性的反響。
對於大多數公司來說,LLMs仍然是某些項目的首選,但對於其他項目來說,這種選擇可能在成本、能源和計算資源方面昂貴。
Teradata的總裁兼首席執行官Steven McMillan為一些企業提供了另一種選擇,並持有其他觀點。他認為未來在SLM中是積極的。
“在展望未來時,我們認為小型和中型語言模型以及受控環境(如特定領域的LLM)將提供更好的解決方案。”
~ 麥克米蘭
SLMs根據特定類型的數據生成定製輸出,因為語言模型經過特定訓練以實現該目的。由於SLMs生成的數據被內部保留,因此語言模型是在潛在敏感數據上進行訓練的。
由於LLMs能耗高,因此小型語言版本經過訓練,可以根據項目實際需求調整計算和能源使用規模。經過這樣的調整,意味著SLMs在比當前大型模型更低的成本下更加高效。
對於希望使用人工智能進行特定知識的用戶來說,有特定領域的LLM選項,因為它們不提供廣泛的知識。它經過深入的培訓,只深入瞭解一類信息,並能更準確地回答,例如在該領域中,抵押貸款債券(CMO)與首席財務官(CFO)的區別。
為什麼 SLM 是首選選項
根據數據科學家協會(ADaSci)的說法,為一百萬用戶完全開發具有70億參數的SLM只需要55.1兆瓦時(MWh)。
ADaSci 發現訓練 1750億參數的 GPT-3 消耗了約 1,287 兆瓦時的電力,該電力不包括公眾正式使用時的電力。因此,一個 SLM 大約使用了訓練 LLM 消耗能量的 5%。
通常在雲計算機上運行大型模型,因為它們使用的計算能力比個人設備上可用的計算能力更多。這導致公司面臨複雜情況,因為它們在信息轉移到雲端時失去了對信息的控制,並且在信息通過互聯網傳輸時會出現緩慢的響應。
走向未來,企業對人工智能的採用不會是一刀切的,因為效率和選擇最佳和最便宜的工具來完成任務將成為焦點,這意味著為每個項目選擇合適大小的模型。
這將適用於所有型號,無論是通用的LLM還是更小和特定領域的LLM,取決於哪種型號能夠提供更好的結果,需要更少的資源,並減少數據遷移到雲端的需求。
在接下來的階段,人工智能將對業務決策至關重要,因為公眾對人工智能生成的答案非常有信心。
“當你考慮訓練AI模型時,它們必須建立在優質數據的基礎上。”
~ 麥克米蘭
“這就是我們的全部內容,提供可信賴的數據集,然後提供能力和分析能力,讓客戶及其客戶可以信任輸出,” McMillan補充道。
在世界上對效率和準確性的需求很高時,更小且特定領域的LLM為提供公司和廣大公眾可靠結果的另一種選擇。
在90天內啟動您的Web3職業生涯並獲得高薪的工作的逐步指南。