AWS 透過強化學習自動化,降低了 AI 客製化的入門門檻

亞馬遜網路服務(AWS)發布了旨在提升人工智慧(AI)模型效率並降低學習成本的新功能。其核心是基於強化學習的細節調優選項「RFT」以及無伺服器客製化功能。這些功能旨在讓開發者僅憑最少的機器學習專業知識即可對AI模型進行用戶客製化改進。

AWS於3日(當地時間)在拉斯維加斯舉行的年度會議「AWS re:Invent 2025」上宣布,將在Amazon Bedrock和SageMaker AI中應用相關功能。Amazon Bedrock是一個可基於主要AI公司的「基礎模型」建構生成式人工智慧功能的平台,此次RFT更新為企業優化AI智慧體開闢了道路,而無需強大的機器學習基礎設施。

企業通常將效能最卓越的大型語言模型(LLM)用於AI智慧體,但這導致需要過高的推理處理能力。即使在行事曆確認或文件檢索等重複性任務中,也出現了資源使用過度的低效問題。AWS認為新引入的基於強化學習的客製化功能可以解決這些問題。簡而言之,這是一種能夠以更少運算量確保足夠效率的架構。

以往,引入強化學習伴隨著極高的技術門檻。包括準備訓練資料、蒐集回饋、建構高效能運算基礎設施等,需要耗費數月時間。但Amazon Bedrock上的RFT功能允許開發者選擇所需模型,上傳用戶互動紀錄或訓練資料,然後指定獎勵函數,模型的調優工作便會自動進行。AWS解釋稱,此過程無需機器學習專業人才即可執行,僅憑「對什麼是好結果的想法」便已足夠。

初期,該功能將獨家支援亞馬遜自有模型Nova 2 Lite,但未來計劃擴展至數十種模型。Amazon SageMaker AI也將以無伺服器形式新增類似功能。SageMaker是支援企業設計和部署自有AI模型的平台,預計將提供一種更易於整合強化學習選項的「智慧體化」環境。

在智慧體化模式下,使用者以自然語言輸入需求後,AI智慧體將引導從資料生成到模型評估的整個流程。同時,也為高階開發者提供自引導方式,拓寬了用戶的選擇範圍。AWS解釋稱,該功能還可同時應用回饋學習、可驗證的基於獎勵的學習、監督學習方式調優等多種強化學習技術。該功能不僅與Nova相容,也與Llama、Qwen、DeepSeek、GPT-OSS等模型相容。

與此同時,AWS還宣布將在SageMaker HyperPod中引入「無檢查點訓練」功能。以往訓練中發生錯誤時,恢復需要數十分鐘以上,但現在無需客戶介入即可在數分鐘內恢復狀態。這是透過在整個叢集即時儲存模型狀態實現的。

此外,AWS還將開源AI智慧體框架「Strands Agents」移植到了TypeScript語言。該語言比JavaScript穩定性更高、出錯可能性更低,預計將提供更穩定的智慧體開發環境。

此次發佈正值生成式AI市場內競爭對手紛紛加強客製化功能的趨勢。Google(GOOGL)、微軟(MSFT)等也在加速推出類似功能,預計用戶能夠輕鬆自行建構最優AI模型的環境將進一步加速發展。此類技術演進似乎將起到催化劑作用,推動AI更深地融入實際企業環境。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)