Naver 推出整合媽媽咖啡館貼文與餐廳評論的 AI 模型

Naver 於 2 日發表一款全新 AI 模型,該模型融入來自 mom cafe 貼文及餐廳評論的真實生活資訊,以提升回答準確度。這款模型是在 Naver D2SF 江南舉辦的「From Search to Execution: Next-Generation AI Technology Creating Naver AI Search」議程中介紹的。這款基於 HyperCLOVA X 的輕量模型,運用「韁繩工程(harness engineering)」來反映 Naver 生態系中的生活導向資訊,讓 AI 能根據實際使用者體驗而非通用數據來提供答案。

Naver 運用韁繩工程整合使用者生成內容

部署於 Naver「AI 標籤」搜尋服務中的 AI 模型使用韁繩工程——一種如同馬韁繩控制與引導馬匹般,用來控制與導引 AI 代理行為的架構。當使用者搜尋數學補習班學費時,系統會根據 mom cafe 中家長們近期討論的內容提供答案。當使用者詢問餐廳停車位是否充足時,AI 不僅反映官方商家資訊,也納入曾在那裡停車的實際顧客評論。

Naver AI 搜尋服務負責人 Han Seung-kyun 將韁繩工程比喻為 AI 的「工作常識」,並表示「要打造能在服務中良好運作的 AI 代理,同時設計成本效率與穩定性的韁繩工程不可或缺,而不只是大型語言模型(LLM)」。Han 補充說「結合過去 27 年累積的搜尋基礎架構與 know-how、部落格與 cafe 等龐大內容,以及購物、地點等多種服務資產與 AI 技術,引導從搜尋到執行的過程,是 Naver 獨特且無人能輕易追上的競爭力。」

Naver 使用小型語言模型將營運成本降低 3 倍

Naver 建構了分工式小型語言模型(Small Language Model (SLM))結構,以提升 AI 標籤的效率。不是由一個巨型 LLM 處理所有任務,Naver 結合特定任務的 SLM,在降低營運成本的同時,也提升回應速度與品質。透過這種方法,Naver 將設備營運成本降低最多 3 倍,並將回應速度提升超過 2 倍。

Naver 使用 Clarify RL(強化學習,Reinforcement Learning)技術訓練 AI,確保 AI 不會任意解讀模糊請求,而是透過額外問題確認使用者意圖。結果顯示,與 HyperCLOVA X 相比,幻覺減少最多 30 個百分點。

Naver Cloud 超大型 AI 模型總監 Lee Ki-chang 強調「應用於 AI 標籤的模型特點是,從訓練資料建構到模型設計與強化學習(Reinforcement Learning),整個流程都針對 Naver 服務進行最佳化」,並補充說「目標是打造一個在 Naver 使用者實際服務流程(如搜尋、購買、預約)中,運作最準確且最高效的模型。」

Naver 將 SmartLens 多模態技術整合至 AI 搜尋

Naver 揭露了其多模態技術發展策略,該技術利用置於 AI 標籤搜尋欄前方的 SmartLens。多模態技術讓 AI 能理解並運用影像與影片等各種形式的資訊,而不僅僅是文字。

使用者可以在搜尋欄上傳圖片而非文字,並下達如「找尋類似商品」或「預訂具有這種氛圍的地點」等指令。雖然現有 AI 也能進行圖片與影片搜尋,但 LLM 模型是先辨識圖片,再進行文字搜尋。相比之下,Naver 的多模態代理能將從圖片輸入到執行的整個過程理解為單一請求。

Naver 未來 AI 中心負責人 Naver Future AI Center 負責人 Yoon Sang-doo 表示「Naver 透過 SmartLens 累積近 10 年的視覺搜尋技術,是為 AI 代理創造觀察世界之眼的關鍵技術」,並補充說「未來 Naver 的 AI 代理服務將朝理解使用者意圖(不僅透過文字,也透過圖片)並連結至實際行動的方向演進。」

常見問題

Naver 在 2 日發表了什麼內容? Naver 於 2 日在 Naver D2SF Gangnam 發表一款全新 AI 模型,該模型融入來自 mom cafe 貼文與餐廳評論的生活導向資訊。該模型基於 HyperCLOVA X,並運用韁繩工程在其回答中反映真實使用者體驗。

Naver 透過這款新 AI 模型將營運成本降低了多少? Naver 使用小型語言模型(Small Language Model (SLM))結構將設備營運成本降低最多 3 倍。該公司也將回應速度提升超過 2 倍,並與 HyperCLOVA X 相比,將幻覺減少最多 30 個百分點。

Naver AI 搜尋中的 SmartLens 多模態技術是什麼? SmartLens 是 Naver 的多模態技術,允許使用者在搜尋欄上傳圖片,並獲得如「找尋類似商品」或「預訂具有這種氛圍的地點」等指令的答案。該技術將從圖片輸入到執行的整個過程理解為單一請求,並利用 Naver 累積近 10 年的視覺搜尋技術。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆