企業 AI 資料優化新工具 Blockify 5 月 9 日由 akshay_pachaar 整理推廣、宣稱在 RAG(Retrieval-Augmented Generation)流程中、可把企業資料庫壓縮 40 倍、查詢 token 用量減 3 倍、向量搜尋準確率提升 2.3 倍。Blockify 官方 GitHub說明:產品由 Iternal Technologies 推出、用「IdeaBlock」結構化知識單元取代傳統 chunking、並透過去重合併讓知識庫保持精簡、連貫、可治理。
核心概念:用 IdeaBlock 取代傳統 chunking
Blockify 的技術設計:
傳統做法:把長文件切成固定大小的 chunk、嵌入向量、檢索時取 top-k
Blockify 做法:把原始內容轉換為 IdeaBlock—XML 結構化知識單元
每個 IdeaBlock 內含:自帶問題、可信答案、tag、實體、關鍵字
相似 IdeaBlock 自動去重合併、知識庫不會隨內容增長膨脹
傳統 chunking 的問題是同一資訊可能在多個 chunk 中重複出現、造成檢索冗餘與 token 浪費;IdeaBlock 透過去重把資訊密度提升、同樣內容用更小的儲存空間表達。
具體效益:壓縮 40 倍、token 減 3 倍、準確率升 2.3 倍
Blockify 公布的具體效益指標:
資料壓縮:企業資料庫縮減至原大小約 2.5%(40 倍壓縮)、保留 99% 以上資訊
每查詢 token:從約 303 個(傳統 chunk)降至約 98 個(IdeaBlock)—3.09 倍效率
向量檢索準確率:提升 2.29 倍
整體準確率改善:約 78 倍(含去重與檢索改進綜合效應)
成本節省試算:1 億查詢/年、節省 token 成本約 73.8 萬美元
78 倍的整體準確率提升是綜合效應—去重減少噪音、IdeaBlock 結構化內容對向量檢索友善、單次回答 token 數下降同時減少模型出錯空間。
整合範圍:LlamaIndex、LangChain、Milvus、Cloudflare 等主流框架
Blockify 已整合的開發者工具與基礎設施:
RAG 框架:LlamaIndex、LangChain
知識管理:Obsidian
向量資料庫:Milvus、Elastic、Supabase
邊緣運算:Cloudflare
低程式碼整合:n8n(透過工作流程模板)
Blockify 的整合策略是「不取代既有 RAG 框架、而是作為前置資料優化層」。開發者可在現有 LlamaIndex 或 LangChain 流程中、用 Blockify 替換原本的 chunking 步驟、其餘流程不變。
後續可追蹤的具體事件:Blockify GitHub 星數成長與社群採用率、Iternal Technologies 是否就 IdeaBlock 結構申請或揭露技術細節(目前標榜「patented ingestion」)、以及主流 RAG 框架是否將類似去重邏輯內建為預設功能。
這篇文章 Blockify 改寫企業 RAG:用 IdeaBlock 取代 chunking、壓縮 40 倍、token 減 3 倍 最早出現於 鏈新聞 ABMedia。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
騰訊「元寶」今日推出微信聊天摘要功能
根據騰訊在 5 月 13 日的公告,騰訊元寶推出了一項新功能,讓使用者能夠彙整微信聊天記錄。使用者可以在微信中選擇聊天歷史,點擊「轉發到其他應用」,並在清單中選擇元寶,將內容直接複製到該應用的聊天介面中,由 AI 提供智慧彙整與分析。
GateNews36分鐘前
XYO 於 5 月 12 日推出 AI SDK,讓不具備 Solidity 專業知識的開發者也能進行區塊鏈開發
根據 XYO,公司於 5 月 12 日推出一款 AI 軟體開發套件,旨在使用自然語言提示來簡化在 XYO 第一層(XYO Layer One)上的區塊鏈應用程式建立。AI SDK 讓開發者能透過 AI 編碼助理(例如 Codex 與 Claude)建置去中心化應用程式,而不需要具備 Solidity 知識或深入的區塊鏈專業技能。總部位於聖地牙哥的平台表示,目前其去中心化基礎設施網路已支援超過 1 千萬個節點;該工具包的目標是移除歷史上曾限制區塊鏈開發僅限於特定工程團隊的技術門檻。
GateNews53分鐘前
WeChat 現在支援一鍵將訊息轉發至 Yuanbao AI 以進行即時摘要
根據 Beating 的說法,微信已與騰訊的 AI 助手「元寶」整合,以實現跨應用的訊息轉發。使用者現在可以選取聊天記錄,轉發給元寶,並即時獲得長篇群組對話或私人聊天的摘要。該功能也支援將費用資料擷取成表格,根據討論串生成行程安排,並提供聊天建議。使用者必須將微信和元寶都升級到最新版本,才能使用此功能。
GateNews3小時前
吳忌寒:GPU 部署目標 1 萬台,比特小鹿 4 月 AI 雲年化收入漲 60%
吳忌寒公布GPU部署新階段:1萬、10萬、100萬台。Bitdeer AI雲4月ARR約6900萬美元,部署4,184台GPU,利用率92%,外部訂閱3,323台,環比增長60%。4月比特幣挖礦783 BTC,年增372%,自挖65.5 EH/s、總87.4 EH/s,推出SEALMINER A4系列(9.45 J/T)。全球容量約3 GW,挪威泰達爾談判進入後期,田納西數據中心設計啟動。
Market Whisper5小時前
SAP 以 52 億美元估值透過二級股份出售投資 n8n
根據 CEO Jan Oberhauser 的說法,德國的 SAP 透過一場二級股份出售投資了總部位於柏林的工作流程自動化新創 n8n,並為該公司估值 52 億美元。SAP 也簽署了一份多年期協議,隨著其擴大 AI 產品供應,將把 n8n 工具整合到其 Joule Studio AI 建構器中。n8n 成立於 2019 年,提供軟體,使企業能以最少的程式碼自動化任務,並使用來自 OpenAI、Anthropic 與 Google 的模型來打造 AI 代理。該公司在 10 月時估值為 25 億美元,如今其年度經常性收入已超過 1.18 億美元。
GateNews5小時前
The Graph 在 5 月 12 日推出 x402 付款功能,支援每筆請求的鏈上資料存取(USDC)
根據 The Graph 於 5 月 12 日的官方公告,Graph Gateway 現在支援 x402 Payments,讓開發者與 AI Agents 能以每次請求使用 USDC 的方式存取鏈上資料,而不需 API keys、帳號或儀表板。使用者會收到包含價格資訊的 HTTP 402 回應,接著在 Base 網路上以基於簽章的方式用 USDC 完成付款,以在後續請求中取得資料。此更新包含新的 /api/x402/ 端點、更新後的付款 SDK、支援 x402 相容工具,以及同時在 Base 主網與 Base Sepolia 測試網上提供;同時,既有的 API Key 驗證方式保持不變。
GateNews16小時前