2026-04-10 12:04:04

Gemma 4在llama.cpp上終於穩了

4月2號Google發了Gemma 4，第一天就有llama.cpp支持但bug多。現在所有問題都修完了
E2B、E4B、26B MoE、31B Dense
31B在Arena AI排行第3，26B排第6
開源模型最強梯隊
用--chat-template-file加載interleaved模版
建議開啟--cache-ram 2048
上下文長度根據顯存來
去年本地最好的是Llama 3.1 70B量化版，勉強能用
現在Gemma 4 31B Q5在Mac Studio上流暢跑，接近GPT-4級別
不依賴API的AI應用開始有商業可行性。數據不出本機，成本為零，延遲極低
對於一人企業，本地模型是真正的基礎設施。競爭對手在付API費，你的邊際成本是電費
Gemma 4 + llama.cpp = 本地推理最優解，可以上生產了

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

1人按讚了這條動態

打賞
1
留言
轉發
分享

留言

請輸入留言內容

暫無留言

熱門話題
查看更多
#
Gate上線Pre-IPOs
21.61萬熱度
#
Gate現貨衍生品雙雙衝進全球前三
960.04萬熱度
#
原油小幅上漲
118.06萬熱度
#
加密市場回升
5.33萬熱度
#
Gate廣場四月發帖挑戰
129.97萬熱度

熱門 Gate Fun
查看更多

1
UP
GATEUP
市值:$2300持有人數:1
0.00%
2
M
马到成功
市值:$2325.7持有人數:1
0.29%
3
reset2026
reset2026
市值:$0.1持有人數:1
0.00%
4
madrid
real madrid
市值:$2300持有人數:1
0.00%
5
LPGO
LPGO
市值:$2320.33持有人數:2
0.00%

Gemma 4在llama.cpp上終於穩了

熱門話題

Gate上線Pre-IPOs

Gate現貨衍生品雙雙衝進全球前三

原油小幅上漲

加密市場回升

Gate廣場四月發帖挑戰

熱門 Gate Fun

UP

GATEUP

M

马到成功

reset2026

reset2026

madrid

real madrid

LPGO

LPGO

置頂