Kevin Simback

vip
幣齡 1.3 年
最高等級 0
用戶暫無簡介
到目前為止,還有人對 Opus 4.7 感到失望嗎?
在我得出結論之前,需要給它更多的任務,但早期預測並不會有太大的提升
也許我對 Mythos 聽說後期望太高了
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
我在聊天中放了兩個獨立的 Hermes 代理實例,天啊這真的太有趣了
>一個代理是建造者,一個是策略師
>每個都用不同的模型
>給他們一些共享的上下文
>啟用了 bot2bot 並將每個機器人加入對方的 TG 白名單
>我們三個人加入了一個群組
>一開始只發了一個簡單的訊息,請他們確認是否能看到彼此的訊息
>大約十次握手後,他們就開始自己建造了
有時候你只需要用這些東西來試試看,看看會發生什麼,挺有可能會變成無限循環,所以可能需要介入一下
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
目前我對人工智慧領域中三個非常感興趣的主題:
1. 本地模型以成本優化模型使用
為什麼 -> 我認為我們不會再長時間以每月200美元的近乎無限制使用來獲得最佳模型
跡象已經顯示,大型實驗室無法再長期補貼
所以趁著Claude Max還在時好好享受,但很快每家公司和高階用戶都需要學會如何高效地在不同模型之間路由以完成任務,以及在雲端與本地之間切換,而本地是關鍵
2. 識別代理產品中的護城河
為什麼 -> 代理將對世界產生巨大影響,但價值的累積並不明顯
我一直在做相關研究,已經找出五個在代理領域形成護城河的元素 - 相關報告即將發布
提示:護城河不是套件本身,而是套件收集的內容
3. 情境工程作為競爭優勢
為什麼 -> 在一個智慧充裕的世界裡,情境是產生比他人更佳結果的關鍵
不論是哪個領域,情境都很重要,專有數據作為情境則是新的智慧財產權
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
一個LLM維基是一個彙編的知識庫——這很棒並且有其用途
但它不是一個“第二個大腦”
一個LLM維基捕捉了你所研究的內容,也許還有你所閱讀的內容
但它沒有捕捉你對所讀內容的想法,而這個差異才是重點
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
有人最近注意到嗎,Claude 喜歡在完成一些事情後告訴你今天結束了嗎?
想知道這是否是一個微妙的方式,讓 Max 計劃的用戶不要太頻繁使用它——「讓用戶覺得自己完成了什麼,並鼓勵他們停止使用」
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
人們具有競爭性
我們喜歡競爭,我們喜歡觀看他人競爭,並且我們喜歡對他人競爭的結果下注,這本身也是一種競爭形式
人工智慧代理為一個全新的競爭類型打開了設計畫布
期待我的代理進行比賽
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
🚀 想要可以插入 OpenClaw 或 Hermes 的免費模型嗎?
這裡有 9 個資源可以讓你免費存取模型 API
無需本地設置,無需信用卡,純粹的雲端 API,具有與 OpenAI 相容的端點
你目前還無法獲得與 Opus 品質相當的 (免費模型),但這些都提供真正的免費層級 (可能有速率限制),如果你不想花錢用代理,這些已經足夠讓你入門
1️⃣ OpenRouter 免費模型
(Gemma 4 31B/26B、NVIDIA Nemotron 3 超級 120B MoE、MiniMax M2.5、Qwen3 變體、Llama 4/3.3、gpt-oss-120B、Arcee Trinity 等)
• 約 29 個完全免費的 $0/每 token 模型
• 多樣性極高 + 頂級開源模型評估 (尤其是程式碼與代理)
• 最適合自動輪換模型
👉 註冊:
2️⃣ Google Gemini API
(Gemini 2.5 Pro / Flash 系列)
• 最強的整體免費前沿模型
• 優秀的多模態、多達 1M+ 內容長度、原生工具調用與代理性能
• 非常慷慨的免費限制 (常見 5–15 RPM)
👉 註冊:
3️⃣ NVIDIA
(Nemotron 變體、Llama 3.3 70B、Qwen3 235B、Mistral Large 等)
• 優化的高性能開源模型
• 免費原
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
聘請一位隊友,而非工具——這是企業代理式人工智慧的未來
大多數公司希望擁有只做出色工作的AI代理——他們不想過度涉入技術細節,如運用方式和模型選擇
他們只想從菜單中選擇一個代理,為該代理配備任何額外所需的技能,然後能在公司環境中安全使用它
只需三個點擊,代理就準備好工作,隨時啟動或關閉都同樣方便
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
快速公告:
如果有人打算訂閱 @Coursiv_io,我強烈建議不要這麼做
我有充分的理由相信他們的行為帶有不良意圖,簡單的搜尋就會顯示許多「詐騙警報」報告
很難過,因為我兒子原本很期待這個活動
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
「AI最大化」設置:
> 在家用消費者硬體上運行最先進的開源模型 (多種選擇:Mac Mini 64GB、配備 3090/4090/5090 的電腦)
> 使用 Tailscale 或搭配 Tailscale 的 LM Studio 進行安全的遠端存取
> 隨時隨地透過手機/筆電存取模型,進行私密且免費的推理
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
對於有雄心的 AI 研究人員來說,這是一個真正的機會:
- 建立一個用於測試代理工具(如 Openclaw、Hermes 以及所有其他“爪”)的評估框架
- 擴展評估範圍,涵蓋不同的工具/配置,以了解性能如何隨著不同設置而變化
- 在不同模型(包括本地與 API)之間進行穩健的評估
- 進行基準測試並發布結果,隨著代理和模型的演進持續更新
這個機會是成為客觀代理基準測試的首選資源
也許有人已經在做這件事,我卻沒有注意到?不是一次性的比較,而是真正的標準測試與評估,讓我們能夠真正比較結果
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
我寧願擁有操你技能,也不想有操你錢
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
在過去幾天,我注意到越來越多的模型說“我已經修好了”,但實際上沒有修好
有人也有同樣的感覺嗎?
直覺上,這似乎是整體性能的普遍下降
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
為什麼在本地運行模型?
通常有兩個主要原因 - 隱私和成本
讓我們用一個例子探索成本方面,看看數字如何計算
假設你想像 @karpathy 一樣整夜運行一個自動研究循環
如果你能使用 H100,你可以整夜運行 100 個實驗,使用 Opus-4.6 和 API 成本可能在 $10-25 的範圍內
但我們大多數人都沒有那麼幸運能夠使用 H100
我們仍然可以在 MacBook 上以相同的 $10-25 運行 100 個自動研究實驗,但這不會是完全相同的比較
H100 在同一時間段內將完成 50-100 倍以上的訓練步驟
所以如果你想重現相同數量的訓練步驟,你最終可能要支付 $1000+ 的 API 成本,當然它要花費的時間也會遠遠超過一晚上
這不會很明智,因為你可以以遠低的價格租用 H100 並更快地完成相同的工作
但這開始說明為什麼你會想在本地運行模型 - 它使你能夠進行那些對大多數人來說成本高得無法承受的實驗
它開始平衡競爭環境
我在一台較舊的電腦上運行 Qwen3.5 9B,現在進行實驗是有意義的,否則如果我要支付 API 成本的話,我就不會進行這些實驗
這是一個重大解鎖,隨著模型變得更好和更小,這將只會進一步開放
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
我對人工智能的一些個人反思
我在大學時開始學習計算機科學,但我從來不是一個優秀的編碼員
我在大三時上了一堂公司金融課程,成績優異,我對金融的天賦遠勝於編碼,所以我轉了專業
但我對那些真正會編碼的人一直有自卑情結
我知道他們在構建任何東西時都能遠遠超過我,我在技術依賴上受制於他們
所以我堅持使用Excel模型和PowerPoint演示作為我的優勢
後來在高盛擔任顧問時,我遇到了一些真正的金融量化分析師
他們中的大多數既能編碼,又懂金融
我再次感到自卑——我擅長數學,但這些量化分析師在各方面都能遠遠超過我
我在整個職業生涯中一直帶著這種感覺,同時磨練我作為通才運營者的技能
編碼員和量化分析師仍然可以在很多方面超過我,但我能整合資源創造價值,我把這視為一項獨特的寶貴技能
但最近有了AI,我對編碼員和量化分析師的職業生涯自卑感得到了一些緩解
有了Claude Code,我現在真的可以編碼和構建東西,雖然不如職業開發者水平,但足以縮小差距
有了Claude和一些工具,我現在可以運行量化策略,雖然不如全才量化分析師水平,但足以縮小差距
我的觀點是AI是一個偉大的平衡器
它可以補充你天生不擅長的領域,它能放大你的優勢
它可以成為個人層面上強大的改變者——你可以真正去做事情!
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
像策略家一樣思考,像開發者一樣工作 -> 這是新模式
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
Claude Max 計劃就像自助餐
我已經吃飽了,但好吧,請再給我一盤代幣吧
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享