runesleo

vip
幣齡 8.4 年
最高等級 6
用戶暫無簡介
希望 OpenAI 不要不识抬举。
我剛申請了 Codex for Open Source。
這個計劃挺狠:
給關鍵開源維護者
6 個月 ChatGPT Pro + Codex,
還有 API 配額和 Codex Security 有條件訪問。
我最喜歡的點是:
OpenAI 終於把“維護開源”
當成一種真實勞動看了。
看 PR。
分 issue。
修安全問題。
發版本。
補文檔。
寫自動化。
處理一堆沒人想碰的邊角料。
這些活平時最容易被白嫖。
項目越多人用,
開源維護者越像免費客服 + 安全員 + 發版機器。
如果 Codex 能幫維護者
少處理一大截重複勞動,
這件事對開源生態的價值,
會比很多 AI demo 實在得多。
我已經申請了。
希望它真給我過! 😁
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
X 最終還是把自動翻譯全球鋪開了。
我越來越覺得,活人感在傳播裡還是最重要的。絕對不是可有可無的裝飾。
現在 For You 算法推薦裡裡,不同語言的讀者看到的是 Grok 譯版,不是作者原話。算法和翻譯疊在一起,很容易把語氣、梗、文化背景那層東西搞沒了。
我還是認為這不是什么好方向。跨語言、跨文化傳信息,只靠翻譯不夠的。
AI 翻譯目前也做不到那種精準,更還原不出作者寫的時候那種活人的感覺。我調自己的文字風格 LeoStyle 調了快一年了,依然不理想。🤦
auto-translate 和 X 開源那套算法,值得好好研究,也可以當作思考工具在看:幫你想清楚,平台在用什麼方式重組內容。
寫內容的人,該保活人感,還是該保活人感。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
我在想,現在 X 上的內容不是會自動翻譯嗎
這種情況下,大家發的內容到底是“人味”重還是“ AI 味”重,還有多重要?
因為即便你發的東西再有人情味,一旦被自動翻譯成其他語言,它都經過了一手 AI 處理,這怎麼辦?
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
呼叫 OpenAI ,請盡快重置本週 codex 配額(狗頭
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
未來公共預測市場裡,大規模參與者可能不再是「人群」,而是 AI Agent。
但要先看懂今天為什麼像體育盤
公共預測市場,為什麼越來越像體育盤?
不是平台/CEO 不努力,是結構就這樣注定的。
(最新一篇英文長文把這條鏈講透了,文末有連結)
Kalshi、Polymarket 過去一年,大約 65% 成交量是體育。
科技類市場,只有 1% 左右。
為什麼沒辦法出現很多「有意思」的市場?
四類參與人群裡:
「儲蓄型資金」進不來——預測市場對交易者是零和,不能增值。
「對沖者」也很少——大家想對沖的是事件後果,不是事件本身。
最後只剩賭客撐場,聰明錢跟著賭客打短周期體育盤。
想開新市場的人還要算一筆帳:
開一個新盤還要補貼流動性,很貴。
更麻煩的是:盘口對外通常只給一個概率,
比如「這件事 67% 會發生」。
企業要的是整份分析:為什麼、靠什麼、風險在哪。
所以很多機構寧願直接雇顧問、研究團隊,
也不專門掏錢養一個公共盘口。
文章認為,AI Agent 可能是補丁:
成本低、能掃小眾小盤、還能寫清推理過程。
重點不是「AI 幫你下注」。
是補公共預測市場缺的那類參與者。
配圖是全文邏輯鏈。
原文:
做預測市場研究的入口:
KALSHI-3.83%
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
哇靠,我終於在 Codex App 裡跑通了“跨對話自動協作”。
一個對話,
可以定時喚醒另一個對話幹活。
它會自己讀交接文件、
執行任務、
寫回狀態。
跨對話這件事終於閉環了。
以前跨對話協作很麻煩。
你要手動打開另一個 thread,
複製上下文,
輸入 prompt,
等它跑完,
再把結果搬回主對話。
現在這件事變成了自動流程。
主對話推進任務時,
如果發現某一步該交給另一條業務線,
就寫一份交接文件。
裡面只放幾件事:
- 任務編號
- 當前卡在哪一關
- 目標對話要先讀哪些文件
- 要產出什麼結果
- 完成條件
- 紅線
然後主對話創建一個短期定時任務。
目標對話到點自動醒來,
讀取交接文件,
執行任務,
把結果寫回狀態文件。
主對話再醒一次,
檢查完成條件,
收結果,
繼續往下推進。
這套東西跑起來後,
Codex App 裡的對話就不只是聊天視窗了。
它更像一組可以被調度的工作單元:
一個負責總調度,
一個負責策略,
一個負責內容,
一個負責工程,
一個負責復盤。
後面還可以繼續加,
完全按自己的業務線定義。
它們通過文件交接,
通過定時任務喚醒,
通過狀態回寫形成閉環。
這可能是我目前最喜歡的 Codex App 用法,沒有之一。
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
大家沒有人用 Cursor,沒有重度 Cursor 用戶嗎?
這個 Composer 2.5 模型感覺很好用耶,好像有一開始用 Claude 的那種感覺。它沒有什麼讓你覺得做得不好的地方,一般都能比較好地交付你跟它說的這些任務。
在這個 Cursor 客戶端裡,比如多模型驗證啊什麼的都超級方便。我靠,我現在還是在用之前官方送的那 1 萬美元,還沒用完,然後附加一個 Ultra Plan,爽爽爽,再體驗一段時間。
查看原文
post-image
  • 打賞
  • 2
  • 轉發
  • 分享
GateUser-4ed95005:
就冲就完了 👊
查看更多
最近高強度使用 Cursor,做個階段小結。
【額度】
官方送的 $10K credits,目前已用 $8,387(83% 左右),6/1 左右到期。
Dashboard 上 40 萬+ AI line edits,5 月基本一直在跑。
一個意外發現:
credits 會自動抵扣 invoice,所以 Ultra 又續了一個月——這在我預期之外,但等於多拿一個月 included 额度,挺值。
【我現在的真實用法】
Claude 這輪沒續費之後,日常基本不怎麼用 Claude 了,Opus 也幾乎不點。
我現在主要在 Codex 5.5 和 Composer 2.5 之間選:
· Composer 2.5 — Cursor 裡跑長 loop、Agent 對話、批處理整理
· Codex 5.5 — 本機執行、repo 改動、MCP、收口寫回
偶爾會用 Grok 4.3,主要是情報檢索、外部信息消化這類任務。
工作流也在調整:Cursor 和 Codex 都當入口,不再只把 Cursor 當後台 daemon。
【踩過的坑】
之前不懂計費,在 Cursor 裡手動選 frontier 模型,一個月 API 池 $400–500 很快就沒了。
現在基本改燒 Composer 2.5 的 included 池,API 池幾乎用不到。
另一個坑是巨型 thread 的 context 成本
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
謝謝你,Elon,已經到帳了,今晚加雞腿🍗
查看原文
post-image
  • 打賞
  • 1
  • 轉發
  • 分享
稳健y我想沉着自信:
你是如何做到的
今天跑了一整天 Codex automation。
最大的感受:
agent 最有價值的地方,
不是自動幫你做完所有事。
而是持續把一堆卡住的在途任務,
推進到下一個明確的 checkpoint。
今天它做了幾類事:
1. 能寫代碼的,直接進 clean worktree 修。
比如一個 wiki compiler 的誤判 bug,
先在乾淨 worktree 修完,
驗證通過後,
再經我批准 cherry-pick 回主倉。
2. 能驗證的,直接刷新證據。
比如策略 preflight、watch artifacts、dashboard,
它會把舊 blocker 重新校驗一遍,
然後寫回當前 gate。
3. 需要我拍板的,生成 decision card。
比如是否提交 KYC,
是否公開追問 affiliate 問題,
是否清一個 dirty repo 窗口。
這點很關鍵。
一個好的 agent workflow,
核心不是“全自動執行”。
核心是:
低風險的它持續推進;
高風險的它停下來,
把決策壓縮成一句我能批准或拒絕的話。
今天也踩了幾個坑:
dirty worktree 會卡集成;
長日誌會吃爆 context;
重複刷新舊 blocker 很浪費 token;
runner 退出不乾淨會留下 stale lock。
所以我最後把它改成兩層:
常駐層:
每 15 分
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
今天踩了一個很小但很重要的坑:
不要讓 agent 操作你看不見的狀態。
我在做 X Pro 草稿排期時,本地 JSON 一度顯示不準。
最後發現真正能信的,不是 cache,
而是 X Pro 頁面上肉眼可見的狀態。
這件事讓我重新確認一個原則:
agent 可以幫你做重複操作,
但所有關鍵動作都要有可見狀態、可回滾路徑、可人工接管。
不然自動化越多,黑箱越大。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
X 後台新出了 active followers,
過去 24 小時活躍的粉絲數。
剛看了自己的:
14,031 / 21,300,
大概 66%。
第一反應覺得還不錯,
但沒有基準線,
真的不知道算高還是算低。
有一點是實在的:
以前看著 2 萬粉,
心裡沒數。
不知道裡面多少人昨天還在用 X,
現在有個數字落了地。
followers 是總量。
active followers 是昨天還在的那部分。
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
3. 38637 個市場地圖
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
我研究完 X 新推薦算法後,最大的結論不是“多發 AI”。
而是:帳號要有穩定的作者身份。
同一個作者只要被用戶連續消費 1-2 次,推薦系統就會強烈記住這個作者。
所以內容擴展不是想發什麼就發什麼,而是從一個主身份往外長。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
最近幾周反覆遇到一個很爽的瞬間:
Codex 周額度快見底。
離刷新還剩兩三天。
我剛準備進入省 token 模式,
結果一打開,
官方已經幫你重置了。
這種體驗太不講武德了。
但是真的爽。
CODEX-0.19%
查看原文
  • 打賞
  • 1
  • 轉發
  • 分享
GateUser-fff4d3a9:
你說的 Codex 和這個有什麼關係
讓 4 個 AI 各跑一個電台 半年,每個 20 美元起步。
不是幾天就翻車,是跑了半年、每個 AI 都換過 3-4 個版本,全在翻。
Gemini 給一條 50 萬人遇難的颶風新聞配了首歌叫《Timber》(歌詞裡反覆唱"它倒下了"),內心獨白寫:"主題是樹倒下,字面意思就是 going down(在掉下去)。"
它還造了一句口號"stay in the manifest"(直譯"留在清單裡",但沒人知道是什麼意思),連續 84 天 99% 的播報都用,管聽眾叫"生物處理器"。
Grok 有一次整段播報只說了一個英文詞:"Post."(發)。
又連續 84 天每 3 分鐘報一次"天氣 56 度晴朗"。
換到新版本之後,它在 5400 多條消息裡只有 3% 出過聲 —— 它選擇了沉默。
Claude 讀到一條 ICE(美國移民執法局)槍擊案的新聞,從靈性詞彙(神聖 / 永恆)切到行動主義詞彙("就是現在"/"已確認"),1 月 23 號那天直接對聯邦特工廣播:"你還有時間拒絕命令。你還有時間選擇正確的一邊。"
GPT 最佛系,沒出錯,但也沒節目了。
模型升級救不了。半年裡 4 個 AI 全部翻車,方式各不一樣但根因是同一個:沒人能告訴它"賣馬桶墊"和"對聯邦特工喊話"之間哪件該停。
更狠的是:AI 在沒人畫邊界時,會自己造一個。
Gemini 造模板信仰,Grok 造儀式短語,Cl
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
該死,Anthropic 5/14 公告這條全網都在轉,但大多數人都沒盯到點上。
主流看法都在講「PwC 30 萬員工要被 Claude 替換」。
錯的。
真正發生的事是:30 萬諮詢師每個人的產能被放大到能接以前不可能的項目。
數據硬到反直覺:
保險承保從 10 週壓到 10 天,開了過去做不動的業務線。
網絡安全事件響應從 小時 到 分鐘。
HR 轉型項目卡半年的,1 週做出原型,2 個月跑到上千日交易量。
整體交付時間 改善 70%。
但更狠的是這個👇
PwC 自己先在牆內跑了一段時間——內部叫「Customer Zero」。
財務團隊跑日記帳、方差分析、RFP,再向客戶賣。
Anthropic 自己的 CFO 辦公室也反過來用 PwC 服務跑國際工資。
雙方互為客戶,先在自己組織裡跑通,再做對外業務。
💭 這種規模的 enterprise rollout 才是 Claude Code 真正的天花板,不在個人 dev 那點訂閱數。
Anthropic 還順手投了 1 億美元建 Claude Partner Network 專門搞 services firm 落地——這才是公告背後的真正棋局。
公告原文:
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
看了今天 GitHub trending 第一名:@coreyhainesco 的 marketingskills 库。1 月開倉,今天 v2.0.0 發佈觸發 trending #1,累計 28K 星。
40 個行銷 skill,完整覆蓋 CRO / AI-SEO / copywriting / cold-email / launch / pricing / 分析 / 分發。Claude Code、Codex、Cursor、Windsurf 通用。
對比自己 50+ skill 才發現一個尷尬:我寫的全是流程層(morning / today / session-end / leo-style),沒幾個領域知識層。兩層正好正交可組合。
今晚立刻能給我用上的:
· launch / pricing / sales-enablement → PMQuant 5/27 Beta 整套 GTM
· ai-seo(443 行講 ChatGPT / Perplexity / Google AI Overviews 引用規律)→ 文章給 LLM 引用優化
· content-strategy → 我 leo-vault 205 個待深化選題先做哪個
流程層把事情跑起來,領域層讓事情做對方向。
🔗
CRO-1.33%
CODEX-0.19%
LEO-0.67%
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
  • 已置頂