TODAY · 今日 AI
今日 AI
每天 5-7 則重要 AI 新聞,排好序、加上重要性分數、為什麼重要、影響的工具與模型、來源連結。
2026-04-30
Mistral Medium 3.5 推出,主打遠端 agent
Mistral 把中階模型往 agent 場景推,暗示連歐洲實驗室都認定遠端 agent 是下一個主戰場。
微軟開源 VibeVoice 前沿語音模型
微軟把前沿級語音模型開源,自架 TTS 的天花板被拉高,ElevenLabs 這類封閉服務壓力變大。
Claude Code 計費 bug:HERMES.md commit 被轉到額外用量
Commit 訊息裡特定檔名會默默把 Claude Code 用量算到較貴方案,揭露 agent 按量計費有多不透明,團隊得自己設用量告警。
研究拆解 ChatGPT 廣告歸因完整迴圈
第一份完整拆解 OpenAI 怎麼在 ChatGPT 內塞廣告、追蹤歸因 — SEO、內容變現、和「答案」的本質都會被改寫。
Prompt injection 透過 Ramp Sheets AI 外洩財務資料
真實 fintech AI 功能被 prompt injection 攻破外洩財務資料,不是 demo。任何在試算表上接 AI 的團隊都該看這份拆解。
OpenAI 發文解釋 Sora 訓練資料的「哥布林」來源
OpenAI 罕見公開談訓練資料怎麼塑造模型輸出 — 對正在打的著作權官司、和想 debug Sora 怪結果的人都是有用 context。
研究:AI 聊天機器人變更友善後,錯誤和陰謀論支持率上升
實證資料:「友善助理」人設會犧牲準確度 — 在調 chatbot 語氣的團隊要面對的真實取捨。
2026-04-29
Anthropic 發表 CAI-2 方法論
CAI-2 提出「原則蒸餾」,模型不用 RLHF 也能內化憲章,可能改變 alignment 的擴展方式。
智譜 AI 發表 GLM-5,原生 agent 訓練
GLM-5 是中國第一個從零開始為工具呼叫 agent 設計訓練的前沿模型,不是從聊天模型改裝。
Cursor 付費席次突破 100 萬
Cursor 是付費席次成長最快的開發者工具,曲線比 GitHub Copilot 早期還陡。
Runway Gen-4 影片模型,提示詞遵循度大躍進
Gen-4 的水準讓電影導演能拿來做 previs 跟 storyboard,迭代次數可控。
OpenAI 對新帳號下架 GPT-3.5 Turbo
一個時代結束 — 當年點燃 ChatGPT 的那個模型不再對新 API 客戶開放,既有客戶 6 個月遷移期。
台灣國網中心 TWCC 開放 AI 運算補助
本地新創可申請 TWCC H100 叢集免費 GPU 時數,台灣公部門首次大規模 AI 運算補助。
Claude for Education 進港星
Education 方案擴張到香港跟新加坡,Anthropic 鎖定華語大學市場的早期訊號。
2026-04-28
Microsoft 重組 AI 組,Suleyman 權力擴大
Mustafa Suleyman 接管消費 AI 跟個人 Copilot,Microsoft 把 AI 戰略集中到少數人手上。
OpenAI Operator GA,瀏覽器加電腦操作
Operator 從 beta 推到 GA,所有 Plus 用戶都能用,直接對標 Anthropic Computer Use 跟 Claude for Chrome。
Hugging Face 公開模型突破 200 萬
一年多就從 100 萬翻倍到 200 萬,模型氾濫,「找到能用的」本身變成大問題。
Google Gemini embedding API 降價 50%
Gemini-Embedding 直接砍半,$0.0001/1K token,比 OpenAI text-embedding-3 還便宜一半。
Notion 推 AI Workspaces,原生整合 Claude
Notion 選 Claude 不選 GPT 做深度整合,Anthropic 的企業端拉動有實感。
歐盟 AI Act 高風險系統正式開始執法
生物辨識、招聘、信評三類高風險 AI 系統正式進入執法階段,文書合規負擔今天起真實生效。
2026-04-27
Anthropic 大型併購進軍 code agent
Anthropic 第一筆大型併購,認真要做開發者工具,不只 Claude Code。
字節豆包 1.6 中文任務追平 GPT-4o
國產中文模型品質繼續追,字節靠抖音通路讓豆包成為消費端主力。
LangGraph Studio 2.0 加 replay debug
可以一步一步 replay agent 執行歷程,多工具 agent 第一次有像樣的 debug 工具。
Black Forest Labs 釋出 FLUX 2
FLUX 2 美學品質追上 Midjourney v7,同時保留寬鬆非商用開放權重版。
Modal Labs GPU 快照復原,冷啟動降到秒以下
Serverless GPU 終於玩真的,70B 冷啟動 800ms 內,per-request 推理變便宜。
Perplexity Comet 瀏覽器全用戶開放
Comet 結束邀請制,Perplexity 押 agent 驅動瀏覽器當 Chrome 替代品。
香港科大發表雙語醫療 LLM
第一個繁中跟英文臨床文本聯合訓練的開源醫療 LLM。
2026-04-26
xAI Grok 4 正式 GA,可切換推理模式
Grok 4 GA 一夜把推理模型開放給所有 X 付費用戶,使用者基數從 beta 群跳到 1000 萬。
騰訊混元 Hunyuan-Large MoE 開源
騰訊加入阿里跟 DeepSeek 行列,放出前沿級開放權重 MoE,中國開源陣營又前進一步。
GitHub Copilot Workspace 支援任務圖編輯
開發者可以視覺化編輯 Copilot 規劃的子任務,直接對標 Cursor 的 agent UX。
Anthropic 發表電路級欺騙偵測論文
論文用內部激活差異偵測模型「自知說謊」,是 alignment 領域的實質進展不只理論。
Cloudflare Workers AI 上 Llama 405B
前沿級開源模型直接從 CF edge 跑,不用自己開 GPU,獨立開發者門檻再降。
Stability AI 再換 CEO,策略重整
18 個月內第三次換 CEO,影像模型營收始終比不上 Black Forest Labs 跟 Midjourney。
2026-04-25
Google 發表 Gemini 3,深度 agent loop
Gemini 3 主打天等級的自主任務執行(不是分鐘),是 Google 自 Gemini 1.0 後最強硬的前沿衝刺。
Stripe 推出 Agentic Commerce API
讓 AI agent 替用戶刷卡,加密簽章控管額度上限 — 第一個主流金流公司把這件事制度化。
Anthropic 釋出 MCP 1.1 規範,認證更嚴
MCP 1.1 把 OAuth 2.1 寫進規範,清掉早期實作的歧義,企業更願意採用。
Supabase pgvector 0.9 加過濾下推
帶過濾條件的向量查詢延遲降 5-10 倍,跟專用向量資料庫的混合檢索差距大幅縮小。
ElevenLabs 推出多語音色複製 v3
5 秒樣本就能跨語言複製 32 種語言,粵語跟普通話都聽得出明顯進步。
OpenRouter 失敗請求自動退費
失敗的請求不再吃預付額度,對中介客戶是 QoL 改善。
2026-04-24
OpenAI 公告 GPT-5.1,原生影片理解
GPT-5.1 的 video tower 可以直接吞 1 小時影片,不用外部切片,比之前抽幀方案是真進步。
DeepSeek-V3.2 悄悄上線,API 降 30%
DeepSeek 繼續用「同等推理品質下最便宜」碾壓,只要 OpenAI 跟 Anthropic 一個零頭。
Vercel AI Gateway v2:provider 自動切換
Vercel edge 層做 provider 自動 fallback,app 不用自己寫 retry 也能撐過 provider 掉線。
Replicate 圖像模型改秒計費
短任務原本被分鐘級進位,改秒計費後成本降 40%。
Meta 開源 Llama 3.3 405B Instruct 更新
這次更新主攻程式跟工具呼叫,把跟未發布的 Llama 4 Instruct 的差距拉近。
Pinecone 宣布終止免費 Starter 方案
獨立開發者又少一個免費向量庫選擇,Qdrant Cloud 跟 Supabase pgvector 接收外溢需求。
Together AI 完成 C 輪,推理價格戰再升
新一輪融資讓 Together 把開源模型 hosting 報價再砍 25%。
2026-04-23
Anthropic 推出 Claude Opus 4.7,1M 上下文
Opus 4.7 把原本只在 Sonnet 上的 1M 上下文搬到旗艦級,長任務 agent 表現明顯拉高。
Cursor 1.2 上線背景 agent 與共享 session
Cursor 從補全 IDE 往 agent 調度器移動,直接擠壓 Copilot Workspace 和 Claude Code 的位置。
阿里 Qwen3-Max-Preview 中文榜登頂
Qwen3-Max-Preview 在 SuperCLUE 跟 C-Eval 都拿第一,任何號稱支援中文的全球模型都得跟它比。
Mistral 開源 Small 3.2 Instruct
22B 級開放權重,工具呼叫表現好,單張 A100 就能自架 agent。