BuilderWorld · 中文圈 AI 駕駛艙

每天用 30 秒掌握 AI

每日 AI 新聞、AI 工具目錄、模型排行榜、作品展示 — 全用中文,一站搞定。

Phase 2 升級中

Today / Tools / Models / Learn / Dictionary / Dev 各區塊每天會更新。

2026年4月30日星期四

今日 AI NEWS

看完整今日 → →

深度報導#model-release#mistral#agents

Mistral Medium 3.5 推出,主打遠端 agent

Mistral 把中階模型往 agent 場景推,暗示連歐洲實驗室都認定遠端 agent 是下一個主戰場。

#open-source#voice-ai#microsoft

微軟開源 VibeVoice 前沿語音模型

微軟把前沿級語音模型開源,自架 TTS 的天花板被拉高,ElevenLabs 這類封閉服務壓力變大。

#anthropic#claude-code#billing

Claude Code 計費 bug:HERMES.md commit 被轉到額外用量

Commit 訊息裡特定檔名會默默把 Claude Code 用量算到較貴方案,揭露 agent 按量計費有多不透明,團隊得自己設用量告警。

模型目錄

看完整目錄 → →

Claude Opus 4.7

anthropic · claude

Anthropic 旗艦推理模型，主打長文本與 agent 工作流

1.0M ctxin: $15/Mout: $75/M

Claude Sonnet 4.6

anthropic · claude

Anthropic 中階主力，擅長寫程式與長文推理

200K ctxin: $3/Mout: $15/M

Claude Haiku 4.5

anthropic · claude

Anthropic 小型快速款，便宜的工具呼叫與視覺。

200K ctxin: $1/Mout: $5/M

Grok 4

xai · grok

xAI 旗艦推理模型，256K 脈絡並整合 X 即時資料

256K ctxin: $5/Mout: $15/M

GPT-5 mini

openai · gpt

便宜版 GPT-5,適合大量工具呼叫與日常 agent 任務

200K ctxin: $0.50/Mout: $2/M

GPT-5

openai · gpt

OpenAI 旗艦推理模型，400K 脈絡、原生多模態。

400K ctxin: $10/Mout: $40/M

學習區精選

看更多文章 → →

進階★★★★★9 分鐘

什麼時候微調贏 prompt 工程,什麼時候不贏

大部分團隊太早跳到微調。決策樹、實際數字,以及該按什麼順序試。

進階★★★★★10 分鐘

Agent 記憶策略:從 session 到長期

四層記憶、各自什麼時候重要,以及花俏框架跟 50 行自己寫的取捨。

進階★★★★★10 分鐘

怎麼大規模評測 LLM 輸出品質

三種真的能規模化的 eval —— golden dataset、LLM-as-judge、線上指標,以及什麼時候該用哪個。

進階★★★★★9 分鐘

LLM routing:把簡單 query 送到便宜模型

大部分 query 用不到 Opus。簡單 router 把成本砍 60-80%,品質損失極小 —— 前提是你蓋對。

進階★★★★★10 分鐘

Speculative decoding:讓推論快 2-3 倍

小模型提議 token,大模型平行驗證。輸出一樣,延遲大幅降低。

進階★★★★★9 分鐘

從 LLM 拿結構化輸出:tool use、JSON mode、schema

讓模型吐有效 JSON 的三條路、各自什麼時候贏,以及 production 上會嚇到你的失敗模式。

AI 中文詞典

翻完整詞典 → →

問答 (Question answering, QA)

Question answering

任務

對使用者問題給出直接答案的任務，可分為靠模型內建知識（closed-book）或先檢索文件再回答（open-book / RAG）。

情緒分析 (Sentiment analysis)

Sentiment analysis

任務

依情緒分類文字（正面、負面、中性，或更細的情緒標籤）的任務，廣泛用於評論、社群監測、市場研究。

命名實體辨識 (NER)

Named entity recognition (NER)

任務

從非結構化文字中辨識並分類命名實體（人名、組織、地名、日期、產品）的任務。

文字轉語音 (TTS)

Text-to-speech (TTS)

任務

把文字轉成語音的任務，現代 neural TTS 系統（ElevenLabs、OpenAI TTS、Google）能產出接近人聲、可複製、有情感、多語言的聲音。

語音轉文字 (STT / ASR)

Speech-to-text (STT/ASR)

任務

把語音轉成文字的任務（也叫 ASR，自動語音辨識），最廣泛使用的模型是 OpenAI 的 Whisper。

圖像生成 (Image generation)

Image generation

任務

從文字 prompt（text-to-image）或其他輸入產生圖像的任務，由 Stable Diffusion、DALL-E、Midjourney、Flux、Imagen 等 diffusion 模型處理。

程式碼生成 (Code generation)

Code generation

任務

LLM 根據自然語言描述或現有 code context 寫或補全原始碼的任務，是 GitHub Copilot、Cursor、Claude Code 背後的核心能力。

機器翻譯 (Machine translation)

Machine translation

任務

把文字從一種語言自動轉成另一種，歷史上由 phrase-based 跟 neural 系統主導，現在幾乎全由 LLM 處理。

開發者資源

看完整資源 → →

LLM Deploy

★ 186.1K57.2K fork

n8n-io/n8n

n8n-io/n8n· TypeScript

可自架的視覺化工作流平台，原生支援 MCP 與 400+ 整合。

Claude Code Skills

★ 172.9K15.3K fork

obra/superpowers

obra/superpowers· Shell

替 Claude Code 灌入 TDD/YAGNI/DRY 紀律的 skill 套件

LLM Deploy

★ 170.3K15.9K fork

ollama/ollama

ollama/ollama· Go

一行指令在本機跑開源 LLM，內建 OpenAI 相容 API

LLM Deploy

★ 147.5K8.9K fork

langflow-ai/langflow

langflow-ai/langflow· Python

LangChain/LangGraph 視覺化拖拉編輯器

LLM Deploy

★ 139.6K21.9K fork

langgenius/dify

langgenius/dify· TypeScript

可自架的低程式碼 LLM 應用平台，視覺化編排 RAG 與 Agent

LLM Deploy

★ 134.8K19.2K fork

open-webui/open-webui

open-webui/open-webui· Python

自架 ChatGPT 介面，串 Ollama 與 OpenAI API

每天用 30 秒掌握 AI

今日 AI NEWS

Mistral Medium 3.5 推出,主打遠端 agent

微軟開源 VibeVoice 前沿語音模型

Claude Code 計費 bug:HERMES.md commit 被轉到額外用量

最新作品

Parcel 給所有人的用的線上獨立交付工具

AlphaForge

最新工具

ChatGPT

Krea Video

LTX Studio

NotebookLM

Elicit

Fish Audio

Topaz Video AI

WPS AI

模型目錄

Claude Opus 4.7

Claude Sonnet 4.6

Claude Haiku 4.5

Grok 4

GPT-5 mini

GPT-5

學習區精選

什麼時候微調贏 prompt 工程,什麼時候不贏

Agent 記憶策略:從 session 到長期

怎麼大規模評測 LLM 輸出品質

LLM routing:把簡單 query 送到便宜模型

Speculative decoding:讓推論快 2-3 倍

從 LLM 拿結構化輸出:tool use、JSON mode、schema

AI 中文詞典

問答 (Question answering, QA)

情緒分析 (Sentiment analysis)

命名實體辨識 (NER)

文字轉語音 (TTS)

語音轉文字 (STT / ASR)

圖像生成 (Image generation)

程式碼生成 (Code generation)

機器翻譯 (Machine translation)

開發者資源

n8n-io/n8n

obra/superpowers

ollama/ollama

langflow-ai/langflow

langgenius/dify

open-webui/open-webui