BuilderWorld · 中文圈 AI 駕駛艙
每天用 30 秒掌握 AI
每日 AI 新聞、AI 工具目錄、模型排行榜、作品展示 — 全用中文,一站搞定。
Phase 2 升級中
Today / Tools / Models / Learn / Dictionary / Dev 各區塊每天會更新。
2026年4月30日星期四
今日 AI NEWS
Mistral Medium 3.5 推出,主打遠端 agent
Mistral 把中階模型往 agent 場景推,暗示連歐洲實驗室都認定遠端 agent 是下一個主戰場。
微軟開源 VibeVoice 前沿語音模型
微軟把前沿級語音模型開源,自架 TTS 的天花板被拉高,ElevenLabs 這類封閉服務壓力變大。
Claude Code 計費 bug:HERMES.md commit 被轉到額外用量
Commit 訊息裡特定檔名會默默把 Claude Code 用量算到較貴方案,揭露 agent 按量計費有多不透明,團隊得自己設用量告警。
最新作品
看更多 →最新工具
模型目錄
Claude Opus 4.7
anthropic · claude
Anthropic 旗艦推理模型,主打長文本與 agent 工作流
Claude Sonnet 4.6
anthropic · claude
Anthropic 中階主力,擅長寫程式與長文推理
Claude Haiku 4.5
anthropic · claude
Anthropic 小型快速款,便宜的工具呼叫與視覺。
Grok 4
xai · grok
xAI 旗艦推理模型,256K 脈絡並整合 X 即時資料
GPT-5 mini
openai · gpt
便宜版 GPT-5,適合大量工具呼叫與日常 agent 任務
GPT-5
openai · gpt
OpenAI 旗艦推理模型,400K 脈絡、原生多模態。
學習區精選
什麼時候微調贏 prompt 工程,什麼時候不贏
大部分團隊太早跳到微調。決策樹、實際數字,以及該按什麼順序試。
Agent 記憶策略:從 session 到長期
四層記憶、各自什麼時候重要,以及花俏框架跟 50 行自己寫的取捨。
怎麼大規模評測 LLM 輸出品質
三種真的能規模化的 eval —— golden dataset、LLM-as-judge、線上指標,以及什麼時候該用哪個。
LLM routing:把簡單 query 送到便宜模型
大部分 query 用不到 Opus。簡單 router 把成本砍 60-80%,品質損失極小 —— 前提是你蓋對。
Speculative decoding:讓推論快 2-3 倍
小模型提議 token,大模型平行驗證。輸出一樣,延遲大幅降低。
從 LLM 拿結構化輸出:tool use、JSON mode、schema
讓模型吐有效 JSON 的三條路、各自什麼時候贏,以及 production 上會嚇到你的失敗模式。
AI 中文詞典
問答 (Question answering, QA)
Question answering任務
對使用者問題給出直接答案的任務,可分為靠模型內建知識(closed-book)或先檢索文件再回答(open-book / RAG)。
情緒分析 (Sentiment analysis)
Sentiment analysis任務
依情緒分類文字(正面、負面、中性,或更細的情緒標籤)的任務,廣泛用於評論、社群監測、市場研究。
命名實體辨識 (NER)
Named entity recognition (NER)任務
從非結構化文字中辨識並分類命名實體(人名、組織、地名、日期、產品)的任務。
文字轉語音 (TTS)
Text-to-speech (TTS)任務
把文字轉成語音的任務,現代 neural TTS 系統(ElevenLabs、OpenAI TTS、Google)能產出接近人聲、可複製、有情感、多語言的聲音。
語音轉文字 (STT / ASR)
Speech-to-text (STT/ASR)任務
把語音轉成文字的任務(也叫 ASR,自動語音辨識),最廣泛使用的模型是 OpenAI 的 Whisper。
圖像生成 (Image generation)
Image generation任務
從文字 prompt(text-to-image)或其他輸入產生圖像的任務,由 Stable Diffusion、DALL-E、Midjourney、Flux、Imagen 等 diffusion 模型處理。
程式碼生成 (Code generation)
Code generation任務
LLM 根據自然語言描述或現有 code context 寫或補全原始碼的任務,是 GitHub Copilot、Cursor、Claude Code 背後的核心能力。
機器翻譯 (Machine translation)
Machine translation任務
把文字從一種語言自動轉成另一種,歷史上由 phrase-based 跟 neural 系統主導,現在幾乎全由 LLM 處理。
開發者資源
LLM Deploy
★ 186.1K57.2K fork
n8n-io/n8n
n8n-io/n8n· TypeScript
可自架的視覺化工作流平台,原生支援 MCP 與 400+ 整合。
Claude Code Skills
★ 172.9K15.3K fork
obra/superpowers
obra/superpowers· Shell
替 Claude Code 灌入 TDD/YAGNI/DRY 紀律的 skill 套件
LLM Deploy
★ 170.3K15.9K fork
ollama/ollama
ollama/ollama· Go
一行指令在本機跑開源 LLM,內建 OpenAI 相容 API
LLM Deploy
★ 147.5K8.9K fork
langflow-ai/langflow
langflow-ai/langflow· Python
LangChain/LangGraph 視覺化拖拉編輯器
LLM Deploy
★ 139.6K21.9K fork
langgenius/dify
langgenius/dify· TypeScript
可自架的低程式碼 LLM 應用平台,視覺化編排 RAG 與 Agent
LLM Deploy
★ 134.8K19.2K fork
open-webui/open-webui
open-webui/open-webui· Python
自架 ChatGPT 介面,串 Ollama 與 OpenAI API

