BuilderWorld · 中文圈 AI 驾驶舱
每天用 30 秒掌握 AI
每日 AI 新闻、AI 工具目录、模型排行榜、作品展示 — 全用中文,一站搞定。
Phase 2 升级中
Today / Tools / Models / Learn / Dictionary / Dev 各区块每天会更新。
2026年5月1日星期五
今日 AI NEWS
Mistral Medium 3.5 发布,主打远程 agent
Mistral 把中阶模型往 agent 场景推,暗示连欧洲实验室都认定远程 agent 是下一个主战场。
微软开源 VibeVoice 前沿语音模型
微软把前沿级语音模型开源,自架 TTS 的天花板被拉高,ElevenLabs 这类封闭服务压力变大。
Claude Code 计费 bug:HERMES.md commit 被转到额外用量
Commit 信息里特定文件名会默默把 Claude Code 用量算到较贵方案,揭露 agent 按量计费有多不透明,团队得自己设用量告警。
最新作品
看更多 →最新工具
模型目录
Claude Opus 4.7
anthropic · claude
Anthropic 旗舰推理模型,主打长文本与 agent 工作流
Claude Sonnet 4.6
anthropic · claude
Anthropic 中端主力,擅长写代码和长文推理
Claude Haiku 4.5
anthropic · claude
Anthropic 小型快速款,便宜的工具调用与视觉。
Grok 4
xai · grok
xAI 旗舰推理模型,256K 上下文并接入 X 实时数据
GPT-5 mini
openai · gpt
便宜版 GPT-5,适合大量工具调用与日常 agent 任务
GPT-5
openai · gpt
OpenAI 旗舰推理模型,400K 上下文、原生多模态。
学习区精选
什么时候微调赢 prompt 工程,什么时候不赢
大部分团队太早跳到微调。决策树、实际数字,以及该按什么顺序试。
Agent 记忆策略:从 session 到长期
四层记忆、各自什么时候重要,以及花俏框架跟 50 行自己写的取舍。
怎么大规模评测 LLM 输出质量
三种真的能规模化的 eval —— golden dataset、LLM-as-judge、在线指标,以及什么时候该用哪个。
LLM routing:把简单 query 送到便宜模型
大部分 query 用不到 Opus。简单 router 把成本砍 60-80%,质量损失极小 —— 前提是你盖对。
Speculative decoding:让推理快 2-3 倍
小模型提议 token,大模型并行验证。输出一样,延迟大幅降低。
从 LLM 拿结构化输出:tool use、JSON mode、schema
让模型吐有效 JSON 的三条路、各自什么时候赢,以及 production 上会吓到你的失败模式。
AI 中文词典
问答 (Question answering, QA)
Question answering任务
对用户问题给出直接答案的任务,可分为靠模型内建知识(closed-book)或先检索文档再回答(open-book / RAG)。
情绪分析 (Sentiment analysis)
Sentiment analysis任务
依情绪分类文字(正面、负面、中性,或更细的情绪标签)的任务,广泛用于评论、社交监测、市场研究。
命名实体识别 (NER)
Named entity recognition (NER)任务
从非结构化文字中识别并分类命名实体(人名、组织、地名、日期、产品)的任务。
文字转语音 (TTS)
Text-to-speech (TTS)任务
把文字转成语音的任务,现代 neural TTS 系统(ElevenLabs、OpenAI TTS、Google)能产出接近人声、可复制、有情感、多语言的声音。
语音转文字 (STT / ASR)
Speech-to-text (STT/ASR)任务
把语音转成文字的任务(也叫 ASR,自动语音识别),最广泛使用的模型是 OpenAI 的 Whisper。
图像生成 (Image generation)
Image generation任务
从文字 prompt(text-to-image)或其他输入产生图像的任务,由 Stable Diffusion、DALL-E、Midjourney、Flux、Imagen 等 diffusion 模型处理。
代码生成 (Code generation)
Code generation任务
LLM 根据自然语言描述或现有 code context 写或补全源代码的任务,是 GitHub Copilot、Cursor、Claude Code 背后的核心能力。
机器翻译 (Machine translation)
Machine translation任务
把文字从一种语言自动转成另一种,历史上由 phrase-based 跟 neural 系统主导,现在几乎全由 LLM 处理。
开发者资源
LLM Deploy
★ 186.1K57.2K fork
n8n-io/n8n
n8n-io/n8n· TypeScript
可自托管的可视化工作流平台,原生支持 MCP 与 400+ 集成。
Claude Code Skills
★ 172.9K15.3K fork
obra/superpowers
obra/superpowers· Shell
给 Claude Code 注入 TDD/YAGNI/DRY 纪律的 skill 套件
LLM Deploy
★ 170.3K15.9K fork
ollama/ollama
ollama/ollama· Go
一行命令在本地跑开源 LLM,自带 OpenAI 兼容 API
LLM Deploy
★ 147.5K8.9K fork
langflow-ai/langflow
langflow-ai/langflow· Python
LangChain/LangGraph 可视化拖拽编辑器
LLM Deploy
★ 139.6K21.9K fork
langgenius/dify
langgenius/dify· TypeScript
可自部署的低代码 LLM 应用平台,可视化编排 RAG 与 Agent
LLM Deploy
★ 134.8K19.2K fork
open-webui/open-webui
open-webui/open-webui· Python
自托管 ChatGPT 界面,对接 Ollama 与 OpenAI API

