BuilderWorld · 中文圈 AI 驾驶舱

每天用 30 秒掌握 AI

每日 AI 新闻、AI 工具目录、模型排行榜、作品展示 — 全用中文,一站搞定。

Phase 2 升级中

Today / Tools / Models / Learn / Dictionary / Dev 各区块每天会更新。

2026年5月1日星期五

今日 AI NEWS

看完整今日 → →

深度报道#model-release#mistral#agents

Mistral Medium 3.5 发布,主打远程 agent

Mistral 把中阶模型往 agent 场景推,暗示连欧洲实验室都认定远程 agent 是下一个主战场。

#open-source#voice-ai#microsoft

微软开源 VibeVoice 前沿语音模型

微软把前沿级语音模型开源,自架 TTS 的天花板被拉高,ElevenLabs 这类封闭服务压力变大。

#anthropic#claude-code#billing

Claude Code 计费 bug:HERMES.md commit 被转到额外用量

Commit 信息里特定文件名会默默把 Claude Code 用量算到较贵方案,揭露 agent 按量计费有多不透明,团队得自己设用量告警。

模型目录

看完整目录 → →

Claude Opus 4.7

anthropic · claude

Anthropic 旗舰推理模型，主打长文本与 agent 工作流

1.0M ctxin: $15/Mout: $75/M

Claude Sonnet 4.6

anthropic · claude

Anthropic 中端主力，擅长写代码和长文推理

200K ctxin: $3/Mout: $15/M

Claude Haiku 4.5

anthropic · claude

Anthropic 小型快速款，便宜的工具调用与视觉。

200K ctxin: $1/Mout: $5/M

Grok 4

xai · grok

xAI 旗舰推理模型，256K 上下文并接入 X 实时数据

256K ctxin: $5/Mout: $15/M

GPT-5 mini

openai · gpt

便宜版 GPT-5,适合大量工具调用与日常 agent 任务

200K ctxin: $0.50/Mout: $2/M

GPT-5

openai · gpt

OpenAI 旗舰推理模型，400K 上下文、原生多模态。

400K ctxin: $10/Mout: $40/M

学习区精选

看更多文章 → →

进阶★★★★★9 分钟

什么时候微调赢 prompt 工程,什么时候不赢

大部分团队太早跳到微调。决策树、实际数字,以及该按什么顺序试。

进阶★★★★★10 分钟

Agent 记忆策略:从 session 到长期

四层记忆、各自什么时候重要,以及花俏框架跟 50 行自己写的取舍。

进阶★★★★★10 分钟

怎么大规模评测 LLM 输出质量

三种真的能规模化的 eval —— golden dataset、LLM-as-judge、在线指标,以及什么时候该用哪个。

进阶★★★★★9 分钟

LLM routing:把简单 query 送到便宜模型

大部分 query 用不到 Opus。简单 router 把成本砍 60-80%,质量损失极小 —— 前提是你盖对。

进阶★★★★★10 分钟

Speculative decoding:让推理快 2-3 倍

小模型提议 token,大模型并行验证。输出一样,延迟大幅降低。

进阶★★★★★9 分钟

从 LLM 拿结构化输出:tool use、JSON mode、schema

让模型吐有效 JSON 的三条路、各自什么时候赢,以及 production 上会吓到你的失败模式。

AI 中文词典

翻完整词典 → →

问答 (Question answering, QA)

Question answering

任务

对用户问题给出直接答案的任务，可分为靠模型内建知识（closed-book）或先检索文档再回答（open-book / RAG）。

情绪分析 (Sentiment analysis)

Sentiment analysis

任务

依情绪分类文字（正面、负面、中性，或更细的情绪标签）的任务，广泛用于评论、社交监测、市场研究。

命名实体识别 (NER)

Named entity recognition (NER)

任务

从非结构化文字中识别并分类命名实体（人名、组织、地名、日期、产品）的任务。

文字转语音 (TTS)

Text-to-speech (TTS)

任务

把文字转成语音的任务，现代 neural TTS 系统（ElevenLabs、OpenAI TTS、Google）能产出接近人声、可复制、有情感、多语言的声音。

语音转文字 (STT / ASR)

Speech-to-text (STT/ASR)

任务

把语音转成文字的任务（也叫 ASR，自动语音识别），最广泛使用的模型是 OpenAI 的 Whisper。

图像生成 (Image generation)

Image generation

任务

从文字 prompt（text-to-image）或其他输入产生图像的任务，由 Stable Diffusion、DALL-E、Midjourney、Flux、Imagen 等 diffusion 模型处理。

代码生成 (Code generation)

Code generation

任务

LLM 根据自然语言描述或现有 code context 写或补全源代码的任务，是 GitHub Copilot、Cursor、Claude Code 背后的核心能力。

机器翻译 (Machine translation)

Machine translation

任务

把文字从一种语言自动转成另一种，历史上由 phrase-based 跟 neural 系统主导，现在几乎全由 LLM 处理。

开发者资源

看完整资源 → →

LLM Deploy

★ 186.1K57.2K fork

n8n-io/n8n

n8n-io/n8n· TypeScript

可自托管的可视化工作流平台，原生支持 MCP 与 400+ 集成。

Claude Code Skills

★ 172.9K15.3K fork

obra/superpowers

obra/superpowers· Shell

给 Claude Code 注入 TDD/YAGNI/DRY 纪律的 skill 套件

LLM Deploy

★ 170.3K15.9K fork

ollama/ollama

ollama/ollama· Go

一行命令在本地跑开源 LLM，自带 OpenAI 兼容 API

LLM Deploy

★ 147.5K8.9K fork

langflow-ai/langflow

langflow-ai/langflow· Python

LangChain/LangGraph 可视化拖拽编辑器

LLM Deploy

★ 139.6K21.9K fork

langgenius/dify

langgenius/dify· TypeScript

可自部署的低代码 LLM 应用平台，可视化编排 RAG 与 Agent

LLM Deploy

★ 134.8K19.2K fork

open-webui/open-webui

open-webui/open-webui· Python

自托管 ChatGPT 界面，对接 Ollama 与 OpenAI API

每天用 30 秒掌握 AI

今日 AI NEWS

Mistral Medium 3.5 发布,主打远程 agent

微软开源 VibeVoice 前沿语音模型

Claude Code 计费 bug:HERMES.md commit 被转到额外用量

最新作品

Parcel 給所有人的用的線上獨立交付工具

AlphaForge

最新工具

ChatGPT

Krea Video

LTX Studio

NotebookLM

Elicit

Fish Audio

Topaz Video AI

WPS AI

模型目录

Claude Opus 4.7

Claude Sonnet 4.6

Claude Haiku 4.5

Grok 4

GPT-5 mini

GPT-5

学习区精选

什么时候微调赢 prompt 工程,什么时候不赢

Agent 记忆策略:从 session 到长期

怎么大规模评测 LLM 输出质量

LLM routing:把简单 query 送到便宜模型

Speculative decoding:让推理快 2-3 倍

从 LLM 拿结构化输出:tool use、JSON mode、schema

AI 中文词典

问答 (Question answering, QA)

情绪分析 (Sentiment analysis)

命名实体识别 (NER)

文字转语音 (TTS)

语音转文字 (STT / ASR)

图像生成 (Image generation)

代码生成 (Code generation)

机器翻译 (Machine translation)

开发者资源

n8n-io/n8n

obra/superpowers

ollama/ollama

langflow-ai/langflow

langgenius/dify

open-webui/open-webui