Agent Framework
browser-use/browser-use
browser-use/browser-use· Python
让任何 LLM 通过 Playwright 操控真实浏览器
GitHub 数据
- Stars
- 91,196
- Forks
- 10,389
- Watchers
- 429
- Open issues
- 239
meta
- License
- MIT
- 主要语言
- Python
- 最后 commit
- 2026-04-26
- 数据抓取时间
- 2026-04-29
browser-use 是 Python 写的浏览器 agent 框架,把网页解析成结构化的可点击元素喂给 LLM,再通过 Playwright 执行多步骤任务,比如填表、爬数据、订票、做调研。支持 OpenAI、Anthropic、Gemini、Ollama 本地模型等。`pip install browser-use` 后给它一句自然语言目标,就会自动操作 Chromium 跑完整流程。
编辑试用心得
想让 LLM 真正会用浏览器,这是当下首选。比自己手撸 Playwright + 截图循环稳定很多,DOM 解析路线的准确率也优于纯视觉 agent。代价是 token 成本随页面复杂度上涨,遇到强反爬或异形 UI 仍然会翻车。如果任务有 API 或 `requests` 就能搞定,别绕到浏览器去,那永远更便宜可靠。