Agent Framework
browser-use/browser-use
browser-use/browser-use· Python
讓任何 LLM 透過 Playwright 操作真實瀏覽器
GitHub 數據
- Stars
- 91,196
- Forks
- 10,389
- Watchers
- 429
- Open issues
- 239
meta
- License
- MIT
- 主要語言
- Python
- 最後 commit
- 2026-04-26
- 數據抓取時間
- 2026-04-29
browser-use 是 Python 寫的瀏覽器 agent 框架,把網頁解析成結構化的可點擊元素餵給 LLM,再透過 Playwright 執行多步驟任務,例如填表、爬資料、訂票、查資料。支援 OpenAI、Anthropic、Gemini、Ollama 本地模型等。`pip install browser-use` 後給它一個自然語言目標,就會自動操作 Chromium 完成。
編輯試用心得
想讓 LLM 真的會用瀏覽器,這是現在的首選。比自己手刻 Playwright + 截圖迴圈穩定許多,DOM 解析路線的準確率也比純視覺 agent 高。代價是 token 成本隨頁面複雜度上升,遇到強反爬或奇怪 UI 還是會掛。如果任務有 API 或 `requests` 就能解決,別繞道瀏覽器,那永遠更便宜可靠。