83K stars 的 browser-use 实测:AI 浏览器自动化终极指南
GitHub 83K stars,AI 浏览器自动化顶流项目。今天实测 browser-use,看看它能不能帮你自动下单、填表、爬数据……
项目速览
GitHub Trending 又炸了——browser-use 冲上 83K stars,单日暴涨 1,160。

这项目到底什么来头?一句话概括:
让 AI 代理直接操控浏览器,自动完成各类线上任务。
听起来有点魔幻?我用了一小时上手实测,发现它确实可以:
- ✅ 自动下单购物
- ✅ 自动填写并提交表单
- ✅ 自动爬取网页数据
- ✅ 自动投递职位申请
最舒服的是: 你只需要用自然语言描述任务,AI 自己找到按钮、输入内容、点击提交。
这篇文章,带你从零搭建 browser-use,并结合对比讲讲它与 OpenClaw、Claude Code 的区别。
01. browser-use 是什么?
官方解释: 让网站对 AI 代理变得可访问。
直白点说: 给 AI 一个浏览器,让它像人一样在网上干活。
核心能力
| 能力 | 说明 |
| 自然语言驱动 | 说“帮我买菜”,AI 自己打开站点、加购物车、结算 |
| 多模型适配 | 支持 Google Gemini、Anthropic Claude,以及自家的 ChatBrowserUse |
| 本地 + 云端 | 可在本地免费运行,也能使用付费云服务(更稳定) |
| CLI 命令行 | 一条命令操控浏览器,适合嵌入自动化流程 |
| Claude Code 技能 | 可直接作为 Claude Code 的插件调用 |
技术栈
语言:Python 3.11+
浏览器:Chromium(默认),可配置 Chrome / Firefox
AI 模型:支持主流 LLM(Gemini、Claude、Ollama 本地模型)
许可证:MIT(开源免费)
02. 5 分钟快速上手
第一步:安装
# 1. 使用 uv 初始化项目(推荐)
uv init && uv add browser-use && uv sync
# 2. 或者用 pip
pip install browser-use
# 3. 安装浏览器
uvx browser-use install
第二步:配置 API Key(可选)
# .env 文件
BROWSER_USE_API_KEY=your-key # 只有用云服务才需要
GOOGLE_API_KEY=your-key # 使用 Gemini
ANTHROPIC_API_KEY=your-key # 使用 Claude
想零成本入手? 直接用 Ollama 本地模型,完全免费。
第三步:运行第一个任务
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio
async def main():
browser = Browser()
agent = Agent(
task="Find the number of stars of the browser-use repo",
llm=ChatBrowserUse(),
browser=browser,
)
await agent.run()
if __name__ == "__main__":
asyncio.run(main())
运行效果: AI 自动打开浏览器 → 搜索 GitHub → 定位 browser-use 仓库 → 抓取 stars 数量 → 返回结果。
03. 真实场景:它能帮你做什么?
场景 1:自动下单买菜
agent = Agent(
task="Buy milk, eggs, and bread from Instacart",
llm=ChatGoogle(model='gemini-2.0-flash-preview'),
)
await agent.run()
AI 会: 打开 Instacart → 搜索商品 → 加入购物车 → 结算(需要预先配置支付信息)。
场景 2:自动投递职位
agent = Agent(
task="Apply to software engineer jobs on LinkedIn",
llm=ChatAnthropic(model='claude-sonnet-4-6'),
)
await agent.run()
AI 会: 搜索职位 → 按条件过滤 → 填写申请表 → 上传简历 → 提交。
场景 3:自动爬取数据
agent = Agent(
task="Scrape the top 10 trending repos from GitHub",
llm=ChatBrowserUse(),
)
await agent.run()
AI 会: 打开 GitHub Trending → 提取信息 → 输出 JSON / CSV。
场景 4:命令行快速操作
# 打开网页
browser-use open https://example.com
# 查看可点击元素
browser-use state
# 点击第 5 个元素
browser-use click 5
# 输入文字
browser-use type "Hello"
# 截图
browser-use screenshot page.png
# 关闭
browser-use close
适合: 快速测试、集成到自动化脚本。
04. 对比:browser-use vs OpenClaw vs Claude Code
| 维度 | browser-use | OpenClaw | Claude Code |
| 定位 | 浏览器自动化 | 个人 AI 助手 | AI 编程助手 |
| 核心能力 | 操控浏览器 | 多工具集成 | 代码生成与修改 |
| 交互方式 | Python / CLI | 自然语言对话 | IDE 内对话 |
| 浏览器控制 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
| 代码能力 | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 本地部署 | ✅ 完全免费 | ✅ 完全免费 | ❌ 需订阅 |
| 上手难度 | 中(需 Python) | 低(自然语言) | 低(IDE 集成) |
如何选择?
- 浏览器自动化: → browser-use
- 个人助理(日程、提醒、写作): → OpenClaw
- 写代码: → Claude Code
最佳体验: 三者搭配使用,各自发挥优势。
实测感受与翻车现场
✅ 优点
- 真的可以自动执行任务——并非 PPT 项目
- 上手快——五分钟跑通第一个任务
- 文档清晰——示例丰富
- 开源免费——本地运行零成本
- 社区活跃——83K stars,讨论氛围好
❌ 缺点
- 需要 Python 基础——对纯小白不太友好
- 本地环境依赖多——Chromium + Python 容易踩坑
- 复杂任务易出错——AI 理解偏差会乱点
- 登录态处理麻烦——需要配置浏览器 profile
- CAPTCHA 无解——本地版遇到验证码就会卡住(云服务可缓解)
⚠️ 翻车现场
测试“自动投递 GitHub 职位”时,AI 的骚操作:
- 把“Remote”点成了“Hybrid”
- 上传简历时点错文件
- 提交前卡住(需要人工确认)
结论: 简单流程交给 AI 放飞自我,复杂操作留人工监督。
05. 收费模式
本地部署(免费)
- 软件本身:免费(MIT 许可)
- 浏览器:免费(Chromium)
- AI 模型:Ollama 本地模型 → 免费;Google Gemini → 免费额度 + 付费;Anthropic Claude → 付费
云服务(付费)
按 Token 计费:
输入:$0.20 / 1M tokens 输出:$2.00 / 1M tokens优势:免配置、防指纹检测、自带代理、可解决验证码
建议: 先用本地方案免费尝试,明确需求后再上云。
06. 适合哪些人?
✅ 推荐
- 测试工程师——自动化回归流程
- 运营人员——批量管理后台、采集数据
- 开发者——嵌入自动化脚本
- 研究人员——大规模数据采集
- 副业探索者——自动化电商、套利操作
❌ 不推荐
- 纯小白——需要 Python 基础
- 完全想躺平的用户——复杂任务仍需人工监督
- 有严重验证码的网站——本地版无法应对
快速启动模板
想直接跑起来?用官方模板生成器:
# 生成默认模板
uvx browser-use init --template default
# 生成带详细注释的高级模板
uvx browser-use init --template advanced
# 自定义输出路径
uvx browser-use init --template default --output my_agent.py
模板包含: 完整配置示例、详细注释,可直接运行。
相关链接
- GitHub:https://github.com/browser-use/browser-use
- 文档:https://docs.browser-use.com
- 云服务:https://cloud.browser-use.com
- Discord 社区:https://link.browser-use.com/discord
- 官方示例:https://github.com/browser-use/browser-use/tree/main/examples
总结
browser-use 会火不是意外——它确实解决了“AI 操作浏览器”这个老痛点。
但别幻想它能完全替代人工:
- ✅ 简单、重复的任务 → 放心让 AI 跑
- ⚠️ 复杂、关键流程 → AI 辅助 + 人工确认
- ❌ 涉及验证码、风控的场景 → 上云服务或放弃
如果你对 AI 工具实战与测试自动化感兴趣,欢迎持续关注,我们一起少走弯路。