BrowserUse融资1700万美元:AI智能体轻松读懂网页的新篇章

在当下这个AI智能体如繁星般爆发的时代,Browser Use宛如一颗异军突起的璀璨新星✨,刚刚成功斩获了1700万美元的融资,瞬间成为行业焦点。
它究竟有何神奇之处呢🧐?原来,Browser Use拥有一项令人瞩目的能力——能让AI智能体轻松地「读懂」网站,并自动完成那些复杂无比的任务。这一创举,无疑引领了一波AI应用的热潮,让整个行业都为之沸腾!
说到AI智能体,目前或许还没有一个能让所有人都拍手称快、一致认可的定义🤔。但这丝毫没有影响到一大波创业公司如过江之鲫般,竞相投入到打造智能体工具的热潮中,试图通过这些工具来实现各种任务的自动化处理,在这片新兴领域中抢占一席之地。
而在众多公司里,有一家名为Browser Use的公司,就像一块强大的磁石🧲,格外吸引开发者与投资人的目光。原因很简单,他们所研发的工具,极大地降低了智能体「读懂」网站的难度,为AI智能体在网页领域的应用开辟了更为广阔的道路。
📢据最新消息报道,Browser Use刚刚完成了一笔高达1700万美元的种子轮融资。此次融资由Felicis的Astasia Myers领投,Paul Graham、A Capital和Nexus Venture Partners纷纷跟投。值得一提的是,这次融资此前从未被报道过,犹如一颗重磅炸弹,在行业内掀起了阵阵波澜。

网站地址:https://browser-use.com
尤其是爆火的Manus也采用了Browser Use工具,这无疑是给Browser Use的知名度添了一把大火,将其推上了一个新的高度。
Browser Use的诞生,离不开两位极具创造力的创办人——Magnus Müller和Gregor Zunic。去年,他们借助苏黎世联邦理工学院的创业加速器,开启了这个意义非凡的项目。
Müller在网页抓取工具领域深耕多年。2024年,当他攻读数据科学硕士学位时,结识了Zunic。两人一拍即合,经过深入探讨与思考,萌生了一个大胆而创新的想法:将网页抓取技术与数据科学巧妙融合,旨在让浏览器能够自主完成各种任务。
说干就干,Müller和Zunic仅用了短短五周时间,就成功打造出了Browser Use的首个演示版本(demo)。这个demo一经推出,便如一颗投入平静湖面的巨石,瞬间激起千层浪,在业内引起了巨大的反响。之后,他们秉持着开放共享的精神,干脆将Browser Use开源,让更多人能够从中受益。
简单来讲,Browser Use的独特之处在于,它能够把网站上那些复杂的按钮和元素,巧妙地拆解成一种更易于理解、更接近「文本」形式的格式,以供智能体使用。这一创新之举,帮助AI智能体能够清晰地了解网页上的各种选项,进而自主做出合理的决策。
Müller曾这样说:「许多智能体依赖视觉系统,通过截图来浏览网站,但这种方式在实际操作中常常状况百出。而我们所做的,是把网站转化为智能体能够轻松理解的形式。采用这种方法,我们能够以更低的成本,反复运行相同的任务。」
随着越来越多的AI公司期望他们的智能体与网站之间实现更加流畅的交互,Müller敏锐地察觉到,Browser Use完全有潜力成为满足这些需求的「底层技术」。他还透露,目前在Y Combinator冬季班里,已有20多家公司在借助Browser Use来满足自身业务需求。
甚至有些公司主动找上门来,询问他们如何才能让智能体更顺畅地浏览自家网站。Müller举例说道:「像LinkedIn这样的网站,频繁对网站功能进行调整与改变,在这种情况下,智能体就经常会出现运行错误。」
Felicis的Myers表示,过去几年他们一直密切关注着AI智能体领域的动态发展,而Browser Use的出现,无疑是一个绝佳的投资机会。她直言,Browser Use的创始团队——以及他们以开源为先的发展策略——深深打动了自己。
Myers说道:「我们坚信,网页AI智能体将是下一个前沿技术领域,它有能力真正实现人类任务的端到端自动化。网页AI智能体宛如一座动态的桥梁,巧妙地连接起静态的预训练模型与不断变化的数字世界。要知道,这些静态模型往往只专注于文本处理。」
Browser Use:引领智能体轻松驾驭网页的新时代
Browser Use凭借其独特的优势,真正做到了让AI智能体简单、高效地浏览网页。目前,它已在GitHub上开源,其强大的功能吸引了众多项目纷纷使用。截至目前,Browser Use在GitHub上已经收获了超过47k个Star,这无疑是对它的高度认可与赞誉。
Browser Use的出现,为智能体领域带来了全新的发展思路与方向,相信在未来,它还将继续绽放光芒,为科技进步做出更大的贡献。
Browser Use堪称智能领域的一大创举,它具备强大的功能,能够精准提取网站的各类交互元素,像按钮、表单这类关键元素都在其“掌控”之中。凭借这一独特优势,AI得以实现自动化执行浏览器操作,操作过程行云流水般顺畅。
这些操作涵盖范围广泛,既可以轻松填写表单,快速输入各类信息;也能够高效搜索信息,精准定位所需内容;还能够自如导航网页,在不同页面间灵活切换。
而这一切,对于开发AI驱动的网络智能体来说,其价值不可估量。它就像是为网络智能体的开发打开了一扇通往无限可能的大门,提供了坚实有力的支撑。
举个生动的例子,在如今便捷的网购场景中,Browser Use的作用就发挥得淋漓尽致。它能够自动将你心仪的商品添加到购物车,然后有条不紊地完成结账流程,真正实现购物全程自动化,为用户带来前所未有的便捷体验。
项目地址:https://github.com/browser-use/browser-use

甚至是阅读你的简历,然后帮你找工作!中途如果有需要,还会停下来等待你的指示。
它也可以帮你干活儿。
比如说,借助Browser Use的强大功能,我们能够让它在Hugging Face这样专业的模型库平台上大展身手。它可以精准地查找那些具有cc-by-sa-4.0许可证的模型,然后按照点赞数对这些模型进行排序,最后将排名最靠前的5个模型妥善保存到文件之中。整个过程一气呵成,高效又准确,充分展现了Browser Use在自动化执行复杂任务方面的卓越能力。
从MCP到Browser Use:一个现象级工具的崛起
Browser Use的火爆并非偶然,它是伴随着智能体领域的迅猛发展而逐渐崭露头角的。
去年11月,Anthropic做出了一项具有开创性意义的举动——首次提出了「模型上下文协议」,也就是我们所说的MCP。这一协议的出现,犹如给Claude模型注入了一股强大的能量,赋予了它超级能力。通过一次构建,便让AI与工作流实现了深度集成,开启了智能应用的全新篇章。
用更加通俗易懂的话来解释,MCP就好比是专门为AI应用精心打造的通用接口,这就类似于我们日常生活中随处可见、广泛使用的USB-C接口。
大家都知道,USB-C接口的出现,极大地简化了不同设备与计算机之间的连接方式,让设备之间的数据传输和交互变得更加便捷高效。同样的道理,MCP简化了AI模型与数据、工具以及服务之间的交互方式。它就像是一座搭建在AI模型与各种资源之间的桥梁,让信息的流通更加顺畅无阻。
借助MCP的神奇力量,AI助手所能做到的远远超出了我们的想象。它不仅能够轻松地「读懂」代码,还具备了「理解」团队讨论内容、各类相关文档等外部信息的能力。如此一来,AI助手在面对各种问题时,就能提供更加精准、全面的回答,为用户带来更加优质、高效的服务体验。

今年1月,OpenAI推出了Operator,能够自主执行网络任务,如规划假期、填写表单或预订餐厅 (OpenAI Launches Operator)。Operator使用名为Computer-Using Agent (CUA)的AI智能体,通过视觉界面控制网页浏览器,模拟人类点击、输入和滚动的操作。这一工具展示了AI智能体在网络任务自动化中的潜力,但也需要用户在遇到复杂界面或验证码时介入。