开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

最近几天，Anthropic 发布的智能体工具 Cowork 在 X 上爆火。

有趣的是，CAMEL AI 早前的一个开源项目 Eigent，因为和 Cowork 高度相似，作为开源平替，也跟着火了一把。

这条「自嘲式」推特帖子，截止今天，一共有 8000+点赞，150 万浏览量。

简单来说，Eigent 是一个桌面端应用，通过访问本地文件和操作系统，来完成现实世界的工作任务。

这条帖子爆火后，CAMEL AI 团队复盘了他们从 2023 年发布 CAMEL 框架开始，到 Eigent 项目的三年探索经历。

对 Agent 的思考，

从 CAMEL 框架开始

2023 年 3 月，我们发布了第一个基于大语言模型的多智能体协作框架 CAMEL。最初的想法很简单：如果让多个 AI 智能体像人一样分工、交流、合作，能不能解决更复杂的问题？

上线后一周，CAMEL 获得了 4000 多个 GitHub Star，论文也被 NeurIPS 接收，Andrew Ng 还在 NeurIPS 现场用手机拍了 CAMEL 论文的 poster。

CAMEL 论文链接: https://arxiv.org/abs/2303.17760

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

CAMEL 不仅是一个框架，也是我们对智能体核心能力的早期实验场。我们为智能体装备了搜索、终端、代码编辑器等基础工具，试图让它们不仅能「想」，更能「做「，能够在真实环境中获取信息、执行代码、验证结果。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

这个「思考-行动-反馈」的闭环设计，成了我们所有后续工作的基石。我们基于这些思考，整合出了一个早期的、能真实执行任务的智能体原型。可以说，今天 Eigent 产品的许多设计灵感和架构雏形，都深深烙印着那段时期的探索。

这里也要跟大家回顾一下 CAMEL 一直在探索 Agent 的 Scaling laws 的三个维度：

智能体的数量（Number of agents）：大规模智能体系统能够涌现出什么单智能体不能解决的问题，比如说社交网络等复杂系统模拟；
环境（Environment）：拓展智能体在复杂、多样化世界中感知、行动和学习的边界；
自我进化的扩展（Evolution）：探索智能体从经验中强化学习、持续学习、技能习得、记忆构建的能力；

对 Scaling Environment 的追求，在 2023 年底催生了 CRAB 项目。我们当时怀揣一个大胆的设想：能否打造一个数字世界的通用智能体？在我们看来，人类在数字空间中最通用的「工具」，就是手机和电脑。如果智能体能像人一样操作这些设备，岂不是就能跨应用、跨平台完成几乎所有任务？

为此，我们开始了让智能体学习操控真实操作系统（如 Android、Ubuntu）的探索。几乎在同一时期，学术界也涌现了如 OS World（它后来成为了该领域的标准评测基准）和 AppAgent 等优秀工作，大家在不同的路径上，朝着相似的愿景努力。

CRAB 论文链接: https://arxiv.org/abs/2407.01511

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

2024 年 2 月底，玮婕和 Douglas 分别以产品、和设计师的身份加入团队，也是第一次团队在伦敦的线下见面，在共享办公室里探讨通用 Agent 的产品设计方案。

2024 年 4 月，我们提出了 Agent Workspace 的概念，多智能体每个 Agent 可以有不同的 Workspace，比如设计 Agent 可以有 Figma，Coding Agent 可以有 Vscode 和 Terminal，Product Manager Agent 可以有搜索引擎和文档等等。

当时，团队整体是一种兴奋的摩拳擦掌的氛围。我们认为「Workspace 就是给 agent 一台自己的电脑。不同身份的 Agent 安装使用不同的软件。「Agent 可以操作浏览器、terminal，以及用 API，GUI 的方式操控软件虚拟机完成各种复杂任务。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

2024 年 5 月 3 日，当时国豪在伦敦还没有租房，半夜两点半在办公室点了一碗羊汤。思考白天团队讨论的产品想法，写下产品目标 Mission Lambda – 我们希望做出通用的 multi-agent 系统，让 agent 合作完成复杂任务 (操控电脑/虚拟机)。写完吹了吹凌晨 4 点 kingscross 的晚风，回来在同事桌子上睡了一宿。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

当时产品 MVP 的开发已经如火如荼的推进中，但国豪其实一直有个挥之不去的隐忧：贸然去做一款应用且技术基础又不够扎实，产品会有种空中楼阁的感觉；而有限的资源也意味着，在开发过程中很难沉淀出 CAMEL 框架，无法将其打造成坚实的技术基础设施。

但看着兴奋的刚刚组建起来的团队，他有点不知道怎么开口。

2024 年 5 月 14 日晚，国豪和玮婕在办公室附近的中餐馆吃晚饭。两人就团队资源和目标不匹配的问题一直聊到餐馆打烊，或许连中餐馆老板都听明白了我们面临的两大难题：

CAMEL 框架和 CRAB（GUI 项目）作为基础设施并不成熟，不足以支撑产品级的开发；
以我们当时只有 2 个 Engineer 的团队来说想做到这个事情难于登天；

又是一个通宵，国豪写了「Lay the Foundation」，要求团队重点回到 CAMEL 框架和社区，暂停产品开发，打造基础设施。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

自此之后，我们的重点转向了开源社区与技术钻研。将 CAMEL 框架打磨成产品级框架，成为了团队的第一优先级，这一目标，我们几乎投入了整整一年。

Eigent 产品的萌芽：

为什么必须是桌面端？

我们当时其实在同时推进 3 条基础设施研究线。

一是Agent 操控浏览器、写代码、调用工具，这就是后来的 OWL（GitHub 18.8k 星）。二是百万量级的智能体模拟，也就是 OASIS（GitHub 2.3k 星）。三是Data Generation，包括生成verifiable data，也就是是 Loong 这个项目（截至目前数据下载量近 3 万）、function calling data、tool integrated mathematical reasoning data。这也继 CRAB 之后我们进一步做 Scaling environments 的工作，也是后面 SEA（Scaling Environments for Agents）initiative 的前置工作。

其中我们发现，OWL 距离真实落地场景已经很近。也正是因为一次偶然的爆火，加上基础设施的逐步成熟，我们决定重启 Mission Lambda，正式开始打造 Eigent 这个产品。也是因为 OWL 的爆火，那段时间我们几乎没日没夜地在解答社区伙伴的问题。微信群一度开到了 30 多个，几乎每天都能收到超过 200 条来自社区的反馈和问题。

OWL 论文链接: https://arxiv.org/abs/2505.23885
OASIS 论文链接：https://arxiv.org/abs/2411.11581
Loong 论文链接：https://arxiv.org/abs/2509.03059

流量稍微平稳下来之后，我们决定去摩洛哥休假，也是在那段时间里，我们重新想清楚了 Eigent 这款产品的方向和整体规划。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

我们要开发一款围绕工作效率场景的桌面端应用，为什么要是桌面端，是因为：

上下文：因为桌面端才能直接无缝接入用户的 Context；
强大的智能体需要强大的权限，桌面端才能操控本地文件系统、软件甚至是系统级 call 和硬件；
桌面端也可以完成所有 web 端能做的事情，不管是通过 Electron 的 Chromium 浏览器，还是以浏览器插件的方式。

Eigent 的核心在于 CAMEL 的 Workforce 系统。它的设计受分布式系统的启发，通过分工调度，来解决复杂问题。

我们将系统划分为三个核心角色：Task Agent（任务拆分）、Coordinator Agent（任务分配）、Worker Agent（任务执行和工具调用）。配合异步任务通道，系统能自动构建「任务关系图」，实现无依赖任务的并行处理与有依赖任务的有序衔接，大幅提升处理效率。

针对大模型的不确定性，系统内置了多种容错策略：重试、重规划、转派、拆解。这种动态调整机制确保了任务执行的连贯性和稳定性。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

只有当多智能体系统与日益强大的通用能力，例如使用浏览器和终端工具结合时，企业级自动化才真正有可能落地。

Eigent 的浏览器自动化方案采用控制与编排分离的双层架构。它的设计旨在突破僵化的 API 集成局限，让 Agent 具备在真实业务环境中的原生操作能力。

我们将架构解耦为两个核心层级：Python 层（AI 编排与决策）、TypeScript 层（原生交互与执行）。TypeScript 层利用 Playwright 原生优势，专攻 DOM 操作、SoM 标记渲染及遮挡检测；配合 WebSocket 异步通讯通道，系统实现了非阻塞式的指令流转，有效规避了纯 Python 方案的高延迟与底层访问限制。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

因为我们自己缺乏 MacOS 和 Windows 双系统全栈产品开发的经验，在产品开发过程中其实遇到了不少困难。那段时间我们和两位外部全栈工程师一起推进了将近两个月，才终于把一个能在双系统完整跑起来的产品做出来。

为了这次发布，我们甚至还在伦敦找电影团队拍了一部「电影」去介绍 Eigent 这个多智能体协作产品的概念。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

时间来到 Eigent 正式发布的时候，当时我们其实在沙特，准备服务我们第一家商业化大客户。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

这里夹带一些私货，给大家看看我们团队在沙特发布产品的vlog😂

2025 年 7 月 29 日晚 Eigent 终于上线了，发布后 20 小时内，注册用户突破 2000 人，发布后一小时就有 2 位个人用户付费订阅，还有十几家企业客户主动联系，希望在他们的企业内部试用我们的产品。

但其实我们一开始的发布没有想清楚产品第一波面向的群体该是谁，加上产品的不稳定迫使我们进入沉寂期，我们需要重新思考产品的定位，到底应该服务什么样的客户，最后决定先聚焦 b 端和开发者。

2025 年 11 月为了更好做企业交付，我们所有开发成员集中到常州开发。

虽然我们没有销售团队，但本地、工作场景、开源的产品定位为我们从社区吸引来了一些企业客户的信赖。

例如一家中东拥有 1.1 万名员工的大型企业，首先在他们的 IT helping desk（IT 服务台）部门率先试点，让 Eigent 借助内部浏览器协助处理 IT 工单，从自动提取邮箱信息到填写系统表单，再到自主判断优先级并分配处理人员。

后续一家世界领先的头部开源数据公司希望用 Eigent 应用于销售流程，让 Eigent 收集散落在邮箱、即时通讯软件，本地文件的销售线索，并使用浏览器整理到 Salesforce 这样的系统中台。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

为了打磨企业场景，我们构建了企业内部基准测试（Inner Enterprise Benchmark），例如 Salesforce 等 CRM 系统环境和任务以及 Verifier。这受到 Google Gemini 团队的关注，因此在 Gemini 3 系列研发期间，我们被邀请参与内测以及对模型能力进行评估。Google 官方也推荐 Eigent 为下一代 AI Agent 代表之一。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到

同时为了打磨产品基础能力，我们通过 GAIA、WebArena、WebVoyage、Terminal-Bench 等公开 Benchmark 打磨了 browser toolkit 和 terminal toolkit。现在 terminal toolkit 已经用到产品了，terminal rl 在研究结果上也已经有成果，就是我们前几天发布的项目 SETA，被两位前 OpenAI Cofounder 点赞（John Schulman，Andrej Karpathy），强化学习训练环境构建的经验也帮助我们拿下了几个客户，包括头部的大模型公司的环境和数据订单。

开源版 Cowork 项目在 X 爆火，创始人：感谢 Cowork，让我们三年的探索被看到