最新消息,两名华人前谷歌资深研究员正创立一家全新的视觉 AI 公司,致力于打造能够同时理解和处理文本、图像、视频与音频的前沿 AI 模型。
这两位华人是:在 Google DeepMind 工作 14 年后离职的资深 AI 研究员 Andrew Dai(戴明博),以及前苹果 AI 研究科学家,曾在谷歌研究部门工作的 Yinfei Yang (杨寅飞)。
戴明博表示,这家名为 Elorian 的新公司目前正在与投资人洽谈,计划完成一轮约 5000 万美元的种子融资。知情人士透露,由前 CRV 普通合伙人 Max Gazor 于去年 10 月创立的风投机构 Striker Venture Partners 正在洽谈领投该轮融资。

戴明博本科毕业于英国剑桥大学计算机科学专业,随后在爱丁堡大学获得机器学习方向博士学位。在攻读博士期间,他曾两次在谷歌进行软件工程实习,博士毕业后于 2012 年正式加入谷歌,开启了长达 14 年的职业生涯,在公司内部从技术研发逐步成长为核心科研管理者。
在 Google DeepMind,他担任首席研究科学家 / 主任级别研究管理职务,负责领导与 Gemini 大型 AI 模型研发相关的数据团队工作,这一项目是 DeepMind 和 Google 在多模态大模型方向的重要战略成果。
作为深度学习与自然语言处理领域的资深研究人员,戴明博不仅在工业级 AI 项目中扮演关键角色,还与业内其他顶尖研究者合作发表过多篇学术论文,积累了丰富的科研和工程融合经验。

杨寅飞是一位资深的人工智能研究科学家,曾在 Apple AI/ML 担任研究科学家/多模态负责人,主要从事视觉与语言基础模型的研究与开发。
在加入苹果之前,他也曾在 Google Research 担任研究科学家,在自然语言处理、语义检索、多语言表示学习与多模态表示学习等方向有深入的研究与实践。 他还在 Amazon 和 Redfin 担任机器学习与计算机视觉相关的软件工程师/数据科学工程师,积累了丰富的工业研发经验。
他在视觉–语言联合表示和大规模多模态学习方面具有重要贡献,其代表性研究成果《Scaling up visual and vision-language representation learning with noisy text supervision》推动了多模态表示学习的发展。
值得注意的是,戴明博与杨殷飞目前都已在 LinkedIn 上将公司状态更新为「隐身(stealth)」,其中戴明博的资料显示其担任 CEO。就连戴明博的社交媒体上都标注了「隐身模式」。

在上周六的一次电话采访中,戴明博表示,Elorian 的核心目标是构建能够通过同时处理图像、视频与音频,对现实世界进行视觉理解与分析的多模态 AI 模型。虽然机器人也是其潜在应用方向之一,但公司还设想了更多应用场景,暂未对外披露具体细节。
参考链接:
https://www.theinformation.com/articles/former-google-apple-researchers-raising-50-million-new-visual-ai-startup?rc=jn0pp4
https://sites.google.com/site/yinfeiyang/
https://www.linkedin.com/in/andrewdai
文章来自于微信公众号 “机器之心”,作者 “机器之心”

