首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!

首个满分选手的出现,标志着AI医疗的又一个里程碑。

近日,美国初创公司OpenEvidence宣布,其开发的全新AI系统在美国医师执照考试(USMLE)中获得了100%的满分

这是史上首个获得满分的AI模型,超越了最新的GPT-5(97%)。

首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!

美国医师执照考试 (USMLE) 是所有在美国的医生都必须通过的一系列专业考试,共分为三级,旨在全面评估考生基础知识、应用技能和临床决策的能力,考核极为严格。

OpenEvidence的模型不仅能准确回答每个问题,还能提供答案背后的推理过程,并从《新英格兰医学杂志》(NEJM)等权威期刊中找到参考来源。

正是凭借这一能力,它在考试中发现了一个错误答案。随后,经由七位独立的医生审核,他们认同了AI的结论。

成立于2022年的OpenEvidence,已成为美国临床医生最主流的医学搜索引擎,其影响力覆盖全美10000多家医疗机构超过40%的美国医生每天都会使用

同时,公司通过广告获取收入,成功跑通了商业模式,预计其年度经常性收入(ARR)将达到5000万美元

今年7月,OpenEvidence获得2.1亿美元的B轮融资估值飙升至35亿美元(约合人民币251亿元)。 本轮由谷歌和凯鹏华盈共同领投,老股东红杉资本继续押注。

OpenEvidence正在重新定义一线医疗服务,它彻底改变了医生获取、评估和应用医学知识的传统模式。

01

医疗AI再升级,成为首个满分选手

2023年,OpenEvidence推出了首个在美国医师执照考试中取得90%以上分数的AI。

如今,公司的最新AI在考试中获得了满分,再次打破行业天花板。

面对全部325道题,OpenEvidence的模型均进行了准确回答,并给出了每个答案的解释,以及参考文献。

而能做到这一点,离不开公司过去半年的技术攻关,模型在推理性能上实现了显著提高。

OpenEvidence表示,其AI已经实现了“超高级医学推理”。

这意味着,模型不仅需要处理事实信息,更要深入分析这些事实背后的潜在因素,理解其深层含义,并在此基础上进行复杂推理。

正因如此,在高度考验推理决策能力、也令众多大模型头痛的Step 3(第三级别)中,OpenEvidence的表现惊艳。

首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!

尤其是,在Step 3的第125道题中,一位有长期重度吸烟史的患者计划联合使用尼古丁贴片与丁丙诺啡,需要评估该联合方案可能带来的额外风险。

标准答案是“没有增加的风险”,而OpenEvidence的AI基于FDA和美国心脏病学会的证据,认为联合疗法有增加高血压的风险。

在经过7名精神科专业医生的审核后,OpenEvidence的答案最终被证明是正确的。

这一现象揭示了AI的强大能力,尤其是在面对复杂、罕见或非常规病例时,AI可以帮助医生发现盲点,提高诊疗的安全性和准确性。

不仅如此,OpenEvidence还希望借助最新成果推动优质医学教育资源的普及,公司计划发布一系列创新的教育工具,支持医学培训和日常临床工作

未来,AI将不再仅仅是医生的工具,而是会成为他们亦师亦友的伙伴,这种更高层次的人机协作模式,将推动医疗水平的提升。

02

哈佛学霸,打造史上增长最快的医疗APP

OpenEvidence联合创始人Daniel Nadler是一名哈佛大学经济学博士,也是一位非常成功的连续创业者。

首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!

图:Daniel Nadler登上福布斯封面

2012年,Daniel Nadler创办了AI金融公司Kensho Technologies,推出了基于AI的金融智能分析平台,并迅速被高盛,摩根大通,美银美林等知名投行使用。

2018年3月,Kensho被标普全球(S&P Global)以5.5亿美元收购,创下当时华尔街最大AI公司并购纪录。

和之前的成功经验类似,Daniel Nadler再一次精准捕捉到了医疗领域的痛点。

在医学知识爆炸式增长的今天,医生们不仅要处理复杂的临床病例,还要面对海量涌现的新药、医学指南和研究论文,亟需更高效的工具来帮助决策

于是Nadler找到了牛津大学计算机博士Zachary Ziegler,共同创办了OpenEvidence,为医生群体免费提供AI驱动的专业诊断助手。

这款应用程序专为医生打造,其训练数据主要来自《新英格兰医学杂志》、《美国医学会杂志》等专业期刊以及经过同行评审的论文,从源头上减少了幻觉问题。

首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!

医生只需要输入患者的症状、检查结果和病史,OpenEvidence的AI便能迅速分析这些信息,并提供一个基于循证医学的建议。

每个诊断选项都附有详细的解释、相关的研究文献和最新的临床指南,帮助医生在短时间内获得全面且可靠的参考信息。

这种模式极大地提升了临床诊断的效率和准确性,让医生可以更专注于与患者的沟通和治疗方案的最终确定。

数据显示,在过去的一年中,OpenEvidence创造了医疗APP史上的增长神话。

2024年7月,平台每月支持的咨询量约为35.8万次。如今,平台的单日咨询量就已达到这一数字,月总咨询量更是突破850万次同比增长率高达惊人的2000%。

目前,美国已有40%的医生注册成为OpenEvidence的用户,且每月新增注册医师高达7.5万名。

公司预计,今年将有超过一亿美国人享受到由OpenEvidence赋能的医疗服务

03

医疗版谷歌,年收入3.5个亿

OpenEvidence正以一种全新的互联网商业模式,以前所未有的速度颠覆着医疗行业。

它巧妙地绕开了医疗行业固有的壁垒——繁琐的FDA审批和医院漫长复杂的采购流程。

通过直接面向医生个体,将他们视为“消费者”,OpenEvidence以卓越的产品体验赢得了医生的青睐与信任。

其商业模式并非传统的订阅制,而是效仿谷歌的广告模式。

公司首先通过提供高质量的AI工具吸引海量医生用户,并根据他们在使用过程中产生的数据和反馈,持续优化算法,提升产品价值。

在用户规模达到一定量级后,OpenEvidence开始为制药企业和医疗器械公司提供精准营销服务

面对美国每年高达300亿美元的医疗营销市场,公司提供了一种更具成本效益的全新渠道,让广告以更自然、更相关的方式触达医生,从而取代传统的药代和会议推广

首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!

凭借这一独特的模式,OpenEvidence预计年度经常性收入(ARR)将达到5000万美元,并继续保持高速增长的势头。

OpenEvidence的成功,为AI医疗树立了新的典范:不靠烧钱或强推,而是用真正好用的工具赢得医生信任,并基于庞大的用户基础完成流量变现,探索出一条可持续发展的商业模式。

文章来自于微信公众号“智药局”,作者是“子任”。



搜索