并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

这份来自麻省理工的2025年商业AI现状的研究报告最近在网上炸锅了,该报告称 95% 的人工智能试点都失败了,这吓坏了美国股市的投资者。报告提到大多数公司都陷入了困境,因为 95% 的 GenAI 试点项目都没有产生任何投资回报率,而只有 5% 的公司通过使用可学习、可融入实际工作流程并随着使用而改进的系统获得了成功。

事实上,许多人都误读了这份著名的麻省理工学院报告。人工智能结果数字中的“95%失败”仅衡量了脆弱的定制企业试点,而不是一般的人工智能。您可以从统计学的角度反思一下。相反,日常工作者不断从个人人工智能工具中获得真正的价值。

报告的数据来源于研究人员分析了超过300个公开发布的人工智能项目和计划,与来自52个不同组织的代表进行了结构化访谈,并且收集了在四个主要行业会议上对153位高级领导的调查问卷回复。报告还明确指出,其研究是在2025年1月至6月期间进行的,非常新。

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

从作者们的访谈、调查以及对 300 个公开实施案例的分析中,出现了四个定义 GenAI 鸿沟的模式:

1.有限的颠覆:8个主要行业中只有2个有结构性变化。

2.企业悖论:大公司试点多,但规模化应用落后。

3.投资偏见:预算偏向可见的、顶层的功能(如销售),而不是高投资回报率的后台。

4.实施优势:外部合作的成功率是内部开发的两倍。

报告认为,鸿沟的决定因素不是模型质量或法规和人才,而是“学习”(learning)和“方法”(approach)。

“鸿沟”的错误一边:为何AI产品叫好不叫座?

明明大家私下里都在用ChatGPT、Claude处理工作,效率飞起,可一旦公司花了重金采购或公司亲自下场研发一款企业级AI工具,用户却不买账?研究者们将这种现象称为“GenAI鸿沟”,即AI的高采用率和低业务转型率之间的巨大裂痕。这背后,隐藏着几个值得我们深思的残酷现实。

行业颠覆的真相:雷声大,雨点小

研究者们创建了一个“AI市场颠覆指数”来量化AI对不同行业的影响。从0到5分,结果发现,在九个主要行业中,只有科技Technology)和媒体与电信(Media & Telecom)得分最高(2.8和2.3)出现了较为明显的结构性变化,而金融、医疗、零售等绝大多数行业,尽管试点活动频繁,但“没有任何根本性的改变”。

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

一位制造业COO的话很经典:“领英上的炒作说一切都变了,但在我们的运营中,没有任何根本性的改变。”

试点到生产的鸿沟:95%的项目倒在了黎明前

这是最触目惊心的数据。报告指出,对于企业级的、为特定任务定制的AI工具:

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

  • 60%的公司进行过评估。

  • 只有20%进入了试点阶段。

  • 最终,仅有5%能够成功部署到生产环境并产生持续价值。

并且通用的LLM聊天机器人(如ChatGPT)的试点到实施率高达83%。这背后有一个价值认知的分裂。员工喜欢用消费级工具,因为它们灵活、熟悉、立即可用。但他们对公司推销的定制AI工具充满怀疑,认为它们“脆弱、过度设计或与实际工作流程不符”。这背后有一个深层原因,非常有意思。

“影子AI经济”:用户的真实选择

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

报告揭示了一个极其有趣的“影子AI经济”现象。虽然只有约40%的公司为员工购买了官方的LLM订阅,但超过90%的公司员工在日常工作中使用自己付费的个人AI工具。这是一个巨大的反差。员工们用个人工具已经悄悄“跨越了鸿沟”,而公司的官方项目还在原地踏步。这说明,问题不在于AI本身有没有用,而在于公司“如何”提供和集成AI。

投资模式的偏见:被忽视的金矿

在投资方面,约70%的AI预算流向了销售和营销这类前台部门,因为它们的产出更容易量化。但研究者发现,真正的、能带来巨额回报的ROI金矿,其实埋藏在后台职能中(如财务、采购、法务)。通过AI自动化替代昂贵的业务流程外包(BPO)和外部咨询,所带来的成本节约远比前台的增收更为直接和可观。不过由于很难量化并向CEO汇报,这种投资偏见导致的资源错配,高ROI的机会被现在很多企业忽视了。

为什么试点会停滞:鸿沟背后的学习差距

那么问题到底出在哪?是我们的模型不够强大,还是算法不够先进?都不是。研究者一针见血地指出,根本原因在于“学习差距”(The Learning Gap)我们构建的大多数AI系统,本质上是个患有严重“失忆症”的天才。

用户体验的悖论

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

报告调查了AI应用的主要障碍,排在第一的是“抵制采用新工具”,而紧随其后的就是“模型质量/不可靠的输出”。这就产生了一个悖论:既然员工私下里那么爱用ChatGPT,为什么又会抱怨企业级AI的模型质量呢?研究者解释道,“上下文”是关键。在没有严格流程约束的个人任务中,AI的灵活性是优点;但在需要精确、一致、可靠的企业工作流中,同样的AI就因无法理解复杂的业务上下文而显得“不可靠”了。

关于上下文工程(Context Engineering),感兴趣您可以看下这两篇《中科院清北重磅发布:「上下文工程」的系统脉络图来了!》和《第一性原理的Context Engineering工具、指南

通用工具为何胜出?

研究者发现,即使用上了同款底层模型,用户也普遍认为直接使用ChatGPT网站的体验,远胜于将其集成在企业软件里的工具。原因有三:

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

  • 更好的输出质量:用户感觉直接和ChatGPT对话,得到的结果比通过企业软件封装后的要好。

  • 更快的响应速度:没有中间层封装,交互更直接。

  • 更熟悉的用户体验:用户已经习惯了聊天界面。

ChatGPT的缺陷

既然如此,为什么企业不能直接用ChatGPT处理所有关键任务呢?因为它存在几个致命的局限性,而这些局限性正是“学习差距”的集中体现:

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

  • 它没有上下文记忆:每次对话都是一次“冷启动”,它记不住客户偏好或历史修改。

  • 它无法从反馈中学习:它会一遍又一遍地重复犯同样的错误。

  • 它无法自主进化:需要用户不断提供完整的上下文,比如完整的背景信息和指令。

我之前介绍过一篇微软的论文,其中的观点很相似,他们提到“我们的数万名员工每天都在经历反复重申意图、手动追逐依赖关系,并费力的将不同工具的上下文拼接在一起,充当人力胶水的痛苦”

感兴趣您可以看看《微软已为Agent悄然调转船头,当大厂都在卷“通用Agent”

当被问及处理高风险工作时,用户的选择清晰地说明了这一点。对于起草邮件这类简单重复工作,70%的人选择AI。但对于复杂或长期的任务,90%的人选择人类同事。 AI和人类的界限不是“智能”,而是“记忆、适应性和学习能力”。这正是AI鸿沟的两边所区分的特质。

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

给AI构建者的playbook:如何成为那成功的5%?

报告指出,成功的AI供应商都在解决“学习、记忆和工作流适应”的问题。

企业客户到底想要什么?

成功的供应商都深刻理解企业客户的真实需求,他们想要的不仅仅是算法:

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

  • 一个值得信赖的合作伙伴:企业宁愿等待现有的大厂合作伙伴推出AI功能,也不愿冒险尝试一个不知名的初创公司。

  • 对他们工作流程的深刻理解:AI必须懂业务,而不是一个空有技术的黑盒子。

  • 与现有工具的无缝集成:AI需要像插件一样融入企业现有的Salesforce、ERP等系统。

  • 清晰的数据安全边界:确保客户数据不会被用于模型的混合训练。

  • 随时间推移而不断改进的能力:这恰恰是对“学习能力”最直接的要求。

成功的初创公司如何做到这些?

成功的AI初创公司通常会执行两大战术:

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

1.为特定工作流程深度定制:他们放弃了打造“万金油”平台的幻想,而是从非核心或邻近的流程切入,进行深度定制,展示明确价值,然后扩展到核心流程。成功的工具通常配置负担低、价值立即可见。

2.利用推荐网络:通过系统集成商、董事会成员或行业顾问的推荐来克服企业的信任壁垒,实现冷启动。冷不防的推销邮件/电话”(Cold Inbound Offer)几乎无效,而来自现有供应商(20%)、合作伙伴(15%)、同行(13%)和董事会(10%)的推荐则占据了主导地位。意思就是说想要成功,最好借助和建立信任网络,进行盲目的市场推广效果可能不好。

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

报告还提到了一个紧迫感:“跨越鸿沟的窗口正在迅速关闭”。企业正在锁定那些具备学习能力的工具,一旦企业投入时间训练一个系统来理解其工作流程,转换成本就会变得非常高。

购买者的成功秘籍:如何成为聪明的“买家”?

这一章是给企业客户的 playbook。

核心思想:像买服务一样买AI

成功的AI购买者,行为模式更像BPO(业务流程外包)客户,而不是SaaS客户。他们不再只看功能列表,而是要求供应商对最终的业务指标负责。

“购买”远胜于“构建”

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

  • 与外部专业伙伴合作的项目,成功部署率约为 66%

  • 企业内部从零开始自研的项目,成功率仅有 33%

这清晰地表明,在当前阶段,利用外部成熟的专业能力远比闭门造车更明智。

成功的组织设计

企业在推动AI时面临两个核心的组织设计决策,而最成功的企业往往在这两点上都做出了明智的选择。

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》

第一个决策:项目应该由谁主导?答案是“赋权一线”。 报告发现,相比依赖一个中心化的“AI卓越中心”(CoE)自上而下地寻找应用场景,由最懂业务的一线管理者和“超级用户”自下而上地发现需求、主导选型,成功率要高得多 。这种“业务线主导”的模式能最大程度确保解决方案与实际运营的契合度。

第二个决策:技术应该如何实现?答案是“战略合作”。 无论项目由谁主导,在实现方式上,报告的数据给出了明确的答案:“购买”远胜于“构建”。通过与外部供应商建立战略合作伙伴关系(即购买或合作开发模式),项目的成功部署率高达66%,是完全依赖内部团队自建(33%)的两倍。

真正的ROI在哪里?对岗位的影响是什么?

  • ROI来源:最大的成本节约并非来自裁员,而是来自替代昂贵的外部BPO和咨询机构,尤其是在后台业务上。比如,通过自动化客户服务和文件处理,每年可以节省200万到1000万美元的BPO开支。

  • 岗位影响:GenAI确实开始产生影响,但并未引发大规模裁员,其影响主要体现在替代以前外包的职能,受影响最大的是客户支持、行政处理等非核心业务。并在技术和媒体等受AI冲击大的行业限制了新岗位的招聘。同时,AI的熟练使用正在成为一项新的基本工作技能。

未来已来:从AI工具到“智能体网络”

最后,报告将视野拔高,提出了“智能体网络”(Agentic Web)的概念,那是一个超越了单个AI工具的时代。动态的智能体取代了孤立的SaaS工具和静态的工作流程。在这个网络里,无数个具备学习、记忆和自主行动能力的“智能体”,可以跨越公司和平台的界限,自主地协同工作,去发现问题、谈判任务、执行流程。

这标志着从“提示驱动”到“协议驱动”的自主协调的转变。

未来是“智能体网络”的时代。

写在最后

1.“购买”优于“自建”,战略合作是关键

报告最核心的洞见之一是,企业内部自行构建AI工具的成功率远低于与外部供应商合作。数据显示,通过战略合作部署的AI项目成功率(66%)是内部开发(33%)的两倍。这颠覆了许多企业认为必须掌握核心技术自研的传统观念,指出成功的关键在于利用外部专业知识快速实现价值。

2.投资与回报的错配:真正的ROI在“后台”

一个普遍的战略误区是将大部分AI预算投向光鲜的“前台”业务,如销售和市场营销。报告洞察到,尽管这些领域获得了约70%的投资 ,但最快、最可衡量的投资回报(ROI)往往来自被忽视的“后台”职能,如运营、财务和采购。通过自动化后台流程来取代昂贵的业务流程外包(BPO)和外部机构,可以实现数百万美元的成本节约。

3.核心障碍是“学习差距”,而非技术本身

阻碍AI广泛应用和产生价值的根本原因不是模型质量、数据或法规,而是大多数AI系统缺乏“学习能力”。这些系统无法从用户反馈中学习、记住上下文或适应不断变化的工作流程。因此,战略重点应从评估AI的技术基准转向评估其学习、适应和与现有工作流程集成的能力。

4.“影子AI”揭示了用户的真实需求

报告发现,员工自发使用个人AI工具(如ChatGPT)的“影子AI经济”非常普遍。90%的员工在工作中使用个人AI工具,而只有40%的公司购买了官方订阅。这一现象不应被视为安全风险,而是一个战略洞察:它揭示了什么样的AI工具是员工真正需要的灵活、易用、能立即解决问题。成功的组织会学习“影子AI”的使用模式,并以此为依据来采购企业级解决方案。

5.组织架构比技术选型更重要

成功部署AI更多的是一个组织设计问题,而非技术问题。成功的企业通常会采取“去中心化”的实施方式,将选择和推广AI工具的权力下放给一线的业务经理和预算负责人,而不是依赖一个集中的AI中心或IT部门。这种自下而上的方法确保了AI解决方案能真正贴合业务需求,从而加速了采用。

6. 行动窗口正在迅速关闭

报告发出了一个明确的战略预警:企业选择能够学习和适应的AI系统并进行投资后,会产生巨大的转换成本 。随着系统不断学习特定公司的流程和数据,其价值会持续累积,导致竞争对手难以追赶。报告预测,在未来18个月内,许多企业将锁定核心的AI供应商关系。这意味着,现在犹豫不决的企业将在未来几年内处于严重的竞争劣势。

文章来自于微信公众号“AI修猫Prompt”。

搜索