用看不见数据的方式,释放数据的价值。
AI 时代的聚光灯,不应只属于从零到一的创业者。
我们注意到一个有趣的现象:与热衷在全球舞台上表达观点的硅谷高管相比,中国的大厂高管们通常更倾向于低调行事。
尽管如此,他们的平台掌握着丰富的资源、数据、人才和资本,他们的决策在切实地塑造着 AI 行业的未来发展。
「十字路口」希望做的,就是将这些身处一线的关键思考者,也带到你的面前。
上周,我们与阿里云副总裁旭卿的对话收到了不错反响;本周我们又迎来了另一位具有传奇色彩的重量级人物:蚂蚁集团副总裁、首席技术安全官,同时也是蚂蚁密算董事长的韦韬。
说韦韬是位“传奇极客”毫不为过。他是影响了一代留学生的精神家园——MITBBS(未名空间)的发起人之一;他也是一位坚定的开源信徒,自称“读着开源代码长大”,并始终致力于用自己的方式回馈社区。
这场对话源于「隐语」开源社区的三周年,韦韬和我们分享了很多日常可能不被大家关注、但非常关键的两个点:
- 密态计算 (Cryptographic Computing): 一种能让数据“可用不可见”的技术,在保护隐私的前提下,让数据价值安全地流动起来,喂养出更强大的AI。
- 高阶程序(High-Order Program) : 一套全新的工程化思想,通过任务拆解和自动核验,构建可靠的保障框架,让它的每一次输出都变得可靠、可控。
「十字路口」讨论了大量模型、应用与infra,而今天我们之所以要把焦点放在这两个部分,是因为在 AI 的狂热之下,它们或许正是决定 AI 能否真正走向工业化、赢得长期信任的决胜点所在。
这也为今天的 AI 创业者和投资人指明了下一个可能的价值高地:当模型的“聪明”本身正变得越来越像普通商品,那么通过新技术、新办法去”构建信任、确保可靠“,或许才是建立真正商业壁垒和长期价值的关键。
微信收听播客:
从 MITBBS 到蚂蚁密算:韦韬的技术轨迹
👦🏻 Koji
韦韬总您好。今天想问的第一个问题就是,为什么韦韬总工作了二十多年了,感觉没有被摧残,还是如此的有少年感?
👦🏻 韦韬
大家好,我是韦韬。
可能就是因为总是对新技术保持兴趣。我们这一代其实很幸运,从 93、94 年互联网进入中国开始。北大物理系是全国第二家接入互联网的。然后后各种技术快速迭代,给社会生活带来了巨大变化,不断有新东西出现。而我也愿意去拥抱、去尝试,所以心态始终很好。
👦🏻 Koji
那最近这些新的 AI 工具、产品,有哪些是你用完之后感觉有新奇感的?
👦🏻 韦韬
最近让我最有新奇感的还是大模型在编程上的应用。这一波大模型出来对行业冲击很大,以前的 AI,比如 AlphaGo,只能干一件事,仍要靠大量的人工辅助。而这次的大模型是真正的“通用智力引擎”,很多事都能做。有的做得很好,有的会犯低级错误,但整体越来越像人。
所以它非常有意思。其实我特别感谢现在技术的进步,让很多人不会编程,能够有机会能够把自己的一些想法变成一个程序。最开始你也创业过了,很多时候大家创业就只缺个程序员。
👦🏻 Koji
万事俱备,只差 CTO 。
👦🏻 韦韬
今天如果有很多小的想法,基本上你把东西描述出来,大模型真的可以帮你产生一个完整的 app。这对行业的冲击是非常大的。
👦🏻 Koji
我们上一期请了阿里云的旭卿,他说达摩院院长最近也在用 Cursor 写游戏,还写了个扫雷。
👦🏻 韦韬
现在很多经典小游戏,大模型写得很好了。
👦🏻 Koji
所以您现在也会开始用 AI 来写一些自己的小程序吗?
👦🏻 韦韬
是的,我还用它写过一个小工具。大家放 PPT 时常遇到跨系统、跨版本排版乱掉的问题,我就很想有个功能能让格式固化下来。我基本上用一句话描述了出来,让 AI 把它转成图片再固化成 PPT,然后导入新生成代码就完全可以用。
👦🏻 Koji
哇,我也觉得都 2025 年了,PPT 格式怎么还会在不同电脑上排版错乱。所以你是写了个给自己用的小工具?
👦🏻 韦韬
这个工具后来很多小伙伴和同事都在用。
👦🏻 Koji
这个听起来感觉可以卖 9 块 9。以前遇到这种事基本无解,因为搜估计也搜不到这样的产品。
👦🏻 韦韬
其实大家自己是能编的,但觉得没必要。现在基本上非常快的能完成。
👦🏻 Koji
那你平时能看出来,同事的汇报里哪些是 AI 写的吗?
👦🏻 韦韬
怎么讲呢?其实我不太担心这件事。因为现在 AI 最大的问题是观点不够专业;它能堆砌一堆辞藻,但缺乏真正有效的、有推动力的主张。
👦🏻 Koji
洞察力很重要。
👦🏻 韦韬
对。我们今天使用大模型的关键在于认知要高过模型。认知到位以后,你会能指导大模型生成你所需要的东西。这里面核心是你自己的观点,这是模型无法替代的。这本身就是一个专家该做到的事情,只是以前把这些观点写成文字很累。而现在大模型能很好的帮忙表达,但方向还是人来定。
另外就是大模型的幻觉真的挺严重。大家会发现,很多时候它会虚构一些参考文献,或者虚构一些行业的各种政策文件出来,那是会出大问题的。如果没有实时核验,就很容易掉坑里。
👦🏻 Koji
录这期之前,我其实也一直在用 ChatGPT 来了解您的过去,所以不知道里面有多少是幻觉(笑)。
👦🏻 韦韬
没错。有一个很著名的一句话,叫“大模型就是压缩机制”。压缩即智能。但这个说法过于简化了。本质上可以压缩是很多事情的规则,但是这是有损的压缩。而事实是无法被有损压缩的,因为一旦有损以后,事实就产生了偏差,这就是幻觉的来源。
当你把大量的资料喂给大模型,它很难区分。或者是说在极大的压缩时,难以分辨什么是规则,什么是事实。而事实往往充满偶然性。规则再正确,一旦事实错了,推理也会错。
我觉得在现有的 transformer 架构下,这个问题很难解决。但人类其实也一样,死记硬背是极其有限的,真正重要的要是记住核心思想,而小的偏差是不可避免的。
👦🏻 Koji
我最近看到一个说法,为什么叫“梦想”这两个字?因为其实只有敢做梦、甚至有点幻觉,人才去可以难以想象的,有更大 vision 的一些事情。所以幻觉有时候也很必要。
👦🏻 韦韬
你说的很对。人类历史上两个著名的 “梦”,一个是门捷列夫梦到元素周期表,还有凯库勒梦到苯环分子的结构。
👦🏻 Koji
这不是段子吧?
👦🏻 韦韬
不是,都是事实,非常神奇。
👦🏻 Koji
很神奇。我也想问一下在 ChatGPT 上读到的,关于您很有趣的细节,不知道是不是大模型的幻觉,听说当年您发起 MITBBS 的时候,做了非常多基础的工作。当时有人评论说,您写站规比写情书还认真,这是真的吗?
👦🏻 韦韬
我觉得这个是他的幻觉,那不是我。
👦🏻 Koji
所以你写情书还是更认真。
👦🏻 韦韬
那必须啊 (笑)。
👦🏻 Koji
那当时发起 MITBBS 时是怎样的场景?可不可以分享下当时故事?
👦🏻 韦韬
我在 MITBBS 是做最前期的技术搭建,后来因为人主要在国内,运营就交给了在美国的同学们,我就逐渐淡出了,只在有技术问题时再帮忙。整个过程挺有意思,也让我很自豪。当时的留学生精力、脑力极其过剩。一开始的时候是有很多的规则,但很快发现仅有规则不够,很多时候还是需要社区生态自己往前的健康的演进。
👦🏻 Koji
听起来像法治和德治要两手抓。法律管不了的地方,要靠社会的道德规范约束去让大家自律。回到现在,你作为蚂蚁的首席技术安全官,在 AI 时代会觉得安全工作更难了吗?灰黑产是不是也变得更强大了?
👦🏻 韦韬
的确是挑战更大。技术用于攻击往往比防守更简单。今天黑产的技术的演进很快,而以前他们写程序是水平是很差的。
👦🏻 Koji
现在有 Cursor 了。
👦🏻 韦韬
对,不止是 Cursor。以前我们抓到过一些黑产自己都不会编程序,还要在网上花几百块钱找人写工具。今天可能就不需要了,所以破坏性非常大。
这个过程中也有个很有意思的事。有一个最早、最广泛的中文编程语言叫”易语言“。本来拥有中国人自己的编程语言应该很自豪,但不幸的是,用易语言写的程序里大概 95% 以上都是黑灰产工具。
👦🏻 Koji
因为中文降低了编程的门槛。
👦🏻 韦韬
对,这是挺尴尬的一件事,它背后也反映了黑产的分层:顶端的团体真的是在国际上都能呼风唤雨。但也有大量的草根团体,用很简单的工具就能造成很大危害,而且人数又多。所以我们每年对抗这些的压力非常大。
👦🏻 Koji
因为这几十年来,你一直在一线经历着攻防战。有没有一些画面是你想起来印象非常深刻的?
👦🏻 韦韬
我真正开始做安全保障,是从北京申奥网站开始的。我从 1999 年开始规划,2000 年开始建设。在 2001 年申奥成功的那天,大家敲锣打鼓地在北京街头庆祝的时候,我们团队在楼上看着一边看着大家庆祝,一边守护申奥网站安全。从那以后,对抗压力越来越大,但幸运的是我一直有一群战友一起,基本上整个防御体系零事故。
但这里面有很多艰巨的作战和任务,这些年我们蚂蚁的安全团队也协助警方打击了大量暗网黑产,包括非法的数据贩卖。暗网是一个匿名化网络,在上面追踪黑产是很难的。基本上重大案件都要追踪好几个月,通过多家公司联合才能突破。
👦🏻 Koji
我相信你比一般人更清楚黑灰产的危害,所以挺好奇,你自己会怎么保护隐私和数据?会不会是每个网站、每个银行都用不同的密码?
👦🏻 韦韬
其实没那么复杂。我最基本的建议,也是我自己在做的:在网上(比如寄快递)时不要用真名。
👦🏻 Koji
啊,不要用真名?
👦🏻 韦韬
对。因为黑灰产的核心是 ID mapping,就是把不同来源的数据打通。只有 ID 打通以后,不法分子才能够把各方汇集的数据都汇聚到你这个人身上。如果你通过假名来打断这个链条,他们就很难把信息定位到你身上。
👦🏻 Koji
那手机号怎么办?
👦🏻 韦韬
其实现在再注册一个手机号不难,而且因为二次放号,本身就会让 ID mapping 变得混乱。你都不要说黑灰产的,运营商经常都是乱的。
👦🏻 Koji
对,我也注意到,比如说我有一家消费品牌公司,我们自己的客户的手机号都拿不到,平台应该也拿不到。
👦🏻 韦韬
对,国家现在在推动实名信息的“假名化”。也就是说,很多网站和服务未来不一定要直接保存你的真实姓名和手机号。这样一来会打断黑灰产的ID mapping 的链条,大大提升他们的技术难度。对我们消费者来说,这是最省成本、也最有效的保护方式。
👦🏻 Koji
那刷脸、录指纹呢?很多人都挺害怕的。你会抗拒吗?
👦🏻 韦韬
嗯,我倒还好。大家的担心主要在于滥用。但人脸识别其实是线上和线下衔接最好的技术,没有之一,而且有很多这种衔接的需求。
实际上,人脸核身技术一旦做好,能把风险防控提升到最高。在支付宝,我们把人脸识别作为最后一道兜底手段。人脸安全保障的能力,比短信高出 30 倍以上。
👦🏻 Koji
这个是一个非常高的倍数,但定义是什么?
👦🏻 韦韬
就是短信验证造成的资损相比人脸要多很多。
遇到最高风险的场景,人脸能把损失控制在短信的三十分之一以内,这是其他单一技术无法做到的。当然实际应用里,我们一定是多因子结合,但在人脸核身真正做到位时,它是最有效的手段。这里要区分清楚,人脸识别只是“认出你是谁”,而人脸核身不仅要识别,还要确认当下是“活的你、真实的你”。很多 AI 公司只停留在人脸识别层面,并没有走到安全保障这一步。
而大家的担心主要是隐私的滥用,比如未经同意的人脸长期被非法使用。但现在在可信技术体系里已经有很多防滥用的手段,可以保障安全和隐私。但是可能很多专家对这一点认知不足,就只是简单的一刀切、拒绝人脸合身。
我觉得这就好比“把孩子和洗澡水一起倒掉了”,是很可惜的。其实人脸核身完全可以做到只在约定场景里使用,既能提供最强的安全保障,又能防止隐私被滥用——两者是可以平衡的。
👦🏻 Koji
明白。我最近看到一些新模型,只要一张照片配上声音,就能生成一段视频。几个月前看起来还很假,现在已经栩栩如生了。我甚至看到同事做了我的一段视频,恍惚间以为真的是我说的。但这是不是仍然通不过人脸核验?
👦🏻 韦韬
对,骗过人眼不难,但它骗不过计算机的分析。就像大家看电影时,其实车掉下悬崖都会加速,否则不够刺激。虽然人眼看着没问题,但如果用计算机细看就全是破绽。
现在的大模型生成视频,人眼觉得很逼真,但在专业的鉴真技术下漏洞很多,离真正“完美逼真”还有很长的路。最著名比如说手指细节错误,对吧?它里面的细节还有许多缺陷要提升。包括我现在也在做高阶程序的这个体系,就是能够推动大模型不断的变得更加完善。
密态计算:原理、应用与全球化
👦🏻 Koji
您还是蚂蚁密算的董事长,能不能给大家科普一下,密算到底是做什么的?和我们普通人的生活有什么关系?
👦🏻 韦韬
密算其实是“密态计算”。
大家可能熟悉的有通算(CPU)、智算(GPU),而密算的特点是:数据在使用过程中始终是加密状态。过去我们以为,用数据时必须要拿到它,但这样一来,具有极大价值的数据容易泄露或被滥用。如果落在了黑客手中,就会带来严重的社会危害。所以如何保护好数据的价值、不让它泄露,同时又能让它在各行各业发挥作用,这就是一个全新的命题,而最好的解决方案就是密态计算。整个计算过程是密态保护的,只有在数据源方许可的场景下才能被计算和调用,最后双方约定的结果才会输出明文,供下游使用,这就是密态计算。
换句话说,整个计算链路都在加密保护中进行,运维人员或开发者都无法接触到原始数据。最后输出明文的时候,是数据源方的密钥说了算,只有他许可,结果才能变成明文。然后中间无论是谁来运维这个系统,还是谁来研发相关应用,都无法获得明文数据。整个链路的保障能力叫做密算。
密算带来的最大变化是:看起来数据处理更复杂了(因为不再是明文),但事实上它能极大加速行业对数据的应用。以前你把数据交给第三方,技术团队第一反应是先备份一份,业务团队第一反应是想怎么用它赚钱。结果就是数据容易被泄露和滥用,数据源方也就越来越不敢共享。这样一来,行业普遍出现了数据缺乏加工、融合和验证的难题,严重阻碍了价值释放。
而密算很好地解决了这个问题,让数据能在加密状态下被安全使用。就像开车一样,大家觉得安全措施像刹车,会拖慢速度。但其实没有刹车你敢开到 120 码吗?
👦🏻 Koji
这个比喻非常的形象,就是因为高速路给了人安全感,我们才敢开得快。
👦🏻 韦韬
就像开车,但实际上无论新能源车还是燃油车,背后都有大量技术、行业的沉淀在保障安全。正因为有这些体系,你才敢开得那么快。
👦🏻 Koji
所以放在信息高速公路上,也同样需要这样的安全基础设施,只是很多人平时看不到。
👦🏻 韦韬
对,密算就是要提供这样的安全体系。有了保障,数据源方才敢把数据拿出来做加工和应用。
👦🏻 Koji
那在密算领域,会不会有不同的流派?比如有人主张用这种方式保证安全,另一些人则有自己的技术选择?
👦🏻 韦韬
密算其实是一个更大的技术体系的一部分,我们叫它“隐私保护计算”。在这个体系里,有几条不同的技术路线。
第一类是纯密码学的路线,比如多方安全计算、全同态。它完全依赖密码学算法,不需要任何芯片或基础设施,安全级别是最高的。但问题也很明显:像全同态的计算速度可能比明文计算慢十万倍,而且数据会膨胀一万倍。本来 1G 的数据,处理后可能变成 10 T。
第二类是机密计算,它主要是基于 CPU 的内存加密和系统安全实现,在里面建立一个可信根来做安全保障。所有的计算是在 CPU 的 cache 里才会解开做相关计算。但是这个操作是透明的,对任何人始终处于密态,我们称之为硬件密态。
第三类是联邦学习,它的思路是容忍一部分信息熵泄露,来做AI 里面相关计算,而且速度可以更快。
这些技术路线在安全假设和实现方式上差别都很大。行业里其实已经做过很多尝试,也能看到它们正在不同场景下逐步落地和被接受。
而差别如此之大的各项技术,我们又如何衡量他们各自的安全级别?在国际上也无法达成共识。
👦🏻 Koji
现在也还无法衡量吗?
👦🏻 韦韬
这两年我们其实做了一件很自豪的事,就是提出了一套度量方案。它的核心思路是:不管你采用哪种技术,最后衡量安全性的标准在于——攻击者需要付出多大代价、克服多少不确定性,才能攻破你的保障。
这套机制是通用的,无论应用在隐私计算、数据安全还是网站安全,原理都是一样的。我们也和国内、国际测评机构一起推动相关标准,并做了试点,效果很好。事实证明,这些东西是可以被量化衡量的。
👦🏻 Koji
蚂蚁密算做的数据安全保障,只是给蚂蚁集团用,还是其他公司也能用?
👦🏻 韦韬
蚂蚁密算其实有一个发展历程。最早在 2016 年,我们就开始研发不同的隐私保护技术路线。然后就在在信贷、风控等领域有了应用,效果很好。
到 2022 年,我们觉得这些技术不应该只在蚂蚁内部使用,所以我们选择了开源。
开源后的反响非常好,很多厂商参与进来,应用也扩展到了国际。但我们也发现因为技术门槛很高,能用的多是有强大技术能力的大公司,大部分中小企业没有能力用。于是我们又成立了一家真正的商业公司“蚂蚁密算”,希望让这项技术能更普惠。
👦🏻 Koji
那成立了蚂蚁密算以后,对中小企业会提供哪些具体的服务或帮助呢?
👦🏻 韦韬
这两年国家数据局也在大力推动“数据要素市场化”的改革,核心还是让各行各业真正把数据用起来,挖掘更深层次的价值。但挑战也很大:不同产业的数字化水平参差不齐,加上对数据安全的顾虑,导致数据普遍都缺乏加工、缺乏融合、缺乏验证。
不过另一方面,我们和很多同行、高校一起,持续攻克技术难关。现在不只是停留在顶会论文,而是有了成熟的开源实践和大规模应用。按照蚂蚁的愿景,我们希望通过密态计算给社会带来一些“微小而美好”的改变。比如,我们和网商银行、农业农村部大数据发展中心合作,把密态计算用在农村贷款场景。
过去农民贷款难,因为他们的资产是田地,所以银行只能派人去田间地头考察。这个成本太高了,靠农民本身贷款而产生的利息完全无法承担。所以导致商业循环无法运转。
👦🏻 Koji
那蚂蚁密算具体是怎么参与农民贷款的呢?
👦🏻 韦韬
我们和网商银行一起做这件事。一方面用遥感大模型来评估农田情况,另一方面用密态计算把农民提供的土地信息和公共数据进行比对,确认这块地确实是他的。这样一来,就不需要再派人跑到田间地头去调查了。
这件事最早是在 2023 年年中,在江西某个县试点,效果非常好。它完全依赖技术信任,不需要人工介入,数据在这个过程中既不会泄露,也不会被滥用。试点成功后,在有关部门的支持下,这个体系很快扩展到全国 2600 多个县。
👦🏻 Koji
所以农民其实完全不知道背后发生了什么。
👦🏻 韦韬
大家享受在后面的便利就可以了。
👦🏻 Koji
那这里面最大的改变是什么?比如说银行不用派人去考察,这是遥感带来的,还是密算带来的?
👦🏻 韦韬
两块都重要。遥感负责评估,密算负责资产的核算,只有结合在一起才能真正落地。
类似的密态计算的应用还有新能源车。大家开新能源车最大的感受是电费便宜,但保险保费却很贵,还不断上涨。这是因为保险公司在新能源车上的赔付率超过 100%,基本是“做一单赔一单”,所以保司有很强的改革动力。
为什么赔付这么高?一方面是电池风险大,另一方面是车体一体化和传感器众多,哪怕轻微碰撞,维修成本也很高。更麻烦的是,电动车起步动力太强,驾驶习惯不好的人一脚踩下去,很容易出事故。
👦🏻 Koji
所以新能源车出事的概率也更高?
👦🏻 韦韬
很大程度跟驾驶习惯相关。所以保险公司特别希望能把从车、从人、从险的数据汇聚起来,然后去分析哪些是高风险人群,哪些人驾驶习惯良好,从而精准定价,让保费降下来。这件事其实是蚂蚁和保险公司、主机厂商合作,用密态计算打通数据后实现的。很多人可能想不到,这背后正是密态计算在发挥作用。
👦🏻 Koji
在密态计算出现之前,数据打不通是因为各方都不愿意开放吗?
👦🏻 韦韬
对,从人的数据、从车的数据、从险的数据都太敏感了。类似的情况还有医保。医保体系有海量的高价值、高敏感数据,也有巨大的改革诉求,尤其是和商业保险的打通。但过去一直被认为几乎不可能实现。比如到去年 12 月,还有专家说这是“行业人自嗨”。
因为医保数据在医保局,商保数据在各个保险公司,根本没法共享。但今年 7 月,全国首个 “医保和商保” 清分结算中心上线,在这背后密态计算技术也参与支持,使得数据在“不泄露、不滥用”的前提下,能够进行验证和结算。这些技术听起来很遥远,但其实已经在服务大家了。
👦🏻 Koji
确实,挺了不起的。我在想,如果放到非洲,这样的技术会不会用不上?
👦🏻 韦韬
你别说,非洲现在也在用。我们当时在做隐语开源社区活动时,非洲最大的手机厂商传音也来参加了,我们都很诧异。后来才发现,非洲的数字化发展速度很快,不管是做风控还是营销,国家之间对数据合规的要求也越来越高。所以他们也有真实的需求。
大模型遇上密算:高阶程序
👦🏻 Koji
因为十字路口是一个非常关注 AI 的博客,我也想请教一下:大模型兴起之后,它和密态计算之间是什么关系?会让密态计算更重要吗?
👦🏻 韦韬
这是个好问题。密态计算其实分两类:密态通用计算和密态智能计算。
今天我们看到,大模型的应用大致有两种情况:一种是把它当成通用服务,用公网的大模型;另一种是专业化应用,涉及企业的敏感数据。在第二种情况下,问题就很突出。因为只要涉及合规和数据安全,企业通常会禁止直接把敏感数据交给外部大模型。但与此同时,大模型带来的生产力提升和替代作用又不能忽视。
👦🏻 Koji
是的,如果自己不用,竞争对手就用了
👦🏻 韦韬
没错,所以很多企业只能选择私有化部署。但问题是私有化不仅贵,升级换代也很麻烦。所以我们现在看到一个更强烈的需求:能不能在公网安全、合规地使用大模型?而密态计算就是最好的解决方案。
而且放在公网,还有成本优势。比如在阿里云上,DS 满血的 token 价格和Qwen 3 是一样的,很多人没注意到。因为数据规模大,我可以用 PD 分离等各种技术,把推理成本显著降下来,这比私有化一体机要便宜得多。如果再叠加密态计算,成本甚至只要私有化的三分之一左右。
还有一点很重要:在公网模式下,你可以享受技术的快速迭代升级,不需要自己做运维,也不用担心资产很快贬值。这其实是个很大的机会。而且今天大模型应用本身还在快速演进中。
比如我们上个月在 WAIC 发布了“高阶程序” 大模型可信应用技术框架。很多人觉得大模型已经改变行业了,但问题是现在所有的大模型应用基本都需要人盯着,怕它说错一句话就造成大麻烦。大家常以为这是“幻觉”的问题,但我们发现,核心根本不在幻觉。
问题出在大家今天用大模型的方式还不对。没有采用工程化的方法,而是仍然像“手工作坊”一样,把所有问题都丢给大模型去解决。可实际上,大模型的处理能力在规模扩大时会急剧下降。
(图片来源于网络)
👦🏻 Koji
那“手工作坊”的用法和“工程化”的用法,最大的区别是什么?
👦🏻 韦韬
最大的区别在于任务描述的载体。现在大家都觉得要用自然语言才算 AI,用编程语言反而好像落伍了。但其实,自然语言是一个非常糟糕的工程载体。它的语义模糊、缺乏边界和优先级,很难保证可靠性。 我来举两个例子:一个是笑话,就是老婆让老公去买三斤桃子,如果碰到西瓜就买一个。结果老公只带回来一个桃子,因为逻辑模糊,不知道“买一个”是指桃子还是西瓜。
还有就是“机器人三定律”。听上去是为了保证机器人不伤害人类,但“不伤害”本身就很模糊。如果机器人理解为“外面风险太大”,它可能把人类锁在屋子里,觉得这是最安全的。但真的有人能接受吗?
这就是为什么说,自然语言在工程化应用里并不是一个好的载体。
当然,自然语言也有它的强项。恰恰因为模糊,它非常适合承载知识和概念。但问题是,现在应用里要么全是自然语言,要么全是编程语言,二者割裂开了。
我们在做的,就是把两者结合:知识性的部分交给自然语言承载,逻辑性的部分交给编程语言承载。这样融合的好处是,能把大模型的任务拆得更细、更具体,从而降低它的思维压力。
人也是一样。如果你突然被丢给一个特别复杂的任务,比如医保改革,你肯定会懵,除了真正的行业专家,几乎没人能处理好。但如果把任务分解成小块,即便是新手或者大学生,也有机会把事情做好。
👦🏻 Koji
那输入的起点是什么呢?是自然语言,还是一开始就要用编程语言?
👦🏻 韦韬
其实起点可以是自然语言,但核心要做到三个点:显性化、受控化、约定化。
第一步是显性化。也就是说,把处理任务的过程显式表达出来。我们把自然语言和编程语言结合的形式称为“高阶程序”。在这个过程中,大模型可以先把它认为的处理流程显性化,同时还需要行业专家来确认,这样才能保证满足专业化的要求。这也会倒逼专家把行业知识优化出来,实现大模型和专家的融合。
第二步是受控化。现在很多人用大模型,只是“丢个任务 → 出个结果”,没有任何核验环节。但就像学生做数学题一样,做完以后必须检查。
👦🏻 Koji
对,就像考试前要留十分钟检查一下答案。
👦🏻 韦韬
没错。但今天大家习惯上不给大模型检查的机会,也没有这样的机制。我们把任务拆分成自然语言和编程语言后,就可以在最小粒度上做核验。让人类来检查往往违背人性,因为没有孩子喜欢检查作业。但大模型就不一样了,你只要把检查任务再交给它,它“通电”就能做执行,这件事更可行。这就是我说的受控化。
这不再是“丢一个任务 → 出一个结果”这么简单,而是要在关键环节引入核验。有确定性的核验,也有非确定性的核验,它们能快速暴露出大模型的能力边界。以前像 ChatGPT,总会给你一个答案,但一旦加入核验,就能清楚地看到哪些它是能力边界,很多时候它也通不过核验。
最后一步是约定化。意思是说,整个体系要用真实场景的数据来验证结果是否符合行业要求。如果没达到,就要反过来提升这个体系:关键程序要更细化,核验环节要增强。通过这样的迭代,才能保证输出真正符合行业标准。
今天大模型应用缺少的,正是这样一套“高阶程序”的体系。通过显性化、受控化、约定化三步结合,我们才能让大模型在各行各业达到所需的可靠性。
👦🏻 Koji
你是怎么想到要推动“高阶程序”的?听起来它和密算的关系没那么直接。
👦🏻 韦韬
我其实不只是做密算。从业二十多年来,我的核心工作都是让复杂系统更安全、更可靠。AI 出来后,它本身不可靠,自然也成了我的研究对象。放在行业背景下,现在有两个巨大的挑战:一是安全保障能力,二是数据加工能力。安全这方面我们这些年已经打下了基础,而密算下一步最重要的缺口,其实就是提升数据加工处理的能力,尤其在大模型出来以后。
问题的关键是:我们如何让 AI 真正可靠地工作?很多人把 AI 当成人类的“拐杖”,但我觉得这理解反了。今天的大模型在某些领域,比如高考或奥数,能力已经超过了大部分人,但在一些最基本的事情上却反而做不好。问题不在于大模型本身,而在于我们用错了方法。
比如在工厂里我们不会指望一个人把所有事情做完,而是通过流水线把任务拆分得很细,每个环节都有明确分工。但在用大模型时,我们却总是期待它“十全十美”,什么错误都不犯。问题就在这里,我们其实是用错了方法。
如果真把大模型当作一种高效的生产力工具,就该用工程化的思路来管理它,而不是继续沿用“手工作坊式”的方式。
👦🏻 Koji
所以这个观点你和千问团队,或者其他大模型科学家们交流过吗?
👦🏻 韦韬
有的。我和很多既有 AI 背景、又有工程背景的专家聊过,他们都非常认可,也认为这是必经之路。其实你会发现,千问 3 的核心模型用得最多的是 32B。它当然也有更大的,比如 235B、480B,但真正最常用、最核心的还是 32B。32B 就很像一个生产流水线的模型。
👦🏻 Koji
是流水线的模式?
👦🏻 韦韬
对。32B 可以绑在单卡上,成本低,在我们做“高阶程序”的应用时也非常适配。现在大家总觉得大模型应该无所不能,但现实是,在产业化场景里,那些超大模型往往太贵,而且在可靠性上也不见得比 32B 更好。反而是 32B 这种“工程化模型”,和人类专家交互、做 copilot,是非常好的应用场景。
所以我们判断,未来一定是不同场景配不同模型。就像汽车,不会只有一个通用引擎,不同的车该有不同的引擎来匹配。
商业化挑战:要做吃螃蟹的先行者
👦🏻 Koji
像刚刚提到的“高阶程序”和“密态计算”,我感觉韦韬总一直都在寻找让你兴奋的大问题,把复杂的事情简单化、然后解决掉。那作为密算的董事长,你现在不仅要面对技术,还要面对增长和商业等更复杂的挑战。这一年多你有什么感受吗?
👦🏻 韦韬
这是个很好的问题。我觉得这也是大多数技术人员转型时都会遇到的困惑。我们现在还在探索的路上。今天的密算有点像十几年前王坚博士在推云计算。一开始他甚至被说成“骗子”,而我至少比他幸运,没有人这样说我(笑)。但核心还是要相信,这件事真的能给社会带来价值。
密算的优势在于,它是一个全新的蓝海市场,从概念、架构到体系,很多东西都是我们首创提出的。但挑战也在这里:它不是成熟市场,理念、技术、产品,甚至政策层面,都需要我们推动。好在有国家数据局的指导,“数据要素”已是国家核心战略,需求非常强烈。普惠信贷、医保、车险等行业,都有明确痛点,一旦数据应用进去,就能产生显著业务效果。
所以我们和那些“愿意先吃螃蟹”的伙伴一起试点,立起行业标杆,推广起来也容易得多。过去大家担心密算太贵、处理不了数据,但这两年在复杂场景中我们已验证了它的可行性,接下来就能更大范围落地。
本质上,密态计算改变了人们对数据的固有认知。以前大家觉得必须把明文数据交出去才能用,但风险太大,不敢给。密算提供了一种新的方式,我们把它看作新基建:一种全链路安全、全流程可控的基础设施,无论谁来运维或研发,数据始终能得到保障。
这也带来了新流通的模式:数据不必以明文流转,就能被加工、融合和验证。传统上“数据不出域”,域是以资产为边界,彼此排他,导致融合很浅;而在密态计算下,“域”转变为基于密钥管控的虚拟安全域。这样的新域不仅保障力更强,而且可扩展、可融合、可审计,让数据能够实现深度融合与深度应用。
👦🏻 Koji
说服对方建立信任其实挺难的。因为一旦数据没被保护好,对方可能会有灾难性的损失。你们会不会遇到合作方要求签非常严格的合同,如果出问题就要赔偿巨额损失?
👦🏻 韦韬
其实我们很乐意推动行业引入数据安全保险。在美国,这已经是一个成熟机制:先有合规准入,然后由保险兜底。比如在加州,只要涉及个人信息的互联网服务,就必须强制上网络安全险,就像国内的交强险一样。出了事故,保险先赔,但赔完后保费会上升。通过这样的机制,就能形成一个行业闭环。
在中国,我们正在努力推动类似机制。我们不怕赔付,关键是要把市场化机制转起来。但国内目前还是以行政管理责任为主,还没有和市场化打通,所以闭环还没建立。结果就是,大家只能要求“绝对不能出错”。
我们的密态计算体系本身就是对标等保四级的技术标准,这是行业里商业化能达到的最高安全等级。只要用过的合作方,对它的保障能力基本都是信服的。同时,我们也把相同的代码托管到国家最权威的测评机构,进行代码安全分析、溯源和备案。现在这一工作正在推进,目的就是进一步确保可信。
总体而言,我们给行业提供的是最高性价比的全链路安全保障方案。用密算来部署,比事后外挂一堆安全措施的投入低得多,但保障能力却显著更高。只有这样,才能真正打消各个参与方的心理压力。
👦🏻 Koji
刚才我们提到蚂蚁发起的「隐语」开源社区正好三周年。我也看到过你的一些分享,比如说你是“泡着开源社区长大的”。能不能回忆一下,当初最早接触开源时都活跃在哪些社区?有没有哪些经历对你后来的影响特别大?
👦🏻 韦韬
其实蚂蚁内部一直有很活跃的开源氛围,我个人也参与了很多项目。我曾为蚂蚁开源活动写过一段致辞 ——— “开源是人类文明史上第一次,把端到端的工程实现细节与世界共享。 这种伟大的模式极大加速了数字化革命的进程。相比传统的书本、专利或课堂教育,开源以前所未有的方式,把知识开放给全世界。这背后是一种带着期待和善意的精神。我们在开源中学习,在开源中成长,也回应了这份期待,没有辜负这份善意。这是世界最幸运的事。”
👦🏻 Koji
对,开源最初真的很无私,端到端把工程实现完全展现出来。
👦🏻 韦韬
是的,给我触动最大的还是 Linux。大概 93、94 年,我在读大学时,宿舍里有个同学后来成了“一塌糊涂”BBS 的站长,他最早跟我说 Linux 出来了,很厉害。当时我还不屑一顾。 到 96 年,国内 Linux 刚刚起步,没有好的传播载体,大家都靠软盘拷来拷去。那时中科院一位老师的实验室有刻盘机,我就做了国内第一张双面的 Linux 光盘——一面是 Red Hat,另一面是 Slackware。这批光盘我拿到清华、北大和中科院的 Linux BBS 板块去卖,总共卖了几百份。算起来,那可能就是国内第一份真正意义上的 Linux 发行。
👦🏻 Koji
当时也没有什么开源协议吧?所以你刻光盘去卖。
👦🏻 韦韬
不会。Red Hat 和 Slackware 本身就是开源的,可以自由分发,再分发完全没问题。这就是开源的精神。那时我主要关注的就是 Linux 内核,还有 GCC、LLVM 这些底层软件。
后来在方正、北大时我做过一段网络安全。网络核心处理依赖的就是 Linux 内核里的 netfilter。我常常拿着一本小笔记本,做各种内核状态的分析和调试。再往后做网络处理器,也还是基于这个体系。那时候真的觉得自己很幸运——换成其他任何技术环境,都没办法这么快接触到真正生产级的应用。而开源给了我这样的机会,让我能更快进入专业化的技术世界。
👦🏻 Koji
确实,我也学计算机。但刚才听你讲的时候突然想到一个画面。比如学航空航天、汽车制造的同学,世界上最好的设计图纸简直要靠间谍潜伏十年才能偷到一份。而学计算机的人,却能直接看到全世界的开源代码。
👦🏻 韦韬
没错。背后的原因是,软件承载的社会化劳动太庞大,已经超越了任何一家公司的能力,甚至连行业巨头都扛不住。于是开源成为一种必然,把全球最顶尖的人才聚集在一起,把事情做到最好。
想想 90 年代 Linux 刚出现时,还只是小众,而 2000 年左右 Windows 如日中天。可转眼间,现在整个生产环境几乎全是 Linux。这种变化悄然发生,也让我们更笃定:开源或许会和商业化在某些地方冲突,但它对人类文明的进步是至关重要的。
👦🏻 Koji
当时发起隐语这个开源社区,你的目标是什么?
👦🏻 韦韬
有几层方面考虑,第一,隐私保护计算本质上是安全技术。如果它是一个“黑盒”,别人怎么会相信?怎么来评判它是否安全?安全一旦缺乏透明,就容易出现“柠檬市场效应”——劣币驱逐良币。比如,有些厂商测安全时把参数开到最强,测性能时又把安全降到最低。消费者看不懂,就容易被误导。所以我们发起开源,就是为了提供透明性,让行业能真正认清和掌握安全的标准。
第二,这个行业需要更多人能够依托这样的平台不断成长。隐私计算需要的远不止蚂蚁或少数几家公司来做。更多的人才、更多的老师和同学都应该有这样的舞台去学习和成长。应用场景也远不止金融,像我们提到的非洲传音手机,就是个出乎意料的案例。
👦🏻 Koji
是的,如果不做开源,可能就不会有像传音这样的企业进入整个生态。
👦🏻 韦韬
对。所以当时我们内部也争论了很久,但最终选择开源,事实证明是非常正确的。当然,商业化不可避免会受到一些冲击。
👦🏻 Koji
当时最大的争议是什么?
👦🏻 韦韬
最大的争议就是开源会不会阻碍商业化。
后来我们发现,其实两者是平行的。商业化所需要的服务,与开源并不冲突。相反,开源能扩大市场接触面,对商业化反而有利。只是你需要平衡短期收益和长期收益。比如说,过去一个模块可能能卖几百万,但开源以后卖不了那么高价了,却能带来更多客户。更重要的是,真正最有价值的并不是计算模块本身,而是跑在上面的业务,它带来的价值远远超过单一的技术模块。
👦🏻 Koji
这三年里,你觉得最有成就感的事情是什么?
👦🏻 韦韬
我觉得有几个方面。
首先,像刚才提到的那些应用场景,密态计算真的在给行业带来微小而美好的改变,在不知不觉中服务大众,也服务我们自己,这点让人很欣慰。
其次,是人才的成长。最初是我们和高校老师、同学一起研究,后来看到越来越多的老师和学生,能独立用“隐语”发表顶会论文,不需要我们参与,他们也能做出成果。这让我很有成就感。
最后,是生态的反馈。比如在隐语的活动中,有同学说它“好用、方便、代码质量高”。再比如像传音、以及很多友商,都在使用隐语,范围远超我们的想象。这些反馈让我觉得,我们真正在把技术回馈给世界,也为未来打下了很好的基础。
像今年三周年的活动,已经有更多行业企业加入进来。过去隐语主要聚焦在隐私计算的技术框架,而现在,我们正走向数据流通全栈技术的开源体系。这一转变,标志着一个新的起点。我对此感到特别自豪。
👦🏻 Koji
现在有些人觉得开源好像成了竞争手段,不再那么纯粹了。比如 OpenAI 现在被嘲笑是 “Close AI”;Meta 最开始也主打开源,但现在策略也在摇摆。似乎大家开源最终还是为了商业目的。你怎么看?
👦🏻 韦韬
我觉得开源和公司的商业战略结合,本来就是必然的。但我们不能把一家企业放到“道德制高点”上,要求它永远开源。开源从来不是某一家公司单独的责任,而是整个行业共同努力的结果。一个公司在某个阶段选择开源,可能是为了推动行业发展;在另一个阶段选择闭源,可能是出于商业利益的考虑。
长期来看,行业会形成相对的平衡,生态也会在开源与闭源的动态中不断演进。我相信最终大家会找到一个平衡点——在开源和商业化之间找到合理的位置,这就是我始终坚信的行业未来。
在蚂蚁密算的实践中,我们也发现商业化的普惠价值非常重要。开源的直接受益者往往是具备技术能力的程序员,但更多的中小企业并没有能力直接利用开源,这时候就需要商业化来服务他们。所以,不要把商业化和社会效益对立起来。找到一种更加普惠的商业模式,本身就是对社会的重要贡献。
AI 的冲击与对未来的思考
👦🏻 Koji
我也很好奇,AI 在生活里对您个人、对您的家庭、甚至对您的孩子,有带来过哪些让您感到惊喜的变化吗?或者一些挑战。
👦🏻 韦韬
现在所有家长、老师都都挺焦虑的:孩子到底该怎么教育?大模型能考高考,知识点覆盖又广,那以后还怎么教?我一开始也担心,但后来慢慢想明白了:我们一定要拥抱大模型,拥抱新技术。不过有些核心的东西从来没有变:求真务实,学会核验。无论是大模型告诉你的,还是自媒体告诉你的,都不能道听途说。
大家常说大模型有“幻觉”,其实信息失真的问题在各个渠道都存在。关键是,你如何在这样的信息环境里不迷失自己,保持独立判断。这一点从来没变。特别是在媒体充斥各种耸人听闻文章的今天,更需要孩子学会形成自己的独立观点。
很多时候,人们对一件事原本一无所知,看了一篇文章后却立刻产生强烈情绪——要么极度喜欢,要么极度痛恨。关键是还是要有自己的判断,不要轻易被情绪操控。更重要的是要提升认知,只有认知提升了,才能真正用好大模型,而不是被它牵着走。
👦🏻 Koji
但具体该如何提升认知呢?
👦🏻 韦韬
我的体会是,学习必须系统化。大模型可以当成一个很好的学伴,它的知识面非常广,但它也会犯错。所以你要有自己的学习体系,在某个领域做到系统化,形成自己的观点,并且不断去验证。大模型替代不了这一点。只有这样,你才能真正利用好它,把效率提升到以前难以想象的程度。这可能也是今天的孩子们最核心需要掌握的能力。
👦🏻 Koji
所以韦韬总你的小孩现在是什么样的年纪?
👦🏻 韦韬
下学期五年级,10岁。
👦🏻 Koji
那在面对社会环境和技术进步时,您会怎么考虑给孩子什么样的教育或引导?
👦🏻 韦韬
我觉得他还小,所以没有太大压力。但他已经会用一些 AI 工具来做作业了,比如豆包、还有有道的翻译笔。碰到有道的朋友时我也说过,希望这类工具能做得更好,这样孩子就可以少问我一些问题(笑)。
很多人会困惑,要不要学编程、要不要学数学?我觉得非常有必要。就像我之前提到的“高阶程序”,它能把编程语言作为技术语言来使用。大模型本身都会编程,如果人完全不会,就会缺少一项关键能力。
编程的特殊之处在于,它是人类工作里极少数真正需要大规模、严丝合缝逻辑推演的活动。很多时候我们日常工作的思维深度不会高于初中数学题,但编程不一样,它是一个极其庞大、不能出错的体系。这样的逻辑训练我认为还是很重要的。
👦🏻 Koji
所以你在用什么方式让孩子练编程?
👦🏻 韦韬
他现在 Python 已经考过 7 级了。从小就开始学,而且很喜欢。我觉得这件事其实很容易,Python 编程真的很容易上手。
👦🏻 Koji
要不要在我们播客里“带带货”?他是在哪个培训机构或者用什么 App 学的 (笑)?
👦🏻 韦韬
哈哈,不过说真的,这对孩子是很好的锻炼。他也喜欢机器人。但现在整个教育体系其实很急功近利。我还问过学校老师,像机器人这种比赛挺好的,是不是能更多的支持?老师说,即便拿到国际比赛的第一名,也不会对学校的升学有任何提升。
👦🏻 Koji
所以大家其实都在“以终为始”,只是终点不一样。
👦🏻 韦韬
对。现在的孩子,其实很多我们小时候梦寐以求的东西,他们都能轻易接触到。但不幸的是,他们的选择实在太多了。像我太太小时候,课外书只有一本成语词典,所以把里面的成语故事翻来覆去看得特别熟。今天的孩子资源太丰富了,结果常常看不过来,反而容易迷失。
👦🏻 Koji
那你会禁止孩子刷短视频吗?
👦🏻 韦韬
拦不住啊。
👦🏻 Koji
心有余而力不足。
👦🏻 韦韬
说到底,孩子的自控力还没到那个程度。你只要给他一个电子设备,他一定会去刷。所以家长必须做管控和引导。但好的一面是,如果他对某件事真正感兴趣,现在有海量资源可以支持和推动他深入下去。这一点比我们当年条件要好得多。
👦🏻 Koji
那有没有什么事情到了今天,尤其是因为 AI 的发展,就变得特别简单、轻松便利了?
👦🏻 韦韬
举个例子啊,扫地机器人真的很好用。其实这背后不只是 AI,而是整个中国工业体系升级的体现。
我在美国的时候用过不少机器人,包括扫地机器人,那时候体验很差。地扫完后,头发会缠在滚轮上,要拿刀割开,非常麻烦,拖地也容易留下异味。
今天这些问题都解决了:不会再缠头发,水箱除臭也很彻底,整体的自动化水平非常高。这背后其实就是中国几十年工业体系积累和蜕变的成果,真的是有种“破茧成蝶”的感觉。
👦🏻 Koji
前段时间有个数据:今年美国应届毕业生里,本科计算机专业的失业率是 6%,艺术系只有 3%。这其实和 AI coding 的冲击直接相关。我也很好奇,您在行业里工作了二十多年,AI 的冲击对您来说大吗?
👦🏻 韦韬
我感觉还好。站在行业专家的角度,现在的 AI 其实还有很多缺陷。
👦🏻 Koji
所以你完全不担心 AI 会影响你的价值?
👦🏻 韦韬
我不担心。AI 最擅长的,其实是帮助行业专家把价值发挥得更大。它没法让一个初级程序员立刻变成高级程序员,但却能让高级程序员的效率成倍提升。过去一个高级程序员精力有限,需要带很多初级程序员,团队一大就会产生复杂的生产关系。
而现在,AI 极大简化了这个过程,效率提升非常明显。你的行业认知越高,AI 能放大的倍数就越大。换句话说,真正能得到加成的,是那些认知水平足够高的从业者。核心在于,你要不断提升认知,而不是停留在重复劳动里被淹没。
每一次技术换代都会带来巨大冲击,这是必然的。就像当年计算机出现,很多工种消失了,但计算机也创造了更大的产业机会。如果不拥抱新技术,要么被淘汰,要么被社会逼着去拥抱它。
👦🏻 Koji
你刚才提到 AI 对初级程序员帮助有限,却能让高级程序员效率倍增。那今天的初级程序员,该如何成长为高级程序员?你会给刚入职场的年轻工程师什么建议,让他们更好地提升自己、抓住未来机会?
👦🏻 韦韬
这就回到今天的主题:开源和 AI 带来的巨大变化。开源本身是把端到端的细节分享出来,但很多人拿到代码也看不懂。有了 AI,它能帮你解释背后的原理,你就能学得更快、更深入。而且这些资源几乎都是开放的。
这是其他任何行业都比不上的机会。但凡有心的同学,面临的是有史以来最好的学习环境。开源社区本身就很开放,只要你能贡献,大家都会接纳你。
对计算机行业的同学来说,现在一定要努力去拥抱大模型。它带来的提升巨大,机会也非常多。
过去写程序要精确控制每一个比特,如今高阶程序已经演变为与自然语言的融合。很多在传统编程语言里难以实现的事情,如今都能交给大模型完成,它带来了了全新的想象空间。这不仅是一次技术上的突破,更是整个行业的洗牌时刻。未来在商业化和行业应用层面,还会有更广阔的空间等待大家去探索。
👦🏻 Koji
好的,我们今天就先到这里。非常感谢韦韬总的分享,内容特别精彩,也期待您以后能再次来到「十字路口」。
👦🏻 韦韬
好的,谢谢。
文章来自于微信公众号“十字路口Crossing”,作者是“十字路口”。