-
腾讯张正友:具身智能必须回答的三个「真问题」
7 月 27 日,腾讯发布了具身智能开放平台 Tairos,以模块化的方式向行业提供大模型、开发工具和数据服务,试图为具身智能的研发和应用提供一套通用的支撑体系。在 Tairos 问世之前,腾讯 Robotics X 实验室已在具身领域探索七年多。从多模态四足机器人 Max 到轮腿机器人 Ollie,从灵巧手 TRX-Hand 到人居环境机器人原型小五,这些自研项目不仅是技术展示,更是其探索感知、…... -
token危机解决?扩散模型数据潜力3倍于自回归,重训480次性能仍攀升
扩散语言模型(DLMs)是超强的数据学习者。token 危机终于要不存在了吗?近日,新加坡国立大学 AI 研究者 Jinjie Ni 及其团队向着解决 token 危机迈出了关键一步。在当前大语言模型(LLM)的持续发展中,面临的挑战之一是可用的高质量训练文本数据(tokens)即将枯竭,并成为限制模型性能持续提升的关键瓶颈。另外,新增的高质量数据来源少,获取成本高,去重后更加稀缺。因此,当模型规…... -
从 AI 创业角度看 GEO:如何引流、效果评估,以及创业机会在哪里?
GEO/AEO,并不是一个全新的概念。简单说来,就是 AI 搜索和 LLM 时代的 SEO。但又跟 SEO 有些不太一样,比如效果的可监控、内容的准备策略等,都跟 SEO 时代完全不一样了。GEO 是不是个值得做的大生意,目前也存在不少争议,有些人觉得带来了新的想象力,有些人觉得,最多也就是一个新的 SEO。但共识是,这事儿值得做,而且得做。公众号「thinkloop」的这篇文章,从 GEO 的原…... -
OpenAI惊人自曝:GPT-5真「降智」了!但重现「神之一手」,剑指代码王座
GPT-5智商测试,仅拿下了70分?全网狂吐槽「降智」背后的真相,竟是「路由」决定了模型的智能。想要解锁神级GPT-5,秘诀在于prompt。这不,医学家借助GPT-5重现了「神之一手」时刻。GPT-5发布72小时后,一张IQ测试结果震惊了全网。在门萨IQ测试中,GPT-5拿下了118分,离线测试70分;GPT-5 Thinking则分别获得了85分和57分。这一结果,创OpenAI模型家族IQ测…... -
一文看尽世界机器人大会,不用去现场人挤人了
2025世界机器人大会开幕当天,门口挤满了人人人。不过,当看到百花齐放的机器人们,这趟探馆,值了!世界机器人大会已经走过10年,回看以前的新闻和产品,此刻站在场馆里大概只有一个感慨:机器人发展太迅速了!整体来说,现场的机器人几乎做到了全场景覆盖与全行业应用。现场有200余家国内外机器人相关企业及百余款新品参展。除了机器人本体外,很多机器人产业链的各类关键零部件供应商也参与了这场机器人盛宴。本次大会…... -
刚刚,谷歌摊牌:Genie 3让你1秒「进入」名画,人人可造交互世界!
谷歌最新发布的Genie 3世界模型,正以惊人AI能力颠覆想象:从文本生成交互式空间,到进入经典名画如《苏格拉底之死》和《夜游者》自由探索,甚至训练3D模型实现沉浸式体验!谷歌摊牌了,彻底不装了!他们前几天刚刚发布的Genie 3世界模型,正在疯狂展示AI的超能力。它不只是能从文本中生成交互式的AI空间世界,还能操控图像和视频。比如,你现在可以进入到世界名画中去,随意的在其中移动、观察。这种身临其…... -
起猛了,诺基亚用上 DeepSeek 了
想象一下这样的画面:你掏出一台看起来像 30 年前的诺基亚手机:熟悉的 T9 键盘,发出「咔哒咔哒」的声音。2.4 寸超低分辨率的小屏幕,闪着怀旧的光。你问它:「你怎么看人们沉迷手机这件事?」它居然秒回了一段吐槽,告诉你:「真正强大的手机,应该能砸核桃」???这就是我与 HMD 3210 的奇遇记:一台外表是 30 年前诺基亚、内心却住着一个完整大模型的「时光机器」。429 块,居然也能用 AI?…... -
因为GPT-5,这群人决定在Reddit上起义。
这个周末,对OpenAI的抗诉,好像从未如此热闹过。起因自然还是因为GPT-5。OpenAI上了GPT-5当天,做了一个非常神奇的操作,他们只保留了GPT-5,然后把GPT-4.5、GPT-4o、o3什么的,全都砍掉了。如果从软件升级的角度,这样干好像没有什么毛病,对吧?比如你的微信从3.6版本升级到4.0版本,那3.6版本消失,你可能不会有啥感觉,甚至会因为4.0的新功能而感到兴奋。因为微信对你…... -
独家丨星海图将发布首个开放世界真机数据集及VLA开源模型
尽管今天语言模型的开源生态已经十分蓬勃,但机器人领域,开源还是很小众的词汇,相比于模型的开源,数据的开源更为稀缺,甚至有公司直言“数据是不可能开源的”。本来就不走寻常路的星海图,决定继续唱“反调”。硅星人独家了解到,星海图即将开源全球首个开放场景高质量真机数据集Galaxea Open-World Dataset,及其G0-快慢双系统全身智能VLA模型。这一举动无疑在相对各自为战的机器人行业打开了…... -
Sheet0.com王文锋,两人团队融资500万美元,要打造属于Agent的Google.com
Sheet0.com: the first Level 4 Data Agent在过去两年里,AI Agent 从早期的技术探索逐渐进入应用落地期。无论是 OpenAI、Anthropic 等头部公司推动的通用型 Agent,还是垂直场景下的自动化工具,市场都在快速验证一个趋势——数据已成为驱动 Agent 能力的核心燃料。然而,获取、清洗、组织高质量数据的难度和成本,依然是阻碍 Agent 大规…... -
从开源项目到2500万美元融资:如何打造下一代AI Agent的互联网基础设施
你有没有想过,AI agent 真正要在生产环境中发挥价值,最大的瓶颈竟然不是模型能力,而是它们无法有效地"连接"到互联网?这听起来可能有些反常识,但当我深入了解了 Tavily AI 这家刚刚完成 2500 万美元融资的公司后,我才意识到这个问题的严重性。想象一下,你构建了一个用于金融风险控制的 AI agent,但它无法实时获取最新的市场数据和新闻信息。或者你的销售 AI …... -
苹果分享 iOS 26 即将推出的 AI 基础模型的细节
在最近的技术报告中,苹果公司提供了更多关于 iOS 26 新的苹果人工智能基础模型(Apple Intelligence Foundation Models)的性能和特性的详细信息,该模型是在最近的 2025 年全球开发者大会(WWDC)上宣布的。苹果基础模型包括一个 3B 参数版本,优化后可在苹果 Silicon 设备上运行,另外,还有一个更大的模型,设计用来在苹果私有云计算平台上运行。苹果强调…... -
让OpenAI只领先5天,百川发布推理新模型,掀翻医疗垂域开源天花板
刚刚,全球最强开源医疗模型发布,来自中国。百川开源最新医疗推理大模型Baichuan-M2-32B,在OpenAI发布的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。不仅以小博大,而且领先除GPT5以外所有的开源闭源前沿模型。落地门槛还非常低,支持RTX4090单卡部署。这意味着哪怕是中小型医疗机构,也有能力负担起医疗大模型的私有部署。现如今,AI医疗可谓是…... -
刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。
上上周一的晚上,智谱开源了当今最好的模型之一,GLM-4.5。然后,这个周一,又是突如其来的,开源了他们现在最好的多模态模型:GLM-4.5v。也是4.5系列的,用GLM-4.1V-Thinking的技术路线把GLM-4.5-Air重新训练了一遍,实现了视觉多模态的能力。模型参数106B总参数,12B激活,这个规模在开源多模态模型里已经算是大块头了。模型能力也有点东西,在所有的开源多模态模型中,4…... -
机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」
8 月 11 日,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP ,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。开源链接:机器人上下文协议 RynnRCPhttps://github.com/alibaba-damo-academy/RynnRCP视觉 - 语言 - 动作模型 …...