-
是「福尔摩斯」,也是「列文虎克」,智谱把OpenAI藏着掖着的视觉推理能力开源了
光看图,你能猜出这是哪儿吗?当同事出差回来扔到群里这么一张图,我们也是猜了半天,但毫无头绪。直到另一位同事把图扔给智谱的新模型 ——GLM-4.5V,这个谜团才解开。把照片截图传给 GLM-4.5V(避免模型利用照片的 EXIF 元数据),它很快就推理出了结果。没错,图里的地方是多瑙河畔。尽管同事拍照的角度和风格和小某书上的精美照片大相径庭,但智谱的新模型还是通过深度分析给出了准确答案。 你可能要…... -
苹果 AI 下半场:年底问世的新 Siri,要彻底改变 iPhone 的交互
从上周开始,我们就开始看到一些关于苹果在人工智能领域的长期规划开始浮出水面:从名为 AKI、力求在 iPhone 端侧打造「类 ChatGPT 搜索体验」的答案引擎,到本周目标指向 AI Agent 能力的「新 Siri」概念爆出。无数消息都指向了一个目标:「重生」。从各路消息来看,Siri 的重生不是一次性的「大爆炸」,而是一个精心设计、持续好几年的分步计划。这既是因为技术太复杂,也是一种聪明的…... -
GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的
别急着用GPT-5编程了,可能它能力没有你想象中那么强。有人发现,官方测试编程能力用的SWE-bench Verified,但货不对板,只用了477个问题。什么意思呢?我们知道,SWE-bench是评估模型/智能体自主编程能力的一个通用且常用的指标。而SWE-bench Verified作为它的子集,本来一共有500个问题。现在相当于OpenAI自行省略的那23个问题,自己搞了个子集的“子集”来评…... -
OpenAI夺金IOI,但输给3位中国高中生
刚刚,OpenAI官宣:IOI金牌收入囊中!其推理模型在今年IOI线上竞赛中成绩刷新纪录:总分533.29,在全球330名人类选手中总排名位列第六;而在所有AI参赛者中,稳居第一。PS:AI没比过的五个人里,有三个都是咱中国人,分别是刘恒熙(宁波市镇海中学)、范斯喆(浙江省诸暨市海亮高级中学)、陈昕阳(杭州第二中学)。有意思的是,OpenAI表示,这次并未为IOI训练新的参赛模型,而是集成了多个通…... -
第一个能帮你做生意的Agent来了。
全世界可能是第一个,能做生意的Agent来了。这,就是阿里国际站最近升级的Accio Agent。网址在此:https://www.accio.com/这是一个面向外贸、面向海外的tob产品,所以国内可能知道的人并不是很多。但其实,Accio已经默默攒了200万企业级客户了。ToB领域,200万客户,这是什么水平,大家懂得都懂。。。我之前因为刘世奇,认识了阿里国际站,我自己本身就对外贸非常感兴趣,…... -
英伟达为机器人推出懂推理的“大脑”!升级版Cosmos世界模型来了
老黄看好机器人,还真不是嘴上说说!这不,就在正在举办的SIGGRAPH(计算机图形学)大会上,英伟达为机器人带来了全新升级的Cosmos世界模型。Cosmos主要被用来生成符合现实世界物理规律的合成数据,自发布以来,已被Figure、Agility Robotics、通用汽车等一众知名机器人和自动驾驶公司采用。这次升级重点聚焦在规划能力和生成速度两大方面:推出Cosmos Reason:一款70亿…... -
GPT-5 上线第一剑,先斩意中人!Sam Altman 豪赌输了
上个周五凌晨一点千呼万唤的 GPT-5 终于上线了。要知道,在 GPT-5 发布前夕,ChatGPT 的全球活跃用户已攀升至每周 7 亿,远超绝大多数消费级互联网产品的历史纪录。Sam Altman 自己也不避讳这次模型跃迁的分量。他在一次播客中公开表示,GPT-5 的能力强大到“让他本人感到不安”,并笑称 GPT-4 回过头看只是“你们用过的最笨的模型”。光看这段话,GPT-5 应该是毫无争议的…... -
MiniMax 悬赏 15 万美元,重金求「子」
Remix Marketplace 遥遥领先在 AI Agent 领域,我们听到一个有趣的说法:重金求「子」这里的「子」指的是其他有创意的用户用 AI Agent 做出来的模板,供别人复制改造。「十字路口」团队最近又深度体验了 8 月 11 日新发布的 MiniMax Agent 的 Remix Marketplace 模块。在这个「Agent 市场」中有 2 个大逻辑:【1】Remix 他人作品…... -
付费升级 AI 前必看!4 个灵魂拷问,让你别花冤枉钱
上周 GPT 5 的更新,除了激起对 4o 的想念,还激起了对 OpenAI 刀法的埋怨:优先付费用户,优先 API 支持……说吧,奥特曼,是不是就想逼我花钱升级?平心而论,OpenAI 的免费额度,在这次更新之前一直是不错的。比不上 Gemini 大方,但是稍微有点强度也够用。市面上主流的 AI 订阅费用,第一阶段的基本在 20 美元左右,Agent 类略高,年付有一定优惠。第二阶段能直接飙到 …... -
AI 卷完生产力,下一个万亿战场:情绪陪伴市场
当大多数 AI 工具都在拼“能做多少”:生成多少文案、提高多少效率、节省多少时间。有一个产品,反着来 —— 什么都不做,只听你说话。不提模型名,不装人格陪聊,也不让你变高效。打开 App 的第一句话就是:“你在想什么?”我是下班后随手测的,结果越用越觉得离谱:它居然跑出了月访问 17 万、订阅年费超 $100 的稳定数据。产品名叫 Rosebud。看似没存在感,却抓住了一个极窄又高频的情绪缝隙。它…... -
商汤王晓刚:世界模型将加快AI从数字空间进入物理世界,「悟能」想做那个桥梁
具身智能「大脑」,更准确地,以「世界模型」为内核的具身智能「大脑」会成为 AI 下一阶段竞争焦点吗?上世纪九十年代,「世界模型」思想雏形初现,之后几十年被不断强化、延伸,直到 ChatGPT 引爆 AI 新浪潮、Sora 问世、大模型落地成主流、具身智能迎来新纪元……「世界模型」或是通往「类人智能」的解法被视为新的业界共识。与此同时,在产业界,如果说 2025 年上半年 AI 发展主要围绕 Age…... -
AI应用如何落地政企?首先不要卷通用大模型
智能体元年,处处都是智能体。甚至刚落幕的ISC.AI 2025第十三届互联网安全大会,主题直接就是“ALL IN AGENT”。在这里,全球首个L4级智能体系统“纳米AI”上演技术秀,具身智能机器人主持整个会议流程,重新定义“智能参会”。大会传递出的信号清晰而强烈:智能体技术正加速渗透进产业核心领域。360作为大会主办及支持方,其政企AI业务已经与智能体技术深度绑定。这场大会既是行业趋势发布会,更…... -
深度|当AI创业进入深水区,谁在为AI新势力提供“确定性”?
图片来源:Unsplash01 AI创业新范式:七家公司的共同“底座”2024年,AI创业的叙事正在发生根本性转变。如果说2023年是“百模大战”的技术奇观与资本狂欢,那么今年,当市场的喧嚣逐渐沉淀,聚光灯则明确地打向了产业落地的主战场。一批真正意义上的“AI原生”新势力正在快速崛起,它们不再是传统业务的AI改良派,而是将大模型作为数字世界的地基,直接构建商业大厦的“原住民”。我们观察了七家处于不…... -
腾讯AI Lab|让AI左右互搏,无需人类数据也能自学成才!
一句话概括,这篇论文堪称AI版的"精神分裂式"学习法,一个模型扮演魔鬼教练,另一个扮演受虐学生,结果居然双双进化了!(原论文题目见文末,点击阅读原文可直接跳转至原文链接, Published on arXiv on 07 Aug 2025, by Tencent AI Seattle Lab, Washington University in St. Louis, Univer…... -
新加坡的Agent黑马Agnes,双杀技能:Deep Design × Wide Research重新定义智能体?
之前在X上看到过一个新加坡版的DeepSeek,叫Agnes AI,主打一站式Agent空间。但当时我自己搞产品焦头烂额的,随手点开看了看,就放下了。后来在Product Hunt上又看到这款产品,以及各种海外平台时而刷到。终于,前段时间在WAIC,我见到了他们的创始人,还有他们即将发布的新功能。这次让我觉得,当一款不错的产品第三次出现在我眼前,再错过、再忽略,就是我的问题了。也许,这是一个能改变…...















