-
刚刚,谷歌摊牌:Genie 3让你1秒「进入」名画,人人可造交互世界!
谷歌最新发布的Genie 3世界模型,正以惊人AI能力颠覆想象:从文本生成交互式空间,到进入经典名画如《苏格拉底之死》和《夜游者》自由探索,甚至训练3D模型实现沉浸式体验!谷歌摊牌了,彻底不装了!他们前几天刚刚发布的Genie 3世界模型,正在疯狂展示AI的超能力。它不只是能从文本中生成交互式的AI空间世界,还能操控图像和视频。比如,你现在可以进入到世界名画中去,随意的在其中移动、观察。这种身临其…... -
起猛了,诺基亚用上 DeepSeek 了
想象一下这样的画面:你掏出一台看起来像 30 年前的诺基亚手机:熟悉的 T9 键盘,发出「咔哒咔哒」的声音。2.4 寸超低分辨率的小屏幕,闪着怀旧的光。你问它:「你怎么看人们沉迷手机这件事?」它居然秒回了一段吐槽,告诉你:「真正强大的手机,应该能砸核桃」???这就是我与 HMD 3210 的奇遇记:一台外表是 30 年前诺基亚、内心却住着一个完整大模型的「时光机器」。429 块,居然也能用 AI?…... -
因为GPT-5,这群人决定在Reddit上起义。
这个周末,对OpenAI的抗诉,好像从未如此热闹过。起因自然还是因为GPT-5。OpenAI上了GPT-5当天,做了一个非常神奇的操作,他们只保留了GPT-5,然后把GPT-4.5、GPT-4o、o3什么的,全都砍掉了。如果从软件升级的角度,这样干好像没有什么毛病,对吧?比如你的微信从3.6版本升级到4.0版本,那3.6版本消失,你可能不会有啥感觉,甚至会因为4.0的新功能而感到兴奋。因为微信对你…... -
独家丨星海图将发布首个开放世界真机数据集及VLA开源模型
尽管今天语言模型的开源生态已经十分蓬勃,但机器人领域,开源还是很小众的词汇,相比于模型的开源,数据的开源更为稀缺,甚至有公司直言“数据是不可能开源的”。本来就不走寻常路的星海图,决定继续唱“反调”。硅星人独家了解到,星海图即将开源全球首个开放场景高质量真机数据集Galaxea Open-World Dataset,及其G0-快慢双系统全身智能VLA模型。这一举动无疑在相对各自为战的机器人行业打开了…... -
Sheet0.com王文锋,两人团队融资500万美元,要打造属于Agent的Google.com
Sheet0.com: the first Level 4 Data Agent在过去两年里,AI Agent 从早期的技术探索逐渐进入应用落地期。无论是 OpenAI、Anthropic 等头部公司推动的通用型 Agent,还是垂直场景下的自动化工具,市场都在快速验证一个趋势——数据已成为驱动 Agent 能力的核心燃料。然而,获取、清洗、组织高质量数据的难度和成本,依然是阻碍 Agent 大规…... -
从开源项目到2500万美元融资:如何打造下一代AI Agent的互联网基础设施
你有没有想过,AI agent 真正要在生产环境中发挥价值,最大的瓶颈竟然不是模型能力,而是它们无法有效地"连接"到互联网?这听起来可能有些反常识,但当我深入了解了 Tavily AI 这家刚刚完成 2500 万美元融资的公司后,我才意识到这个问题的严重性。想象一下,你构建了一个用于金融风险控制的 AI agent,但它无法实时获取最新的市场数据和新闻信息。或者你的销售 AI …... -
苹果分享 iOS 26 即将推出的 AI 基础模型的细节
在最近的技术报告中,苹果公司提供了更多关于 iOS 26 新的苹果人工智能基础模型(Apple Intelligence Foundation Models)的性能和特性的详细信息,该模型是在最近的 2025 年全球开发者大会(WWDC)上宣布的。苹果基础模型包括一个 3B 参数版本,优化后可在苹果 Silicon 设备上运行,另外,还有一个更大的模型,设计用来在苹果私有云计算平台上运行。苹果强调…... -
让OpenAI只领先5天,百川发布推理新模型,掀翻医疗垂域开源天花板
刚刚,全球最强开源医疗模型发布,来自中国。百川开源最新医疗推理大模型Baichuan-M2-32B,在OpenAI发布的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。不仅以小博大,而且领先除GPT5以外所有的开源闭源前沿模型。落地门槛还非常低,支持RTX4090单卡部署。这意味着哪怕是中小型医疗机构,也有能力负担起医疗大模型的私有部署。现如今,AI医疗可谓是…... -
刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。
上上周一的晚上,智谱开源了当今最好的模型之一,GLM-4.5。然后,这个周一,又是突如其来的,开源了他们现在最好的多模态模型:GLM-4.5v。也是4.5系列的,用GLM-4.1V-Thinking的技术路线把GLM-4.5-Air重新训练了一遍,实现了视觉多模态的能力。模型参数106B总参数,12B激活,这个规模在开源多模态模型里已经算是大块头了。模型能力也有点东西,在所有的开源多模态模型中,4…... -
机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」
8 月 11 日,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP ,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。开源链接:机器人上下文协议 RynnRCPhttps://github.com/alibaba-damo-academy/RynnRCP视觉 - 语言 - 动作模型 …... -
WRC整理床铺机器人背后模型曝光!端到端双系统全身智能VLA,仅凭少量微调就能get任务
仅凭少量后训练微调,机器人就能完全自主、连续不断地完成床铺整理任务。而它的每一步思考与动作实时投放在大屏幕上。在本届2025WRC上,星海图将G0模型带到展会现场,让观众直观看到“机器人在想什么、怎么做”,刷新现场展示任务难度,稳定完成长程、柔性、全身移动操作任务。现在,星海图正式发布端到端双系统全身智能VLA模型——星海图G0,该模型将大规模开放世界真机数据集与双系统视觉-语言-动作(Visio…... -
硅谷精英放弃生娃!MIT女记者揭秘:人类只是AI垫脚石,世界很快就毁灭
AI吞噬资源、操控表达、重构秩序。每次AI进步都暗埋代价,硅谷精英却信仰末日选择不育。七年调查,华人女记者出版了《AI帝国》,揭露OpenAI背后的隐秘真相!有人说,AI是人类的未来。但是事实恰恰相反,AI正在奔向未来,留下的却是人类的裂缝。它吞噬电力、污染水源、毁掉工作、扰乱情绪...它以「智能」的名义,接管人类的表达、判断与决策。技术正在重写文明的脚本,却没人确定人类未来的结局。而那些亲手打造…... -
聊模型的王兴兴
王兴兴表示,宇树虽然对于模型的投入保持谨慎状态,但其实“模型团队人数算多的”。当行业里都认为,宇树是一个做机器人本体的公司,宇树科技创始人王兴兴,在世界机器人大会(WRC)期间的一番言论,打破了这刻板印象。WRC上,王兴兴在他的主题演讲中,将大段篇幅留给了模型、算法和数据,其中不少观点引起了行业广泛讨论——比如,对于当前机器人大火的VLA(Vision-Language-Action)路线,王兴兴…... -
黄仁勋像押注OpenAI一样押注中国机器人,英伟达首批Jetson Thor芯片给了他
黄仁勋正在像押注OpenAI一样在中国押注未来的具身智能巨头。英伟达给刚创办的OpenAI送超算这个事已经被大家津津乐道,现在他们正在把这个经验复用到机器人领域。中国首批Jetson Thor芯片送到了银河通用手里,在机器人世界大会展示无人售货场景机器人的丝滑漂移、规划能力也明显提升,惊艳全场。背后的Jetson Thor的性能提升也令人印象深刻:计算能力是上一代Jetson Orin的7.5倍,…... -
GPT-oss太离谱:无提示自行想象编程问题,还重复求解5000次
GPT-oss放飞自我了?!居然出现了明显的幻觉行为。在没有提示词的情况下,消耗超过30000个token凭空想出一个问题,还反复求解了5000多次?!这是个关于多米诺骨牌的编程问题,简单来说就是:在NxM的网格中先放一个多米诺占掉两个相邻的自由格,剩下的自由格必须刚好能拼成多个2x2的方块。然后就开始自行暴力求解……最近,有人好奇GPT-oss的训练数据构成情况如何,所以就进行了一系列测试。结果…...















