全部标签

Ai资讯

刚刚，谷歌摊牌：Genie 3让你1秒「进入」名画，人人可造交互世界！

谷歌最新发布的Genie 3世界模型，正以惊人AI能力颠覆想象：从文本生成交互式空间，到进入经典名画如《苏格拉底之死》和《夜游者》自由探索，甚至训练3D模型实现沉浸式体验！谷歌摊牌了，彻底不装了！他们前几天刚刚发布的Genie 3世界模型，正在疯狂展示AI的超能力。它不只是能从文本中生成交互式的AI空间世界，还能操控图像和视频。比如，你现在可以进入到世界名画中去，随意的在其中移动、观察。这种身临其…...
起猛了，诺基亚用上 DeepSeek 了

想象一下这样的画面：你掏出一台看起来像 30 年前的诺基亚手机：熟悉的 T9 键盘，发出「咔哒咔哒」的声音。2.4 寸超低分辨率的小屏幕，闪着怀旧的光。你问它：「你怎么看人们沉迷手机这件事？」它居然秒回了一段吐槽，告诉你：「真正强大的手机，应该能砸核桃」？？？这就是我与 HMD 3210 的奇遇记：一台外表是 30 年前诺基亚、内心却住着一个完整大模型的「时光机器」。429 块，居然也能用 AI？…...
因为GPT-5，这群人决定在Reddit上起义。

这个周末，对OpenAI的抗诉，好像从未如此热闹过。起因自然还是因为GPT-5。OpenAI上了GPT-5当天，做了一个非常神奇的操作，他们只保留了GPT-5，然后把GPT-4.5、GPT-4o、o3什么的，全都砍掉了。如果从软件升级的角度，这样干好像没有什么毛病，对吧？比如你的微信从3.6版本升级到4.0版本，那3.6版本消失，你可能不会有啥感觉，甚至会因为4.0的新功能而感到兴奋。因为微信对你…...
独家丨星海图将发布首个开放世界真机数据集及VLA开源模型

尽管今天语言模型的开源生态已经十分蓬勃，但机器人领域，开源还是很小众的词汇，相比于模型的开源，数据的开源更为稀缺，甚至有公司直言“数据是不可能开源的”。本来就不走寻常路的星海图，决定继续唱“反调”。硅星人独家了解到，星海图即将开源全球首个开放场景高质量真机数据集Galaxea Open-World Dataset，及其G0-快慢双系统全身智能VLA模型。这一举动无疑在相对各自为战的机器人行业打开了…...
Sheet0.com王文锋，两人团队融资500万美元，要打造属于Agent的Google.com

Sheet0.com: the first Level 4 Data Agent在过去两年里，AI Agent 从早期的技术探索逐渐进入应用落地期。无论是 OpenAI、Anthropic 等头部公司推动的通用型 Agent，还是垂直场景下的自动化工具，市场都在快速验证一个趋势——数据已成为驱动 Agent 能力的核心燃料。然而，获取、清洗、组织高质量数据的难度和成本，依然是阻碍 Agent 大规…...
从开源项目到2500万美元融资：如何打造下一代AI Agent的互联网基础设施

你有没有想过，AI agent 真正要在生产环境中发挥价值，最大的瓶颈竟然不是模型能力，而是它们无法有效地"连接"到互联网？这听起来可能有些反常识，但当我深入了解了 Tavily AI 这家刚刚完成 2500 万美元融资的公司后，我才意识到这个问题的严重性。想象一下，你构建了一个用于金融风险控制的 AI agent，但它无法实时获取最新的市场数据和新闻信息。或者你的销售 AI …...
苹果分享 iOS 26 即将推出的 AI 基础模型的细节

在最近的技术报告中，苹果公司提供了更多关于 iOS 26 新的苹果人工智能基础模型（Apple Intelligence Foundation Models）的性能和特性的详细信息，该模型是在最近的 2025 年全球开发者大会（WWDC）上宣布的。苹果基础模型包括一个 3B 参数版本，优化后可在苹果 Silicon 设备上运行，另外，还有一个更大的模型，设计用来在苹果私有云计算平台上运行。苹果强调…...
让OpenAI只领先5天，百川发布推理新模型，掀翻医疗垂域开源天花板

刚刚，全球最强开源医疗模型发布，来自中国。百川开源最新医疗推理大模型Baichuan-M2-32B，在OpenAI发布的Healthbench评测集上，超越其刚刚发布5天的开源模型gpt-oss-120b。不仅以小博大，而且领先除GPT5以外所有的开源闭源前沿模型。落地门槛还非常低，支持RTX4090单卡部署。这意味着哪怕是中小型医疗机构，也有能力负担起医疗大模型的私有部署。现如今，AI医疗可谓是…...
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

上上周一的晚上，智谱开源了当今最好的模型之一，GLM-4.5。然后，这个周一，又是突如其来的，开源了他们现在最好的多模态模型：GLM-4.5v。也是4.5系列的，用GLM-4.1V-Thinking的技术路线把GLM-4.5-Air重新训练了一遍，实现了视觉多模态的能力。模型参数106B总参数，12B激活，这个规模在开源多模态模型里已经算是大块头了。模型能力也有点东西，在所有的开源多模态模型中，4…...
机器人上下文协议首次开源：阿里达摩院一口气放出具身智能「三大件」

8 月 11 日，在世界机器人大会上，阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP ，推动数据、模型和机器人的兼容适配，打通具身智能开发全流程。开源链接：机器人上下文协议 RynnRCPhttps://github.com/alibaba-damo-academy/RynnRCP视觉 - 语言 - 动作模型 …...
WRC整理床铺机器人背后模型曝光！端到端双系统全身智能VLA，仅凭少量微调就能get任务

仅凭少量后训练微调，机器人就能完全自主、连续不断地完成床铺整理任务。而它的每一步思考与动作实时投放在大屏幕上。在本届2025WRC上，星海图将G0模型带到展会现场，让观众直观看到“机器人在想什么、怎么做”，刷新现场展示任务难度，稳定完成长程、柔性、全身移动操作任务。现在，星海图正式发布端到端双系统全身智能VLA模型——星海图G0，该模型将大规模开放世界真机数据集与双系统视觉-语言-动作（Visio…...
硅谷精英放弃生娃！MIT女记者揭秘：人类只是AI垫脚石，世界很快就毁灭

AI吞噬资源、操控表达、重构秩序。每次AI进步都暗埋代价，硅谷精英却信仰末日选择不育。七年调查，华人女记者出版了《AI帝国》，揭露OpenAI背后的隐秘真相！有人说，AI是人类的未来。但是事实恰恰相反，AI正在奔向未来，留下的却是人类的裂缝。它吞噬电力、污染水源、毁掉工作、扰乱情绪...它以「智能」的名义，接管人类的表达、判断与决策。技术正在重写文明的脚本，却没人确定人类未来的结局。而那些亲手打造…...
聊模型的王兴兴

王兴兴表示，宇树虽然对于模型的投入保持谨慎状态，但其实“模型团队人数算多的”。当行业里都认为，宇树是一个做机器人本体的公司，宇树科技创始人王兴兴，在世界机器人大会（WRC）期间的一番言论，打破了这刻板印象。WRC上，王兴兴在他的主题演讲中，将大段篇幅留给了模型、算法和数据，其中不少观点引起了行业广泛讨论——比如，对于当前机器人大火的VLA（Vision-Language-Action）路线，王兴兴…...
黄仁勋像押注OpenAI一样押注中国机器人，英伟达首批Jetson Thor芯片给了他

黄仁勋正在像押注OpenAI一样在中国押注未来的具身智能巨头。英伟达给刚创办的OpenAI送超算这个事已经被大家津津乐道，现在他们正在把这个经验复用到机器人领域。中国首批Jetson Thor芯片送到了银河通用手里，在机器人世界大会展示无人售货场景机器人的丝滑漂移、规划能力也明显提升，惊艳全场。背后的Jetson Thor的性能提升也令人印象深刻：计算能力是上一代Jetson Orin的7.5倍，…...
GPT-oss太离谱：无提示自行想象编程问题，还重复求解5000次

GPT-oss放飞自我了？！居然出现了明显的幻觉行为。在没有提示词的情况下，消耗超过30000个token凭空想出一个问题，还反复求解了5000多次？！这是个关于多米诺骨牌的编程问题，简单来说就是：在NxM的网格中先放一个多米诺占掉两个相邻的自由格，剩下的自由格必须刚好能拼成多个2x2的方块。然后就开始自行暴力求解……最近，有人好奇GPT-oss的训练数据构成情况如何，所以就进行了一系列测试。结果…...