全部标签

Ai资讯

SALMONN 系列音视频理解大模型霸榜回归！推理增强、高帧率、无文本泄漏全线突破

SALMONN 家族在首个通用音频理解模型（ICLR 2024）和首个全要素音视频理解模型 video-SALMONN（ICML 2024）基础上再次迎来重磅扩容，霸榜各大音视频理解榜单！全新一代 video-SALMONN 2/2+、首个开源推理增强型音视频理解大模型 video-SALMONN-o1（ICML 2025）、首个高帧率视频理解大模型 F-16（ICML 2025），以及无文本泄漏…...
零样本「即插即用」！智源开源RoboBrain-X0，一个基座模型开动不同机器人

在今天举行的2025机器人学习大会（Conference on Robot Learning，CoRL）上，智源研究院干了一件大事：他们把自家研发的具身智能「小脑基座」——RoboBrain-X0，直接开源了！智源宣称，这是一款仅通过预训练，即可实现多类真实机器人间的基础操作零样本迁移，结合小样本微调就能进一步释放其对更复杂任务跨本体泛化潜力的「通用小脑基座」。在谷歌、英伟达、特斯拉等巨头和Fig…...
继Lovable之后，硅谷顶级VC用1500万美金投了印度的一个Vibe coding产品

你有没有想过，为什么现在满天飞的AI编程工具，总是让人爱不起来？开发者们用起来很兴奋，但用完就头疼。生成的代码看起来很炫，但一到修改就崩，一到上线就出错，一到迭代就陷入无穷无尽的修复循环。这就是我最近一直在思考的问题：AI代码生成的第一天很美好，但第二天总是噩梦。但现在，一家来自印度苏拉特的创业公司 Rocket.new 却声称他们解决了这个问题。不仅如此，他们还刚刚完成了1500万美元的种子轮融…...
刚刚，Claude Sonnet 4.5重磅发布，编程新王降临！

北京时间今天凌晨，Anthropic正式发布了Claude Sonnet 4.5。这一版本被Claude定义为全球最强的代码模型，同时在智能体构建、计算机使用、推理和数学能力上展现出显著突破。代码无处不在，它驱动着应用程序、表格和各种工具。现代工作的核心在于运用这些工具并解决复杂问题，而Sonnet 4.5让这一切更加高效和可靠。全新功能与产品升级伴随Sonnet 4.5，Anthropic对Cl…...
曝顶级AI大牛，加入阿里通义！事关下一代大模型

传国际AI大牛空降阿里通义！智东西9月29日消息，据“互联网八卦小喇叭”等媒体爆料，全球顶尖AI科学家、IEEE Fellow许主洪（Steven Hoi）已加盟阿里通义，转向通义大模型的相关研发工作。许主洪拥有超20年AI产业和学术经验，是新加坡管理大学终身教授、曾任新加坡南洋理工大学终身副教授，在AI领域发表了300多篇顶级学术论文，论文被引用超过5万次，曾被斯坦福大学评为全球顶尖1%的AI科…...
Flash Attention作者最新播客：英伟达GPU统治三年内将终结

英伟达还能“猖狂”多久？——不出三年！实现AGI需要新的架构吗？——不用，Transformer足矣！“近几年推理成本下降了100倍，未来还有望再降低10倍！”这些“暴论”，出自Flash Attention的作者——Tri Dao。在最新播客《Unsupervised Learning》中，Tri Dao分享了对GPU市场、推理成本、模型架构以及AI未来趋势的深度洞察，并针对上述“暴论”展开了有…...
融资600万美金，用户说”没有它活不下去”，AI秘书为何让企业高管如此依赖？

你有没有想过，那些一天开十几个会的企业高管是如何做到永远不会双重预定时间的？那些每天在会议间隙穿梭的创业者，是如何在巨大压力下还能保持冷静的职业风范？当我看到Jason Calacanis在推特上写下"如何确保每季度只让一个人来找我聊想法？答案是howie"，我开始意识到一个新时代正在悄然来临：AI秘书不再是科幻概念，而是已经在改变最忙碌人群工作方式的现实工具。这家名为Howi…...
华为盘古718B模型最新成绩：开源第二

高手如云，高手如云，但华为依旧“杀”出了一片天。就在最新一期的SuperCLUE中文大模型通用基准测评中，各个AI大模型玩家的成绩新鲜出炉。从大家最为关心的开源、国产两个维度来看，前三名排名分别为：DeepSeek-V3.1-Terminus-ThinkingopenPangu-Ultra-MoE-718BQwen3-235B-A22B-Thinking-2507（注：SuperCLUE是一个综合…...
DeepSeek新模型上线！引入DSA新稀疏注意力，还又狙了CUDA一枪

刚发V3.1“最终版”，DeepSeek最新模型又来了！DeepSeek-V3.2-Exp刚刚官宣上线，不仅引入了新的注意力机制——DeepSeek Sparse Attention。还开源了更高效的TileLang版本GPU算子！目前，官方App、网页端、小程序均已同步更新，同时还有API大减价：5折起。这波DeepSeek国庆大礼包，属实有点惊喜了。新注意力机制DeepSeek-V3.2-Ex…...
黄仁勋2小时反驳「AI泡沫帝国」论！英伟达将成全球首家十万亿市值公司

黄仁勋的2小时重磅访谈于本周发布！本次对谈信息密度格外高，黄仁勋集中表达了对英伟达近期包括对OpenAI的千亿美元投资、投资英特尔等一系列大动作的原因，对英伟达的产业角色的定位，对AI产业的发展前的前瞻，以及AI对世界经济格局的彻底重构。一图看透全球大模型！新智元十周年钜献，2025 ASI前沿趋势报告37页首发黄仁勋于本周接受了Bg2 Pod的专访，与Bill Gurley和Brad Gerst…...
在具身智能的岔路口，这场论坛把数据、模型、Infra聊透了

当机器人成为各大科技展会最受瞩目的焦点，当具身智能论坛场场爆满、一票难求，我们不难发现：这个领域正在经历前所未有的关注热潮。然而，热潮之下，仍有诸多关键议题悬而未决：面对数据稀缺，有人寄希望于合成数据的突破，有人坚持真机数据才是根本；在技术路线之争中，有人押注端到端的整体范式，有人则认为分层架构更符合演进规律；至于模型形态，有人视 VLA 为智能的最终归宿，也有人认为世界模型才是真正的未来。现阶段…...
华东师范大学与奇点智能研究院共建“开源创新与变革联合实验室”，推动AI开源创新范式

2025 年 9 月 26 日，在华东师范大学数据学科建设十二周年纪念活动上，华东师范大学与奇点智能研究院正式揭牌共建“华东师范大学—奇点智能研究院开源创新与变革联合实验室”（以下简称“联合实验室”）。联合实验室聚焦人工智能时代的开源技术研究、开源生态评估、治理机制构建与高层次人才培养，致力于打造具有国际视野、产学研深度融合的开源创新研究平台，助力我国在全球 AI 开源格局中提升技术生态的创新力与…...
AI视频进入蒸汽机时代

AI 视频生成行业天花板再次被拉高。百度杀入 AI 视频生成赛道后，就一直加班加点卷个不停。7 月初，百度第一次正式官宣蒸汽机 1.0 模型，以极致指令遵循能力惊艳亮相；8 月底，百度又发布全球首个中文音视频一体化模型百度蒸汽机 2.0，实现生成视频中人物口型、表情、动作的毫秒级同步。而现在，距离上次发布仅短短一个月，百度蒸汽机 2.0 又迎来重磅升级，推出了行业首个通用 AI 长视频生成功能。此…...
OpenAI被指欺诈，用户输入可能会被秘密路由到新模型GPT-5-Chat-Safety

今年 8 月，GPT-5 发布，其在多个任务和基准上都表现卓越，但几乎和人世间的所有事物一样，并不是所有人都满意。尤其是 GPT-5 发布后「OpenAI 移除 ChatGPT 中模型选择器」的做法更是备受诟病（尤其是移除了情感表达更佳的 GPT-4o），甚至引发了诸多用户的「网上请愿」，详见我们的报道《用户痛批 GPT-5，哭诉「还我 GPT-4o」，奥特曼妥协了》。一位用户在 Reddit 愤…...
我们为什么会觉得AI理解自己？

人们感到AI理解自己，因为AI提供优于人类的倾听和理性建议，如认知共情总结混乱想法或询问需求。形象如语音和触觉增强情感连接，但过度依赖AI可能加剧孤独感。心理学角度区分情绪与认知共情，未来需身体互动和共同成长建立真实关系。• 📚 共情区分：情绪共情是感同身受，认知共情是理性理解。• 🗣️ AI沟通优势：AI更好倾听、不问建议、不转移话题。• 👁️ 交互影响：语音和触觉增强连接感及情感依赖。• 🤖 …...