-
空间智能“宝藏公司”群核,又为解决AI见光死做了些微小贡献
人工智能正在吟诗作画,我们人类却在打扫卫生。这句话几乎描述出了今天所有人对AI的困惑,一边是模型底层技术的突破,另一边却是AI进入真实世界后的无力感。一个验证码能摧毁一个压缩全世界知识的AI大脑,一个垃圾桶能绕晕一个拥有30多个自由度的人形机器人。但AI的发展,并不应该如此“见光死”。群核科技联合创始人黄晓煌在近期群核TechDay上描述出这个现状后,他也展示了群核对解决这个挑战的最新动作。这家拥…... -
阿里开源14B电影级视频模型!实测来了:免费可玩,单次生成时长可达分钟级
AI视频生成正在迎来“通义时刻”!就在昨夜,阿里突然发布了一款由音频驱动的14B视频模型Wan2.2-S2V——仅需一张图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。玩法+效果be like:△来自𝕏@AIMIRAI46487而且最重要的是,新模型发布即开源,现在人人都能在通义万相官网免费体验。根据官方介绍,Wan2.2-S2V最大亮点在于:单次生成时长可达分钟级…... -
空间智能卡脖子难题被杭州攻克!难倒GPT-5后,六小龙企业出手了
最近3D内容生成模型好生热闹,像谷歌Genie 3、World Labs、混元、昆仑争相发布并开测世界模型。一片喧嚣中,杭州“六小龙”之一群核科技低调却重磅地发布了自己的空间大模型,选择了一条与众不同的路径:深耕室内场景,并直指行业核心痛点「空间一致性」。不管怎么移动都很丝滑~生成的视角也都是合理的。从视频生成到AI短剧,令人出戏的空间穿帮、扭曲视角和断裂逻辑屡见不鲜,往往需要反复调教才能勉强可用…... -
Claude for Chrome来了!可作为浏览器扩展程序直接使用
刚刚,Anthropic发布了最新的浏览器agent——Claude for Chrome!这款紧贴Chrome的agent可以作为浏览器的扩展程序直接使用:它不仅能帮你设日历。还能帮你回邮件。就连找房也不在话下!这一通给大伙看的是目瞪又口呆,以至于一位网友直接发出了灵魂拷问:既然AI功能都能靠浏览器扩展实现了,还用得着另开一个浏览器吗?那么……Perplexity:坏了,一觉睡醒,我成小丑了?(…... -
Meta两员大将回流OpenAI,30天爆赚800万?刚入职闪回巢,小扎钞能力失效
小扎钞能力失效,一夜痛失三位核心研究员!其中,两位前OpenAI大牛仅入职一月,火速回流OpenAI。团队频繁重组,内部矛盾「埋雷」,小扎「超级智能梦」能否交出一份满意的答卷?成立仅两个月,小扎「梦之队」MSL已痛失三位核心大脑。最新爆料称, 两位前OpenAI员工Avi Verma和Ethan Knight,加入Meta一个月再次回流到OpenAI。1亿美金诱人薪酬包,也没能留住顶尖人才,难道小…... -
破解人机协作密码:工作技能拆成两层,AI执行人类决策成功率狂飙 | ICML 2025
人类和AI在工作中如何协作?耶鲁和南大的研究人员合作的这篇论文讲清楚了。这篇论文提出了一个数学框架,通过把工作技能拆分成两个层次来解释这个问题,具体包括:决策层子技能(decision-level subskill):确立目标、界定问题、权衡取舍的认知工作。执行层子技能(action-level subskill):实施计划、运用工具达成具体结果的操作行为。结果发现,人类和AI在这两个层面各有所长…... -
打破瓶颈,让RAG学会思考:中科大、智源等发布推理检索框架BGE-Reasoner
人工智能的浪潮正将我们推向一个由 RAG 和 AI Agent 定义的新时代。然而,要让这些智能体真正「智能」,而非仅仅是信息的搬运工,就必须攻克一个横亘在所有顶尖团队面前的核心难题。这个难题,就是推理密集型信息检索(Reasoning-Intensive IR)。它不仅是当前 RAG 和 AI Agent 技术发展的关键瓶颈,更对大模型智能体和深度研究(DeepResearch)等应用场景的成败…... -
新iPhone的AI怎么样,得看苹果最近的收购了
苹果刚刚官宣发布会为iPhone 17预热的同时,高管们也正在悄悄算着另一笔账:要不要花上百亿美元把两家AI公司打包带回家?据The Information爆料,苹果内部正在严肃讨论收购法国AI初创公司Mistral和美国AI搜索工具Perplexity。一个是成立两年估值飙到100亿美元的欧洲版OpenAI,一个是搜索界的谷歌杀手。有意思的是,这位谷歌杀手Perplexity沉迷于收购别人。今年…... -
谷歌认领最强AI版Photoshop!现在人人可用,效果确实强悍
爆火的神秘图像编辑模型nano-banana,终于脱掉了“香蕉皮”!就在今天,谷歌官方认领,并表明这个模型其实是Gemini 2.5 Flash Image。最新一波官方Demo也来了:还展现出了高超的图像推理能力:现在该模型可以在Gemini和Google AI Studio上免费使用,同时API以每张图像0.039$(折合人民币0.28¥)的价格开放。模型的具体表现如何?一起来看~出色的图像编…... -
顶级邪修倾囊相授!藏师傅教你速通Nano Banana
大家好,这里是歸藏(guizang),今天教大家如何最大程度发掘最强图片编辑模型 Nano Banana 的潜力。昨晚我们期盼了很久的图像编辑模型终于上线了,大家不再需要从竞技场吭哧瘪肚抽卡,可以爽玩,而且谷歌一如既往的发挥了财大气粗的优势,可以让你疯狂白嫖。在做了一晚上的通宵测试之后,发现这玩意真的很离谱。直接把 Adobe 和一众修图软件整麻了。以往复杂的修图操作现在都可以一句话搞定,而且人脸…... -
「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?
一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。不过,在刚刚过去的这个周末,Claude 最…... -
不靠高薪靠信仰!以文化破局,Anthropic凭「使命驱动」杀出AI人才血路
顶尖AI人才的争夺战在Meta和OpenAI等科技巨头之间越演越烈,但根据华尔街日报的报导: Claude的开发商Anthropic,似乎才是众多工程师更心仪的去处。如今的大模型厂商,如足球豪门一样争夺开发者,动辄开出百万甚至千万的年薪。例如Meta花五千万年薪来招募AI工程师,身价已经超过了足球明星姆巴佩和内马尔。在Meta与OpenAI等科技巨头之间,顶尖AI人才的争夺战已近白热化。然而,事实…... -
拒稿警告,靠大模型「偷摸水论文」被堵死,ICLR最严新规来了
刚刚,又一个人工智能国际顶会为大模型「上了枷锁」。ICLR 2025 已于今年 4 月落下了帷幕,最终接收了 11565 份投稿,录用率为 32.08%。就在今天,ICLR 2026 出台了大语言模型(LLM)使用政策,以明确规范论文作者与审稿人在研究过程和审稿过程中使用 LLM 的做法。这届会议将于明年 4 月 23 日至 27 日在巴西里约热内卢举办。此次发布的所有政策均以 ICLR《道德准则…... -
AI 狂热之外,或许决胜局藏在“看不见”的地方 | 对话蚂蚁密算董事长韦韬:密态计算与高阶程序
用看不见数据的方式,释放数据的价值。AI 时代的聚光灯,不应只属于从零到一的创业者。 我们注意到一个有趣的现象:与热衷在全球舞台上表达观点的硅谷高管相比,中国的大厂高管们通常更倾向于低调行事。尽管如此,他们的平台掌握着丰富的资源、数据、人才和资本,他们的决策在切实地塑造着 AI 行业的未来发展。 「十字路口」希望做的,就是将这些身处一线的关键思考者,也带到你的面前。上周,我们与阿里云副总裁旭卿的对…... -
Meta两员大将回流OpenAI,30天爆赚800万?刚入职闪回巢,小扎钞能力失效
小扎钞能力失效,一夜痛失三位核心研究员!其中,两位前OpenAI大牛仅入职一月,火速回流OpenAI。团队频繁重组,内部矛盾「埋雷」,小扎「超级智能梦」能否交出一份满意的答卷?成立仅两个月,小扎「梦之队」MSL已痛失三位核心大脑。最新爆料称, 两位前OpenAI员工Avi Verma和Ethan Knight,加入Meta一个月再次回流到OpenAI。1亿美金诱人薪酬包,也没能留住顶尖人才,难道小…...