-
破解人机协作密码:工作技能拆成两层,AI执行人类决策成功率狂飙 | ICML 2025
人类和AI在工作中如何协作?耶鲁和南大的研究人员合作的这篇论文讲清楚了。这篇论文提出了一个数学框架,通过把工作技能拆分成两个层次来解释这个问题,具体包括:决策层子技能(decision-level subskill):确立目标、界定问题、权衡取舍的认知工作。执行层子技能(action-level subskill):实施计划、运用工具达成具体结果的操作行为。结果发现,人类和AI在这两个层面各有所长…... -
打破瓶颈,让RAG学会思考:中科大、智源等发布推理检索框架BGE-Reasoner
人工智能的浪潮正将我们推向一个由 RAG 和 AI Agent 定义的新时代。然而,要让这些智能体真正「智能」,而非仅仅是信息的搬运工,就必须攻克一个横亘在所有顶尖团队面前的核心难题。这个难题,就是推理密集型信息检索(Reasoning-Intensive IR)。它不仅是当前 RAG 和 AI Agent 技术发展的关键瓶颈,更对大模型智能体和深度研究(DeepResearch)等应用场景的成败…... -
新iPhone的AI怎么样,得看苹果最近的收购了
苹果刚刚官宣发布会为iPhone 17预热的同时,高管们也正在悄悄算着另一笔账:要不要花上百亿美元把两家AI公司打包带回家?据The Information爆料,苹果内部正在严肃讨论收购法国AI初创公司Mistral和美国AI搜索工具Perplexity。一个是成立两年估值飙到100亿美元的欧洲版OpenAI,一个是搜索界的谷歌杀手。有意思的是,这位谷歌杀手Perplexity沉迷于收购别人。今年…... -
谷歌认领最强AI版Photoshop!现在人人可用,效果确实强悍
爆火的神秘图像编辑模型nano-banana,终于脱掉了“香蕉皮”!就在今天,谷歌官方认领,并表明这个模型其实是Gemini 2.5 Flash Image。最新一波官方Demo也来了:还展现出了高超的图像推理能力:现在该模型可以在Gemini和Google AI Studio上免费使用,同时API以每张图像0.039$(折合人民币0.28¥)的价格开放。模型的具体表现如何?一起来看~出色的图像编…... -
顶级邪修倾囊相授!藏师傅教你速通Nano Banana
大家好,这里是歸藏(guizang),今天教大家如何最大程度发掘最强图片编辑模型 Nano Banana 的潜力。昨晚我们期盼了很久的图像编辑模型终于上线了,大家不再需要从竞技场吭哧瘪肚抽卡,可以爽玩,而且谷歌一如既往的发挥了财大气粗的优势,可以让你疯狂白嫖。在做了一晚上的通宵测试之后,发现这玩意真的很离谱。直接把 Adobe 和一众修图软件整麻了。以往复杂的修图操作现在都可以一句话搞定,而且人脸…... -
「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?
一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。不过,在刚刚过去的这个周末,Claude 最…... -
不靠高薪靠信仰!以文化破局,Anthropic凭「使命驱动」杀出AI人才血路
顶尖AI人才的争夺战在Meta和OpenAI等科技巨头之间越演越烈,但根据华尔街日报的报导: Claude的开发商Anthropic,似乎才是众多工程师更心仪的去处。如今的大模型厂商,如足球豪门一样争夺开发者,动辄开出百万甚至千万的年薪。例如Meta花五千万年薪来招募AI工程师,身价已经超过了足球明星姆巴佩和内马尔。在Meta与OpenAI等科技巨头之间,顶尖AI人才的争夺战已近白热化。然而,事实…... -
拒稿警告,靠大模型「偷摸水论文」被堵死,ICLR最严新规来了
刚刚,又一个人工智能国际顶会为大模型「上了枷锁」。ICLR 2025 已于今年 4 月落下了帷幕,最终接收了 11565 份投稿,录用率为 32.08%。就在今天,ICLR 2026 出台了大语言模型(LLM)使用政策,以明确规范论文作者与审稿人在研究过程和审稿过程中使用 LLM 的做法。这届会议将于明年 4 月 23 日至 27 日在巴西里约热内卢举办。此次发布的所有政策均以 ICLR《道德准则…... -
AI 狂热之外,或许决胜局藏在“看不见”的地方 | 对话蚂蚁密算董事长韦韬:密态计算与高阶程序
用看不见数据的方式,释放数据的价值。AI 时代的聚光灯,不应只属于从零到一的创业者。 我们注意到一个有趣的现象:与热衷在全球舞台上表达观点的硅谷高管相比,中国的大厂高管们通常更倾向于低调行事。尽管如此,他们的平台掌握着丰富的资源、数据、人才和资本,他们的决策在切实地塑造着 AI 行业的未来发展。 「十字路口」希望做的,就是将这些身处一线的关键思考者,也带到你的面前。上周,我们与阿里云副总裁旭卿的对…... -
Meta两员大将回流OpenAI,30天爆赚800万?刚入职闪回巢,小扎钞能力失效
小扎钞能力失效,一夜痛失三位核心研究员!其中,两位前OpenAI大牛仅入职一月,火速回流OpenAI。团队频繁重组,内部矛盾「埋雷」,小扎「超级智能梦」能否交出一份满意的答卷?成立仅两个月,小扎「梦之队」MSL已痛失三位核心大脑。最新爆料称, 两位前OpenAI员工Avi Verma和Ethan Knight,加入Meta一个月再次回流到OpenAI。1亿美金诱人薪酬包,也没能留住顶尖人才,难道小…... -
数字技术工人已到岗!时序大模型+Agent已掌握了工厂生产管控技术,比人类更懂工况
只用一周,一个相当于人类20年经验的“数字技术工人”——基于时序大模型和Agent的智能体,就能直接上岗。时至今日,在化工、环保、新能源等工业生产场景中,这类数字技术工人已经不再是“概念演示”,而是已经真正承担起生产操作、安全控制、能源管理等关键任务。能胜任的场景也并不轻巧:动态合成氨、电解水制氢、垃圾焚烧发电……都是工业体系里最复杂、最依赖经验积累的环节。这些过去需要老师傅级别的专家才能把控,而…... -
DeepSeek“极你太美”bug,官方回应了
DeepSeek V3.1上演的bug大秀“极你太美”,可谓是让全网热议了一波。简单来说呢,就是陆续有开发者们发现,当他们在调用API进行代码开发的过程中,输出结果里会时不时蹦出来“极”字。像这样:这个问题最初是在火山引擎、chutes等平台上被发现,但随着事件的发酵,更多平台也被卷入了进来,包括腾讯的CodeBuddy,甚至是DeepSeek官方……事件之火,在国外Reddit上也是讨论声一片,…... -
谷歌「最强图像模型」横扫一切!Gemini 2.5 Flash Image正式上线!PS不存在了
Gemini 2.5 Flash Image是谷歌最新发布的顶级图像生成与编辑模型,被网友誉为「最强图像模型」。其化身nano-banana在LMArena盲测中以历史最大优势夺冠,凭借角色一致性、提示编辑、原生世界知识和多图像融合四大能力,引发广泛关注。刚刚,谷歌正式发布最先进的图像模型,Gemini 2.5 Flash Image。如果说它的另一个名字,nano-banana,你就一定知道了!…... -
10分钟就拿到了朱啸虎投资的AI陪伴产品,想让年轻人不孤独|Hao好聊X孙兆治
2023年,AI浪潮席卷全球,无数创业者开始了一场寻找“下一代硬件”的竞赛。然而现实很快给出了残酷的答案。AI Pin从万众瞩目到黯然收场,Rabbit R1从革命性产品沦为智能玩具,那些试图“重新发明能取代手机的硬件产品”的野心家们,最终只能退守到了类似“录音笔”这样的小众的边缘品类。当"拿着锤子找钉子"的路走不通后,从用户的真实需求出发探索产品方向做减法,成了创业者们的新的…... -
将数据优势发挥到极致:「杭州六小龙」开源搭建空间智能的第一步
如果你拥有了庞大的三维空间数据,你会用来做什么?大模型时代之后,数据成了支撑模型的承重柱。能否获取足够的可用高质量数据,直接决定了某个领域的 AI 的发展上限。而有了足够的数据,构建一个强大的大模型和生成模型,似乎总是水到渠成的事情。想想看,视频生成模型里,可灵即梦等高质量模型,都是依托最大的视频内容 UGC 平台的海量数据而生的。这些数据自然也成为了模型进步最大优势。数据可以用来训练模型,这些模…...