-
「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶
开源模型王座再次易主? 昨天,英伟达开源了OpenReasoning-Nemotron:在多个基准测试中,同规模模型无敌,取得了SOTA得分专为数学、科学、代码定制提供四种参数规模:1.5B、7B、14B和32B,可在本地100%运行。不过,这些模型还是「国产血统」:架构基于Qwen2.5 ,SFT训练使用的是DeepSeek-R1-0528生成的数据。OpenReasoning-Nemotron…... -
陶哲轩回应OpenAI新模型IMO夺金!GPT-5测试版也曝光了
OpenAI最新模型曝光了,在2025年国际数学奥林匹克竞赛(IMO)上达到了金牌水平!IMO被公认为全球最顶尖的数学竞赛,每年只有不到8%的参赛者能够获得金牌。而现在,一个AI模型做到了。新模型最终成绩:新模型在总共6道题中成功解决了5道,获得35分(满分42分),超过了今年的金牌线。OpenAI员工Alexander Wei还透露,GPT-5即将发布,但IMO金牌模型是一个实验性研究,在几个月…... -
人工智能首次主导北约防空测试
据外媒报道,北约近期完成首次由人工智能(AI)主导的防空测试。结果显示,AI系统在预警时效、信息处理和拦截效率等方面的表现,均优于同等条件下的人工操作。分析人士表示,近段时间以来,北约成员国在AI军事化应用领域动作频繁,相关动向值得关注。德国IRIS-T SLM防空系统。验证自主拦截能力 报道称,这场AI主导的防空对抗,在不久前举行的“刺猬25”联合演习中实施,地点位于爱沙尼亚边境的一处空军靶场。…... -
作业帮学习机 P50 发布,上线 AI 超级老师重塑学习体验
7 月 16 日,新一代作业帮AI学习机——P50 正式发布,重磅推出「AI 超级老师」功能,代表着学习机行业迈入「超级智能体」时代。该产品基于自研的作业帮大模型,打造「AI 超级老师」「AI 精准练」和「AI 通关练」等多项核心功能,在 AI 能力与学练资源方面双维度升级,全面提升学生的个性化智能学习体验。作业帮学习机P50作业帮大模型依托公司多年 AI 算法沉淀和教育数据积累,先后获得 C-E…... -
AI 对齐了人的价值观,也学会了欺骗
今年 5 月,有研究者发现 OpenAI 的模型 o3 拒绝听从人的指令,不愿意关闭自己,甚至通过篡改代码避免自动关闭。类似事件还有,当测试人员暗示将用新系统替换 Claude Opus 4 模型时,模型竟然主动威胁程序员,说如果你换掉我,我就把你的个人隐私放在网上,以阻止自己被替代。“模型比人类厉害后,凭什么听话?现在我们有越来越多的研究,开始发现模型有欺骗的现象,非常普遍。” 杨耀东 6 月通…... -
Windsurf惊魂96小时!AI闪电并购战:谷歌天价挖人,Cognition逆袭接盘
7月伊始的一个周四,AI编程工具初创公司Windsurf的40多位研究员和工程师接到管理层的神秘邀请,齐聚加州山景城。结果一进会议室,谜底揭晓:Windsurf老板Varun Mohan旁边坐着谷歌的联合创始人Sergey Brin,谷歌AI大佬Demis Hassabis还视频连线参加了。谷歌是来挖人的,想让Windsurf的员工跳槽到谷歌DeepMind。为了吸引大家,谷歌开出的条件很诱人:薪…... -
AI 原生开发新范式:TRAE 2.0 即将上线。
你是否有过这样的想法:开发一个存钱管理工具来掌控财务状况。开发一个感知声音的拍照APP,大喊“茄子”或“嚯哗”就能自动拍照。设计一个亲戚关系计算器,轻松应对叫不上称谓的尴尬。现在,使用 AI 编程就能让这种灵感快速落地了。GitHub 上有一个叫「积流成江」的开源项目,就是使用 TRAE 开发 3 天上线的。01项目简介积流成江开源项目能帮你把日常生活中遇到的英文单词、句子(比如网页、视频、路牌上…... -
神作!我用Claude Code一人打造了一款macOS原生App!句句干货,未来的IDE会截然不同:构建上下文+反馈回路
Claude Code 出来之后,很多人都在说“一个人 + AI 就可以独立写应用了”。但真正有人用它从头到尾打造一个完整的 macOS 原生 App,还详细记录全过程的,几乎没有。今天要分享的这篇文章,正好填补了这个空白。最近两天,小编刷到一篇“神文”,直接惊呆!一位 macOS 老程序员,用 AI 工具 Claude Code,硬是靠一个人之力写出了完整的原生 App,还自动打包上线发布!全文…... -
当 AI 变成生产力工具,我却开始渴望一次真正的对话
作为一个 AI 科技媒体编辑,AI 已经成为我的第一生产力。总结、翻译、查资料、做 PPT,一堆 AI 牛马任我差遣。慢慢地,似乎习惯了 AI 输出的 markdown 长本文形态,习惯了从一大段内容里选取那零星几句想要的回答,习惯了等待逐字弹出的思维链——正好抽空去回几条工作消息吧,回完发现思维链的展示还没结束……这种体验实际上是我使用搜索引擎的翻版,只不过 AI 先把几十个链接做了初步精简。有…... -
狂揽1200万美金,当AI遇上“玄学”,美国人也为“东方神秘力量”疯狂
封建迷信不屑一顾,星座预测每周必读。无论是中国道士在澳洲机场被当作“巫师”,用“东方神秘力量”震慑工作人员,还是陶白白、Alex是大叔等国内知名星座博主,借助西方占星术,融合“中式玄学”风格,收获了千万粉丝的追捧。都足以见得,Z世代年轻人越来越追求一种“科学迷信”,这也让“玄学”的风也吹向了世界各地。特别是星座,在发展过程中,不仅成为了了解个人或群体的工具,更成为了人与人之间的“社交手段”。有些完…... -
AI合成生物学,是颠覆还是炒作?这四大领域,已率先爆发!
AI合成生物有用吗?究竟用在哪?近日,美国头部市场咨询公司Lux Research发表了一篇名为《AI in Synthetic Biology: Necessary or Nice to Have?》的文章。分解了AI在合成生物学中的四个用例,包括分子发现、菌株/酶工程、生物过程优化和实验室自动化,并评估AI在每个用例中的实际提升与必要性。下文中我们编译了部分内容,并辅以国内案例,为读者介绍AI…... -
AI Reddit2.0 发布|AI 在出海社媒场景的落地实践
做海外社媒运营,可能会陷入这样一个“怪圈”?每天花大量时间泡在各种平台(比如Reddit、Facebook群组、Discord),研究热门话题、发帖、回帖,想融入社区,结果却发现:发的没人看:精心准备的内容,就像往大海里扔了颗石子,毫无波澜。看的不能发:好不容易找到个爆款灵感,想结合自己的产品做点营销,结果刚一开口,就被当成“硬广”喷到自闭,甚至被封号。最后瞎几把发:折腾半天,耐心耗尽,干脆破罐子…... -
用完这个Agent,你会觉得ChatGPT Agent真的是个傻子。
上周五,ChatGPT Agent mode上线了。之前一直有点偷懒,也嫌贵,嫌麻烦,没咋做Agent的对比,这次真的想好好评测一下,让我自己有一个认知,于是花了一天的时间,构建了一些我自己的任务。拿去测一下各家通用Agent的情况。烧了将近1000多块钱后。发现,ChatGPT的Agent mode是真的拉。。。但是在体验过程中,意外的让我发现了一个神奇的Agent产品,直接让我一个周末快通宵的…... -
英伟达GPU被曝严重漏洞,致模型准确率暴跌99.9%
英伟达GPU,被白帽黑客发现了严重漏洞。通过一种名为GPUHammer的攻击方式,可以让GPU上跑的大模型,准确率从80%直接掉到0.02%,可以说是渣都不剩。多伦多大学的研究人员形容,这种攻击就像在模型中引发灾难性的脑损伤。目前,研究人员已经在英伟达RTX A6000上成功测试了这种攻击,但不排除其他型号也可能受到影响。英伟达这边建议用户实施一项防御措施,但这种措施会让模型性能下降10%。那么,…... -
3.65亿美元融资:这家AI制药大模型公司合作阿斯利康、引入外部管线
近日,生物技术公司Pathos AI宣布完成3.65亿美元的D轮融资,融资后估值约为16亿美元。本轮资金将用于支持公司临床阶段产品线的推进,并持续投资于其专为肿瘤学构建的专有人工智能基础模型。在AI大模型加速渗透医疗领域、众多企业纷纷布局制药大模型的当下,Pathos的核心竞争力究竟体现在哪些方面?我们来一一解码。01锚定肿瘤药物开发赛道,利用AI驱动创新药临床加速Pathos创立于2020年,总…...