-
刚刚,马斯克Grok4干翻谷歌Gemini!o3杀入首届大模型对抗赛决战
第二轮首届大模型对抗赛结果出炉了!o3轻而易举击败o4-mini,拿下100%胜率。Grok 4和Gemini 2.5 Pro激烈对决,最终在加赛中Grok 4成功晋级。明日,Grok 4和o3将迎来终局之战。首届大模型国际象棋对抗赛,第二轮战报出炉了!Kaggle Game Arena上,谷歌举办的AI国际象棋表演赛中,Grok 4和o3顺利挺进半决赛:o3一举击败o4-mini Grok 4在…... -
一块钱的 AI,开始审判人类
过去,对于普通人来说,考试几乎决定一切。「优绩主义」的单一评判体系在无形中将社会分层。而今天,AI 已经比绝大多数人更有用了,当 AI 用一元钱的成本,完成一个人类博士的工作时,曾经代表「自我价值」的学历、职位、履历..... 正开始失效。面对冲击,这几年,关于 AI 的讨论多集中在「怎么办」——工作被取代了怎么办、该学什么新技能、隐私要怎么保护等等。而在学者张笑宇看来,重要的不是「怎么办」,而是…... -
都说这个地级市,宜居宜业宜AI
怎么链接全世界?当AI回答“最适合生活的城市”时,珠海名列前茅。这座以宜居著称的城市,在AI产业发展中找到了独特的竞争力。避开通用型AI的正面竞争,珠海聚焦智慧城市、智能家居、医疗AI、海洋科技等本地化场景,将AI技术与城市治理、民生服务深度结合。较小的辖区使得珠海AI应用的试错成本低,并为AI后续复制至大湾区其他城市或地区提供了更广阔的可行性。虽然拥有9000多平方公里的辽阔海域,但珠海是广东省…... -
反AI”伤脑”论——使用AI会让人变弱智?
你的思考能力有没有事,取决于你自己神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。人工智能有可能促进也有可能损害人的思维能力编者按:MIT实验证实AI惰性思考侵蚀学习效果,但尼日利亚教师引导案例使成绩翻倍。创造力测试中GPT-4击败91%人类,却因锚定效应导致原创力危机——工具价值取决于人机协作顺序。文章来自编译。越来越多人问我:“用AI会损伤大…... -
突破AI行业高质量数据缺乏的瓶颈,Surge AI营收超10亿美元
AI行业对数据的渴求程度,质量大于数量。估值290亿美元的ScaleAI,正面对一个强大的对手,一家叫Surge AI的AI数据公司公布自己的营收超过了10亿美元,而ScaleAI在同期的营收是8.7亿美元。同时,Surge AI目前已实现盈利。路透社援引消息人士称,Surge AI已聘请顾问,计划进行其公司历史上的首次融资,规模或高达10亿美元,目标估值超过150亿美元。在首轮融资之前,Surg…... -
在笔记本上,部署 gpt-oss-120b 模型
今天 ,OpenAI 开源了俩模型:120B/20B117B 的 gpt-oss-120b 对标 o4-min,按官方说法至少需要 80G 内存,推荐使用单卡 H100 GPU而刚买的的游戏本,刚好满足gpt-oss-120b 的部署条件Rog 幻X,集显比肩 4060,还有 128G 统一内存这里面是 AMD 的 395+ & 8060s(非常 YES),128G 统一内存(说上面这些,…... -
GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强
疑似GPT-5发布的预告才刚刚发出,内测体验已抢先释出。推理能力首次超越人类,碾压所有大模型。这来自一位网友的实测结果,他让所有模型开启推理模式做了10道题,只有GPT-5只错了一题,比人类的正确率还高。几乎都是一次答对,最多2次。其他大模型却需要更多次数尝试。且不是孤例,有人表示自己的实测结果非常相似,GPT-5也是只错了10道题中的1道。除了出色的推理能力,还有拿到内测名额的人表示,GPT-5…... -
基于聊天的 AI 编程高效实践
开发者新工作流自 2021 年夏季 GitHub Copilot 以预览版问世 以来,编程助手产品呈现爆发式增长。这类工具最初被用作增强型代码补全工具,而 Cursor、Windsurf 等产品则迅速转向了 Agent 交互模式:通过自然语言指令触发,助手能自主执行修改代码文件、运行终端命令等操作。近期,GitHub Copilot 在集成聊天功能中新增了“Agent 模式”,用户可以让 Agen…... -
深度|被字节收购后再创业:硅谷100天,写在Aibrary正式上线前
Aibrary 是全球首个面向个人成长的 Agentic AI,让知识与你对话,引导你用行动改变自己。作者:Ethan KJ Li 是一位连续创业者,曾创办中国领先的教育科技公司「极课大数据」,并于 2019 年被字节跳动成功并购。此后他担任字节跳动智慧教育业务线 CEO,主导多项教育智能化产品落地。2025年初在硅谷创立 Ouraca Inc.,专注打造新一代“AI native” 的终身学习产…... -
一夜颠覆Sora神话,H200单卡5秒出片!全华人团队开源AI引爆视频圈
AI视频生成进入了秒生极速时代!UCSD等机构发布的FastWan系模型,在一张H200上,实现了5秒即生视频。稀疏蒸馏,让去噪时间大减,刷新SOTA。单块H200,5秒即生一个5秒视频。最近,UCSD、UC伯克利、MBZUAI三大机构联手,祭出FastWan系视频生成模型。论文地址:https://arxiv.org/pdf/2505.13389它的核心采用了「稀疏蒸馏」全新的训练方案,实现了高…... -
AI 财务 ERP 一年融了 1 亿美金,OpenAI 领投了一个 AI Excel
我在去年底介绍过一个面向财务的 AI 同事类产品,当时拿了快 900 万美金的融资《CFO 的 AI 同事来了,种子轮拿了快 900 万美金》。现在,又一个面向财务这块的 AI 产品获得了融资,而且不到一年直接拿了两轮超过 1 亿美金。今天,Rillet 宣布完成了 7000 万美金的 B 轮融资,由 a16z 和 ICONIQ 领投,2 个多月前 Rillet 刚从 Sequoia 拿了 250…... -
国内AI应用半年报告:App和Web应用月活都在跌,AI搜索需求被验证,百度是DeepSeek流失用户最大接盘手
QuestMobile 发布了 2025 年国内 AI 应用的上半年报告,总的来说,相比海外市场 app 和 web 市场都很火热的情况,国内市场的情况差别比较大。简单来说,国内以移动 app 市场为主,PC 很萎靡,但都在下滑。科技大 V 阑夕对报告进行了要点梳理:移动端和 PC 端两大场景 AI 产品的活跃用户规模双双下滑,分别少了 2000 万和 3000 万,原生 App 的大盘增长完全停…... -
您猜怎么着?Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
明天,Grok 对阵 OpenAI 的 o3。谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛!在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Fl…... -
刚刚,小红书开源了首个多模态大模型dots.vlm1,性能直追SOTA!
擅长「种草」的小红书正加大技术自研力度,两个月内接连开源三款模型!最新开源的首个多模态大模型dots.vlm1,基于自研视觉编码器构建,实测看穿色盲图,破解数独,解高考数学题,一句话写李白诗风,视觉理解和推理能力都逼近Gemini 2.5 Pro闭源模型。最近的AI圈只能说是神仙打架,太卷了。OpenAI终于发了开源模型,Claude从Opus 4升级到4.1,谷歌推出生成游戏世界的Genie 3…... -
刚刚,GPT-5内测抢先泄露!推理强到离谱,智商被曝140超越人类天才
GPT-5终于要来了,就在刚刚,已经有人通过Copilot放出了GPT-5的惊人实测,推理能力强到离谱。明天凌晨,GPT-5、GPT-5 Mini和GPT-5 Nano全家桶将悉数登场,全网已经high起来了。就在明天,GPT-5总算要靴子落地了。周五凌晨,GPT-5、GPT-5 Mini和GPT-5 Nano将同时推出。全网用户都可以立即通过API和ChatGPT访问这三个模型。经过十来天的营销…...