-
AI答IMO难题坦承“不会”,OpenAI:这就是自我意识
这一次,“不会”竟成了大模型的高光时刻。虽然在IMO第6题上得了零分,OpenAI的金牌模型却展现了“高智商的诚实”。正如OpenAI研究员Noam Brown在最新访谈中所揭示的:当IMO推理模型会在缺乏有效证据时表示“我不确定”,这会显著减少隐藏错误。在AI摘下IMO金牌后,OpenAI金牌小分队成员Alex Wei、Sheryl Hsu和Noam Brown参与了红杉资本组织的一场对话,揭秘…... -
在这场中美AI竞赛中,我们的互联网大厂正在迅速边缘化
也许到未来某个时候,我们才会知道今天的Meta创始人扎克伯格究竟看到了什么,让他愿意此刻在AI赛道一掷千金。仅仅在过去的12个月中,Meta在AI赛道的花钱的速度,几乎每天都是媒体热点:斥资 143 亿美元收购了数据标注公司Scale AI 49% 的股份,并聘请其首席执行官 Alexandr Wang 担任 Meta 的首席 AI 官;向10~20名顶级AI人才提供了1亿至3亿美元的薪酬包,总计…... -
AI搜索半年盘点:夸克元宝豆包会不会掀了百度的桌子?
如果说2024年是Kimi和豆包的流量之战,那么2025年上半年,这场战争的主角轮到了夸克和元宝——夸克每个月的广告投放金额均破亿,最高投放出现在6月;元宝6月、7月投放金额均超10亿元。大厂大笔投流背后,是AI时代的流量入口之争。曾经,搜索框是数字世界的起点,如今,在AI加持下,搜索已经成为数字世界的终点。当AI直接给到用户总结概览、文件解析、写文画图、对话聊天、行程规划、任务执行等时,原有的围…... -
AI搜索半年盘点:夸克元宝豆包会不会掀了百度的桌子?
如果说2024年是Kimi和豆包的流量之战,那么2025年上半年,这场战争的主角轮到了夸克和元宝——夸克每个月的广告投放金额均破亿,最高投放出现在6月;元宝6月、7月投放金额均超10亿元。大厂大笔投流背后,是AI时代的流量入口之争。曾经,搜索框是数字世界的起点,如今,在AI加持下,搜索已经成为数字世界的终点。当AI直接给到用户总结概览、文件解析、写文画图、对话聊天、行程规划、任务执行等时,原有的围…... -
AI对话,最先“伤害”老年人?
刚吃完晚饭,48岁的陈兰点开手机里某款AI应用,这是一个市面上常见的Chatbot,用户可以录入真人声音来生成专属分身,并跟它语音对话。陈兰已经连续很多天和AI打电话了。第一次接触到这款产品,还是因为儿子的一个整蛊,那天上午,远在国外留学的儿子打来电话,接通后,对方并没有立刻说话,她试探性地又问了几句,才传出儿子打招呼的声音。那次对话延续了近十分钟,电话里的儿子异常礼貌、客套,喜欢追根究底,但每当…... -
GPT-5发布,普通人必看的8件事
北京时间8月8日的凌晨,GPT-5正式发布。抛开内容不说,这个日子就很符合我们的品味,非常吉利。整个发布会内容非常丰富,展示了各种跑分评测,还有一些看起来很炫,但在日常生活中实用性不高的小程序,同时也分享了对开发者等专业群体非常有价值的案例。不管我们如何评价ChatGPT,这个产品在人工智能历史上的地位,肯定是无法撼动的,就跟iPhone在智能手机发展史上的地位一样。但是从另一个角度来看,现在的智…... -
Agent怎么运维?中科院清华重磅发布:AgentOps来了!
从“模型即服务”(MaaS)到“智能体即服务”(AaaS)的转变,标志着AI行业进入了新的发展阶段。我们不再满足于AI的“对话能力”,而是期望它能成为自主完成复杂任务的“全能机器人”。但当我们兴奋地将这些能力强大的Agent部署到生产线上时,却发现传统软件工程的“确定性”基石已不复存在。随机性,这个曾经在实验室里被视为“创造力”的特性,如今正成为生产环境中最大的不稳定因素。如何驾驭这头充满力量却难…... -
扩散LLM推理新范式:打破生成长度限制,实现动态自适应调节
随着 Gemini-Diffusion,Seed-Diffusion 等扩散大语言模型(DLLM)的发布,这一领域成为了工业界和学术界的热门方向。但是,当前 DLLM 存在着在推理时必须采用预设固定长度的限制,对于不同任务都需要专门调整才能达到最优效果。为了解决这一本质的问题,香港中文大学 MMLab,上海 AI 实验室等提出 DAEDAL,赋予 DLLM 可以根据问题的具体情况自主调整回答长度的…... -
速递|四个月估值从3.5亿升至23亿美元,n8n新一轮融资筹集数亿欧元
图片来源:Unsplash知情人士表示,风险投资公司Accel 正主导德国人工智能初创企业 n8n 的新一轮融资,这将使该公司估值呈指数级增长至 23 亿美元。知情人士透露,Accel 在包括 Insight Partners 在内的多家投资机构竞争中胜出,主导了本轮对柏林人工智能初创企业 n8n 的融资。此次融资预计将为 n8n 筹集数亿欧元,公司估值达到 23 亿美元——较四个月前约 3.5 …... -
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
就在刚刚,马斯克一手开源动作,引发了大伙儿的高度关注——xAI现在正式开源Grok 2.5,Grok 3将在半年后开源。其实早在本月初的时候,马斯克就公开表示过:是时候开源Grok了,将会在下周。虽然开源的时间已经超过了他说的节点,但也正如网友所说:迟到总比没有的好。42个文件,500个G目前,Grok已经可以在HuggingFace中下载(链接附文末):xAI官方建议用SGLang来运行Grok…... -
一个不是人的乐队,拉开人类与AI的大战
AI做的歌是否能叫“原创”?2025年,是一个“摇滚已死”的时代。 有人发现,自己在疲于工作和奔波后,再也没有享受重鼓点或劲爆吉他的心气。而一支“没有真人”的摇滚乐队回归,却让老粉们再次激动起来。 在这个AI飞速发展的年代,我们现在干什么都离不开它。音乐、媒体、文章…… 而内容创作者也像这支叫Gorillaz的乐队一样,在无数涌现的虚拟乐队前,面临一个迷幻又现实的岔路口。 前段时间,Gorilla…... -
B站要变成AI站
互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。从整体来看,B站生态集聚的好内容…... -
OpenAI重大发现:GPT-4b micro改造诺奖研究,山中因子重编程效率提高50倍
AI 加速科学和药物研发,已经不是什么新鲜事,但它的潜力远未被完全释放。就在刚刚过去的一天,OpenAI 宣布他们与生物科技初创公司 Retro Bio 合作,研发的新模型 GPT-4b micro,设计出了新型且显著增强的山中因子变体。山中因子是一组蛋白质,由诺奖得主、日本科学家山中伸弥在 2006 年提出,其包括 Oct4、Sox2、Klf4 和 c - Myc4 种因子,又称 OSKM。当它…... -
数据驱动AI虚拟细胞探索:从Arc挑战赛看“数据基座”的力量
AI虚拟细胞(AIVC)旨在借助海量生物数据与AI模型,精确模拟细胞在各种基因或药物扰动下的响应状态。最近两年,AIVC正快速渗透到生命科学与医药研发领域,但仍面临数据类型繁杂、模型难以泛化、缺乏统一标准等制约。2025年6月,Arc Institute发起首届“虚拟细胞挑战赛”,通过构建统一的数据基座与测评标准体系,引导细胞建模走向规范。本文从Arc挑战赛的数据与测评切入,尝试梳理全球虚拟细胞领…... -
LangChain 推出开源异步编码智能体 Open SWE
LangChain 发布了 Open SWE,这是一个完全开源的异步编码智能体,旨在在云端运行并处理复杂的软件开发任务。公司表示,Open SWE 代表了从实时“副驾驶”助手向更自主、长期运行的智能体的转变,这些智能体可以直接集成到开发人员现有的工作流程中。与许多专注于 IDE 内短期交互的编码助手不同,Open SWE 直接连接到 GitHub 仓库,并像工程团队的另一名成员一样工作。开发人员可…...