-
刚刚,全网最懂图文调研的智能体模型震撼上线,看完我直接卸了浏览器
疯狂的七月已经落下了帷幕,如果用一个词来形容国产大模型,「开源」无疑是当之无愧的高频词汇。各大厂商你方唱罢我登场,昆仑万维、阿里、智谱、月之暗面、腾讯、阶跃星辰等众多玩家们先后开源了数十款大模型。根据 Hugging Face 发布的中国 AI 社区七月开放成果,短短一个月开源模型总数达到了惊人的 33 款。进入到八月,国产大模型「上新」的势头丝毫不减,重量级成果发布的热度继续升温。其中,上个月接…... -
新增10家上榜AI应用小团队,他们靠“交付结果”年入千万美元
短短两个月前,我们还在感叹 31 家 AI 小团队的高效表现,当时团队平均规模仅 20 人,人均创造收入高达 279 万美元(参见《细数 31 家 AI 应用小团队,平均 20 人、人均创收 279 万美元》)。如今,再度审视 Henry Shi 发布的最新榜单,我们发现 AI 小团队生态中又涌现出十款取得商业成功的产品,覆盖 AI 视频、AI 游戏、甚至 AI“团购”平台。仔细分析这些新上榜团队…... -
我们都错怪GPT-5了,路由统一算力,免费用户也能创造收益
GPT-5发布以来,路由架构是最受关心的部分之一。它不仅实现了多个模型统一调度,而且还藏着奥特曼的诸多小心思。比如成本更可控、悄悄识别意图插入广告等。但是由于GPT-5不开源,这个框架具体啥情况咱们也都无从得知。不过,最近开源社区出现了一个类似版本——Arch-Router,它会结合任务领域(如金融、法律)和具体动作(如摘要、生成代码)来制定路由策略,并连接到最适合的模型,与人类的偏好对齐。顺着这…... -
扎克伯格看OpenAI直播挖人,北大校友孙之清加入Meta
给 Sam 的专业建议:直播选人要小心。大家都是老朋友,在新 Lab 聚首了。本周五,前 OpenAI 研究科学家,一个月前刚刚加入 Meta 的 Hyung Won Chung 晒出一张照片:照片中的三人分别是 Hyung Won Chung、Zhiqing Sun(孙之清)与 Jason Wei。他们在 OpenAI 度过了一段愉快的时光后,都已加入 Meta 新成立的超级智能实验室(MSL)…... -
10亿国民App丝滑升级AI应用!高德携手通义重构的底层架构曝光
10亿用户App转向AI原生应用,大船如何掉头?高德最近打了个样,用AI重构底层技术栈,建立主-从Agent架构,将千问大模型与空间智能结合,展现出了新范式的强大威力,给用户带去了极大便利。一条最快的通勤路线,一份详细的全家旅游攻略……过去需要一系列操作,全网到处搜索需求,现在动动嘴,一句话就搞定了。出行和生活,有AI Agent加持以后,原来可以这么简单。这也意味着高德地图从出行工具转变为了智能…... -
腾讯混元开源游戏AI生成新工具!RTX 4090就能制作3A级动态内容
随手拍的一张图,就能秒变3A级游戏大作?!刚刚,腾讯全新开源游戏视频生成框架Hunyuan-GameCraft,专为游戏环境设计,让任何人都能轻松搞定游戏制作。无论是水墨风:抑或是古希腊:只要你想,统统都能满足。基于腾讯混元视频生成HunyuanVideo搭建,可以实时生成流畅画面。操作也很so easy,只需要:单张场景图+文字描述+动作指令=高清动态游戏视频。所以下面让我们一起Game sta…... -
Cohere融资36亿,AMD英伟达都投了!前Meta研究副总裁出任首席AI官
加拿大AI新贵Cohere获5亿美元融资、估值68亿美元,前Meta FAIR副总裁、PyTorch与Llama重要推手Joelle Pineau加盟出任首席AI官,或将开启企业AI新战局。最新消息,AI初创公司Cohere已完成5亿美元融资,估值来到68亿美元。这轮融资由Radical Ventures和Inovia Capital领投,超额认购。其他参与投资的既有投资者包括AMD Ventur…... -
首个开源多模态Deep Research智能体,超越多个闭源方案
首个开源多模态Deep Research Agent来了。整合了网页浏览、图像搜索、代码解释器、内部 OCR 等多种工具,通过全自动流程生成高质量推理轨迹,并用冷启动微调和强化学习优化决策,使模型在任务中能自主选择合适的工具组合和推理路径。假设你让一个 AI 回答这样一个问题:“在这张图所示动物的 Wikipedia 页面上,2020 年之前带有 ‘visual edit’ 标签的修订次数是多少?…... -
吞下17亿图片,Meta最强巨兽DINOv3开源!重新定义CV天花板
无需人工标注,吞下17亿张图片,Meta用自监督学习炼出「视觉全能王」!NASA已将它送上火星,医疗、卫星、自动驾驶领域集体沸腾。17亿张图片,Meta训出70亿参数「视觉巨兽」DINOv3,完全开源了!通过自监督学习(SSL)训练,DINOv3可生成强大且高分辨率的图像特征。在多个密集预测任务中,这是单一固定的视觉主干网络第一次超越专用解决方案。DINOv3重新定义计算机视觉性能天花板,在多个基…... -
GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了
前沿 AI 模型真的能做到博士级推理吗?前段时间,谷歌、OpenAI 的模型都在数学奥林匹克(IMO)水平测试中达到了金牌水准,这样的表现让人很容易联想到 LLM 是不是已经具备了解决博士级科研难题的推理能力?然而,现实可能并不如想象中那么乐观。AAI,一个专注于超智能和高级 AI 系统研究的机构,近期提出的一个新基准 FormulaOne,让一众大模型集体得零分,包括 GPT-5、o3 Pro、…... -
谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生
谷歌开源Gemma 3 270M闪亮登场!只需几分钟即可完成微调,指令遵循和文本结构化能力更是惊艳,性能超越Qwen 2.5同级模型。发布当天,网友也懵了:以为是270B,结果居然才0.27B。此模型小巧又高效,可以直接在浏览器里本地运行,不用联网,也能生成有创意的内容,比如睡前故事。不仅如此,还有人使用这款迷你模型构建了自己的OCR应用程序。上传一张图片或PDF文件,即可用LLM即时将其转换为结…... -
反击AI论文!arXiv每年拒掉2%造假内容,自动化工具加入审核
AI生成论文泛滥成灾,arXiv平台看不下去了——紧急升级审核机制,用自动化工具来检测AI生成内容。Nature最新发现,原来每年竟然都有2%的论文会因为AI使用被拒?!比如像,bioRxiv和medRxiv每天都要拒绝十多篇公式化AI手稿,每个月就高达7000多份。本来是方便快速分享成果的预印本平台,现已成为了AI内容的温床。一方面AI写作泛滥成灾,另一方面又要确保不会误伤到合理的AI英语润色需…... -
腾讯AI团队最新研究戳穿AI“智力”泡沫:百万上下文正在误导所有人
AI领域一度陷入“上下文窗口”的军备竞赛,从几千token扩展到数百万token。这相当于给了AI一个巨大的图书馆。但这些“百万上下文”的顶级模型,它究竟是真的“理解”了,还是只是一个更会“背书”的复读机?最近,一篇由腾讯微信AI团队主导的研究论文,给我们提供了一个相当犀利的视角来审视这个问题。这篇论文介绍了一个名为PRELUDE的评测基准,它像一面镜子,照出了当前大模型能力的真相,或许我们一直以…... -
竞购 Chrome,正面竞争 OpenAI,Perplexity 为什么要做 AI 浏览器?
今年 6 月,The Browser Company 向 Arc 用户开放了浏览器 Dia 的 Beta 测试。上个月,Perplexity 新推出了自己的 AI 原生浏览器 Comet,随后 OpenAI 也宣布计划在未来几周发布浏览器。而就在这周,Perplexity 更是向 Google 母公司 Alphabet 提出以 345 亿美元收购 Chrome 的邀约,这一出价甚至超过了 Perp…... -
桌面端已经过时了,这个 AI 直接在手机开了 Agent 商店
大家好我是歸藏(guizang),今天带来漂亮又实用的 Macaron 的介绍和体验。前几天发现一个有意思的应用 Macaron,靠颜值就吸引了我,整个设计风格非常的阳光而且高级,尤其是里面的图标,很好看。看了一下应用的介绍,产品的功能主要包括两部分:首先是一个马卡龙形象的 AI 陪伴聊天personal agent ,他有长时间的记忆能力,不需要单独操作就可以记住你的小习惯和一些喜好。第二部分是…...