全部标签

Ai资讯

Cohere融资36亿，AMD英伟达都投了！前Meta研究副总裁出任首席AI官

加拿大AI新贵Cohere获5亿美元融资、估值68亿美元，前Meta FAIR副总裁、PyTorch与Llama重要推手Joelle Pineau加盟出任首席AI官，或将开启企业AI新战局。最新消息，AI初创公司Cohere已完成5亿美元融资，估值来到68亿美元。这轮融资由Radical Ventures和Inovia Capital领投，超额认购。其他参与投资的既有投资者包括AMD Ventur…...
首个开源多模态Deep Research智能体，超越多个闭源方案

首个开源多模态Deep Research Agent来了。整合了网页浏览、图像搜索、代码解释器、内部 OCR 等多种工具，通过全自动流程生成高质量推理轨迹，并用冷启动微调和强化学习优化决策，使模型在任务中能自主选择合适的工具组合和推理路径。假设你让一个 AI 回答这样一个问题：“在这张图所示动物的 Wikipedia 页面上，2020 年之前带有 ‘visual edit’ 标签的修订次数是多少？…...
吞下17亿图片，Meta最强巨兽DINOv3开源！重新定义CV天花板

无需人工标注，吞下17亿张图片，Meta用自监督学习炼出「视觉全能王」！NASA已将它送上火星，医疗、卫星、自动驾驶领域集体沸腾。17亿张图片，Meta训出70亿参数「视觉巨兽」DINOv3，完全开源了！通过自监督学习（SSL）训练，DINOv3可生成强大且高分辨率的图像特征。在多个密集预测任务中，这是单一固定的视觉主干网络第一次超越专用解决方案。DINOv3重新定义计算机视觉性能天花板，在多个基…...
GPT-5、Grok 4、o3 Pro都零分，史上最难AI评测基准换它了

前沿 AI 模型真的能做到博士级推理吗？前段时间，谷歌、OpenAI 的模型都在数学奥林匹克（IMO）水平测试中达到了金牌水准，这样的表现让人很容易联想到 LLM 是不是已经具备了解决博士级科研难题的推理能力？然而，现实可能并不如想象中那么乐观。AAI，一个专注于超智能和高级 AI 系统研究的机构，近期提出的一个新基准 FormulaOne，让一众大模型集体得零分，包括 GPT-5、o3 Pro、…...
谷歌版小钢炮开源！0.27B大模型，4个注意力头，专为终端而生

谷歌开源Gemma 3 270M闪亮登场！只需几分钟即可完成微调，指令遵循和文本结构化能力更是惊艳，性能超越Qwen 2.5同级模型。发布当天，网友也懵了：以为是270B，结果居然才0.27B。此模型小巧又高效，可以直接在浏览器里本地运行，不用联网，也能生成有创意的内容，比如睡前故事。不仅如此，还有人使用这款迷你模型构建了自己的OCR应用程序。上传一张图片或PDF文件，即可用LLM即时将其转换为结…...
反击AI论文！arXiv每年拒掉2%造假内容，自动化工具加入审核

AI生成论文泛滥成灾，arXiv平台看不下去了——紧急升级审核机制，用自动化工具来检测AI生成内容。Nature最新发现，原来每年竟然都有2%的论文会因为AI使用被拒？！比如像，bioRxiv和medRxiv每天都要拒绝十多篇公式化AI手稿，每个月就高达7000多份。本来是方便快速分享成果的预印本平台，现已成为了AI内容的温床。一方面AI写作泛滥成灾，另一方面又要确保不会误伤到合理的AI英语润色需…...
腾讯AI团队最新研究戳穿AI“智力”泡沫：百万上下文正在误导所有人

AI领域一度陷入“上下文窗口”的军备竞赛，从几千token扩展到数百万token。这相当于给了AI一个巨大的图书馆。但这些“百万上下文”的顶级模型，它究竟是真的“理解”了，还是只是一个更会“背书”的复读机？最近，一篇由腾讯微信AI团队主导的研究论文，给我们提供了一个相当犀利的视角来审视这个问题。这篇论文介绍了一个名为PRELUDE的评测基准，它像一面镜子，照出了当前大模型能力的真相，或许我们一直以…...
竞购 Chrome，正面竞争 OpenAI，Perplexity 为什么要做 AI 浏览器？

今年 6 月，The Browser Company 向 Arc 用户开放了浏览器 Dia 的 Beta 测试。上个月，Perplexity 新推出了自己的 AI 原生浏览器 Comet，随后 OpenAI 也宣布计划在未来几周发布浏览器。而就在这周，Perplexity 更是向 Google 母公司 Alphabet 提出以 345 亿美元收购 Chrome 的邀约，这一出价甚至超过了 Perp…...
桌面端已经过时了，这个 AI 直接在手机开了 Agent 商店

大家好我是歸藏（guizang），今天带来漂亮又实用的 Macaron 的介绍和体验。前几天发现一个有意思的应用 Macaron，靠颜值就吸引了我，整个设计风格非常的阳光而且高级，尤其是里面的图标，很好看。看了一下应用的介绍，产品的功能主要包括两部分：首先是一个马卡龙形象的 AI 陪伴聊天personal agent ，他有长时间的记忆能力，不需要单独操作就可以记住你的小习惯和一些喜好。第二部分是…...
To B 领域第一批吃 AI 螃蟹的人，复盘了「AI 落地」的真相和方法论

如果你是一名正在投身 AI 浪潮的创业者，或者一个正在思考，如何利用 AI 改造现有业务的从业者，那么 G7 易流 CEO 翟学魂的经历，或许能给你带来一些重要的启示。他为观察这场AI如何重塑业务、组织、人才、行业格局的变革提供了一个独特的视角。G7 易流是中国最大的公路货运行业 IoT SaaS 服务提供商。大模型浪潮一开始，他们就投身其中，试图开发行业垂直大模型。但不到半年，就果断放弃了。翟学…...
速递｜Reddit创始人押注840万！Palabra攻克AI语音翻译“拟真实时”难题

图片来源：Palabra一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎，致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。如今，LLMs 使文本语言转换变得更容易，但 Reddit 联合创始人亚历克西斯·奥哈尼安指出，语音翻译并非如此简单。奥哈尼安表示："AI 可以生成内容和翻译文本。但[语音]翻译是个独特难题，因为它需要实时语言切换，同时声音…...
GPT-5超越人类医生！推理能力比专家高出24%，理解力强29%

GPT-5比人类医生还会看X光片？！最新研究显示，GPT-5对医学影像的推理和理解准确率分别比人类专家高出24.23%和29.40%。来自埃默里大学医学院的研究团队把GPT-5和GPT-4o以及更小的GPT-5变体（GPT-5-mini、GPT-5-nano）进行了比较，分析它们在医疗领域处理多模态信息的能力。通过一系列标准化测试发现GPT-5在所有测试中的表现都比其他模型好，尤其是在MedXpe…...
越可靠的AI就越人机，牛津大学：高情商模型错误率显著增加

情绪价值这块儿，GPT-5让很多网友大呼失望。免费用户想念GPT-4o，也只能默默调理了。但为什么升级后的GPT-5，反而变得“不近人情”了呢？牛津大学一项研究的结论，可以来参考看看：训练模型变得温暖且富有同理心，会使它们变得不太可靠且更加奉承。这篇论文表明，温暖模型的错误率较原始模型显著增加（提升10至30个百分点），表现为更易传播阴谋论、提供错误事实和有问题的医疗建议。纳尼？意思是智商和情商不…...
Y Combinator S25 全面盘点：108 家初创 AI 公司，谁是下一匹黑马？

2025 年有望成为 AI Agent 之年。2025 年，人工智能的叙事已经不再靠“模型突破”来驱动，而是进入了“应用激战区”。硅谷著名孵化器 Y Combinator 在官网上直言——“2025 年有望成为 AI Agent 之年。”这种判断背后的逻辑很直接：AI 不再只是后台算法，而是开始在前台变成“员工”“助手”，接管具体业务流程。目前，YC Summer 2025 招募已结束，夏季路演活…...
笑死，人形机器人运动会全是鬼畜名场面！这锅粥大家来趁乱喝了吧

天啊，首届人形机器人运动会，现场乱成一锅粥了。宇树机器人勇夺1500米长跑金牌，但撞人还逃逸了（来自抖音@宅生同学）。摔得一片狼藉就算了，好不容易靠自己鲤鱼打挺站起来的机器人，还被救场的人类一扒拉又摔倒了。机器人OS：算了，摆烂吧。队内突然开始抢球，捎带着队友和对手，全部摔倒滚在一起。拳击手突然倒地，你以为是意外，其实是专门设计的嘲讽小连招——那年我双手插兜不知道什么是对手。还有长跑的宇树，马上要…...