全部标签

Ai资讯

谷歌“世界模拟器”深夜上线！一句话生成3D世界，支持分钟级超长记忆

只需一句话，就能生成可实时交互的3D世界。刚刚，谷歌DeepMind发布了新一代通用世界模型Genie 3。性能上，Genie 3相比上一代大幅升级，支持720P画质，每秒24帧实时导航，以及分钟级的一致性保持。前DeepMind科学家、AI 3D生成创业者Tejas Kulkarni受邀体验了Genie 3。他使用Genie 3，生成了长达57秒的城市高空漫游场景（下图为节选）：Tejas评价，…...
OpenAI发布ChatGPT世代首个开源模型gpt-oss，4060Ti都能跑得动。

8月6号，真的今夕是何年了。一晚上，三个我觉得都蛮大的货。先是晚上10点，Google发了一个世界模型（但期货），Genie 3。这个非常的强，我看的热血沸腾，我这两天也会单独写一篇文章，来聊聊这个玩意，真的，作为一个这么多年的游戏和VR玩家，看到Genie 3非常的激动。然后就是12点半，Anthropic突然就发布了Claude Opus 4.1，在编程能力上继续进化。这节奏，感觉就是来狙击O…...
Z Potentials｜对话AskSia：当大模型能答满分高考题，教育的未来该拼什么？

AI大模型浪潮汹涌澎湃，00后创业者正一步步走上创业舞台，成为这场技术革新的主心骨。身处这股技术新浪潮之中的Celine和Kejin，两个刚走出校园里的年轻人瞄准的是AI教育。作为从应试教育中一路披荆斩棘走出来的Celine，选择做教育的原因简单直接。“我不喜欢应试教育的套路，”她坦率地说，“它忽略了学习的真正意义。”所以她决定用创业的方式，通过AI能让教育更加贴近人性，让学习变得更有趣、更有效。…...
腾讯AI Lab开源可复现的深度研究智能体，最大限度降低外部依赖

深度研究智能体（Deep Research Agents）凭借大语言模型（LLM）和视觉-语言模型（VLM）的强大能力，正在重塑知识发现与问题解决的范式。然而，现有开源智能体框架多依赖付费工具，限制了可复现性和普适性。腾讯AI Lab全新推出的Cognitive Kernel-Pro，一款全开源、多模块、层次化的智能体框架，为深度研究智能体的开发与训练提供了突破性解决方案。在GAIA基准全集上，C…...
连日本市场都拿不下的AI社交，注定“没戏”

七月初的组织会议上，百度点名了几个产品，明确提到要对这些产品减少投入，除了被媒体称为“能用版Manus”的心响，还有一款 AI社交App“月匣”。月匣3月正式上线，业内此前对这一产品的描述是成为Z世代心中“全时全景的灵魂伴侣”，而不到四个月，这款产品就被打入“冷宫”。 AI社交的赛道，比原来多了几分冷意。以国内两大头部 AI 社交应用为例——字节的猫箱和 MiniMax 的星野，二者今年的国区双端…...
Nature最新封面：AI“造”水凝胶，粘连一切

一只橡胶小鸭，经受住连续数日的海浪拍打，依然纹丝不动；一根破洞达 2 厘米、注满水的管子，只需随手打个“补丁”，便可瞬间止水并防漏 5 个月之久。以上，全归功于刚刚登上最新一期 Nature 封面的「AI 造」仿生超粘胶。这一次，华人科学家、北海道大学教授龚剑萍团队“重新定义”了材料设计——从分析天然黏附蛋白序列，到构建迭代优化模型，全部由 AI 辅助完成。正如米兰比可卡大学副教授 Laura R…...
gpt-oss专为Agent而生，16G显存就能跑，昨晚开源。

昨晚OpenAI官方放了个大招，发布了gpt-oss-120b和gpt-oss-20b两款开源模型，这是一个专为Agent而生的模型，而且开源了。这背后其实藏着OpenAI对未来AI应用形态，特别是Agentic工作流的深刻思考。这篇文章，咱们就一起扒一扒这俩模型到底牛在哪，以及它会怎么影响我们未来的产品开发。性能与性价比的“王炸”组合OpenAI官方给出的数据显示，大杯的gpt-oss-120b…...
Token成本下降，订阅费却飞涨，AI公司怎么了？

年初那会儿，DeepSeek 横空出世，AI 圈子跟过年一样热闹。它凭啥这么火？除了开源够意思，五百多万的训练成本也惊艳了不少人。在此之后，模型的训练成本越来越便宜，前阵子 Deep Cogito 甚至只花不到 350 万美刀，就搞出了一个（自称）能跟 o3 和 Claude 4 Opus 性能比肩的模型。这让不少创业公司觉得，商业模式清晰了：先用「每月 20 美元」这样的低价包月服务圈住用户…...
谷歌开源高效文本提取 Python 库LangExtract

项目简介LangExtract 是一个 Python 库，利用大型语言模型（LLMs）从非结构化文本中提取结构化信息，基于用户定义的指令。它可以处理临床笔记或报告等材料，识别并组织关键细节，同时确保提取的数据与源文本对应。为什么选择 LangExtract？1.精确的源文本定位：将每次提取映射到源文本中的确切位置，支持可视化高亮，便于追溯和验证。2.可靠的结构化输出：基于少量示例强制执行一致的输出…...
一个APP就能拍短片！人物、字幕、BGM……AI Agent统统自己搞定

看过了这么多款Agent，这一次，AI不仅承包了视频生成，还自带演员进组了。只需一段简单的提示词，一条充满戏剧张力的微短剧就诞生了。不信，看看我们新做的《东北虎妞回唐朝当公主》：如何？是不是很有那味儿了？这就是剪映旗下的内容创作Agent小云雀最新上线的一个功能：智能生成数字人——简单来说就是文生数字人，通过提示词直接生成你想要的“演员”形象，并保持角色前后的一致性，一个视频还能同时出现多个角色。…...
RAGFlow切片方法深度实测：Manual/Book/Laws等对比分析

团队在自研知识库底座的过程中，想对比参考下RAGFlow，发现其切片方法缺乏详细说明和清晰案例，如果你也遇到以下问题，本文能帮你节省大量试错时间：文档切片时章节目录名称是如何处理的？是单独分块，还是和对应的正文内容放一个分块？文档正文里如果包含有图片，那它和正文内容会放到一个分块里？对MANUAL、BOOK、LAWS等文档切片方法傻傻分不清，是按标题，还是按章节目录，还是按段落进行切分？表格按行切…...
英伟达推理服务器被曝高危漏洞，云端AI模型被攻击直接裸奔

一波未平，一波又起。英伟达Triton推理服务器，被安全研究机构Wiz Research曝光了一组高危漏洞链。这组漏洞可以被组合利用，实现远程代码执行（RCE），攻击者可以读取或篡改共享内存中的数据，操纵模型输出，控制整个推理后端的行为。可能造成的后果包括模型被盗、数据泄露、响应操纵，乃至系统失控。目前，英伟达已经发布补丁，但所有25.07版本之前的系统都处于裸奔状态，用户需要将Triton In…...
闹玩呢！首届大模型对抗赛，DeepSeek、Kimi第一轮被淘汰了

从目前战况来看，Grok 4 是夺冠热门。在玩游戏方面，到底哪个模型最厉害？为了回答这个问题，谷歌近日发起了首届大模型国际象棋对抗赛。这场比赛为期三天，参赛选手包括： o4-mini（OpenAI）DeepSeek-R1（DeepSeek）Kimi K2 Instruct（月之暗面）o3（OpenAI）Gemini 2.5 Pro（谷歌）Claude Opus 4（Anthropic）Grok 4…...
AlphaGo开发者创业挑战DeepSeek，成立仅一年目标融资10亿美元

融资10亿美元，要在开源上挑战Deepseek！前谷歌DeepMind成员、AlphaGo开发者创立Reflection AI，致力于开发开源大语言模型。△图源Lightspeed Venture Partners近来中国开源模型势头火热，Qwen系列、Kimi K2等纷纷霸榜，OpenAI也在深夜宣布开源，这家公司的挑战可不小。不过两位创始人倒是雄心壮志地向员工表示：他们相信有机会将Reflec…...
赛博沙盒：如何与AI共创未来丨1.4万字圆桌实录

本期为《仲夏六日谈》第四季六期节目文字内容，主题为《赛博沙盒：如何与AI共创未来》。十大看点：·AI的创造力瓶颈何在？·“算法子宫”：游戏为何是AI的最佳孵化场？·具身智能是AI突破的关键吗？·智能NPC如何突破成本与失控困境？·AI将催生哪些游戏新商业模式？·游戏如何成为社会科学研究的“安全沙盒”？·AI将如何颠覆游戏开发流程？·低代码时代，人人都是游戏创作者？·游戏媒介的独特性何在？·游戏能否…...