-
谷歌“世界模拟器”深夜上线!一句话生成3D世界,支持分钟级超长记忆
只需一句话,就能生成可实时交互的3D世界。刚刚,谷歌DeepMind发布了新一代通用世界模型Genie 3。性能上,Genie 3相比上一代大幅升级,支持720P画质,每秒24帧实时导航,以及分钟级的一致性保持。前DeepMind科学家、AI 3D生成创业者Tejas Kulkarni受邀体验了Genie 3。他使用Genie 3,生成了长达57秒的城市高空漫游场景(下图为节选):Tejas评价,…... -
OpenAI发布ChatGPT世代首个开源模型gpt-oss,4060Ti都能跑得动。
8月6号,真的今夕是何年了。一晚上,三个我觉得都蛮大的货。先是晚上10点,Google发了一个世界模型(但期货),Genie 3。这个非常的强,我看的热血沸腾,我这两天也会单独写一篇文章,来聊聊这个玩意,真的,作为一个这么多年的游戏和VR玩家,看到Genie 3非常的激动。然后就是12点半,Anthropic突然就发布了Claude Opus 4.1,在编程能力上继续进化。这节奏,感觉就是来狙击O…... -
Z Potentials|对话AskSia:当大模型能答满分高考题,教育的未来该拼什么?
AI大模型浪潮汹涌澎湃,00后创业者正一步步走上创业舞台,成为这场技术革新的主心骨。身处这股技术新浪潮之中的Celine和Kejin,两个刚走出校园里的年轻人瞄准的是AI教育。作为从应试教育中一路披荆斩棘走出来的Celine,选择做教育的原因简单直接。“我不喜欢应试教育的套路,”她坦率地说,“它忽略了学习的真正意义。”所以她决定用创业的方式,通过AI能让教育更加贴近人性,让学习变得更有趣、更有效。…... -
腾讯AI Lab开源可复现的深度研究智能体,最大限度降低外部依赖
深度研究智能体(Deep Research Agents)凭借大语言模型(LLM)和视觉-语言模型(VLM)的强大能力,正在重塑知识发现与问题解决的范式。然而,现有开源智能体框架多依赖付费工具,限制了可复现性和普适性。腾讯AI Lab全新推出的Cognitive Kernel-Pro,一款全开源、多模块、层次化的智能体框架,为深度研究智能体的开发与训练提供了突破性解决方案。在GAIA基准全集上,C…... -
连日本市场都拿不下的AI社交,注定“没戏”
七月初的组织会议上,百度点名了几个产品,明确提到要对这些产品减少投入,除了被媒体称为“能用版Manus”的心响,还有一款 AI社交App“月匣”。月匣3月正式上线,业内此前对这一产品的描述是成为Z世代心中“全时全景的灵魂伴侣”,而不到四个月,这款产品就被打入“冷宫”。 AI社交的赛道,比原来多了几分冷意。以国内两大头部 AI 社交应用为例——字节的猫箱和 MiniMax 的星野,二者今年的国区双端…... -
Nature最新封面:AI“造”水凝胶,粘连一切
一只橡胶小鸭,经受住连续数日的海浪拍打,依然纹丝不动;一根破洞达 2 厘米、注满水的管子,只需随手打个“补丁”,便可瞬间止水并防漏 5 个月之久。以上,全归功于刚刚登上最新一期 Nature 封面的「AI 造」仿生超粘胶。这一次,华人科学家、北海道大学教授龚剑萍团队“重新定义”了材料设计——从分析天然黏附蛋白序列,到构建迭代优化模型,全部由 AI 辅助完成。正如米兰比可卡大学副教授 Laura R…... -
gpt-oss专为Agent而生,16G显存就能跑,昨晚开源。
昨晚OpenAI官方放了个大招,发布了gpt-oss-120b和gpt-oss-20b两款开源模型,这是一个专为Agent而生的模型,而且开源了。这背后其实藏着OpenAI对未来AI应用形态,特别是Agentic工作流的深刻思考。这篇文章,咱们就一起扒一扒这俩模型到底牛在哪,以及它会怎么影响我们未来的产品开发。性能与性价比的“王炸”组合OpenAI官方给出的数据显示,大杯的gpt-oss-120b…... -
Token成本下降,订阅费却飞涨,AI公司怎么了?
年初那会儿,DeepSeek 横空出世,AI 圈子跟过年一样热闹。它凭啥这么火?除了开源够意思,五百多万的训练成本也惊艳了不少人。 在此之后,模型的训练成本越来越便宜,前阵子 Deep Cogito 甚至只花不到 350 万美刀,就搞出了一个(自称)能跟 o3 和 Claude 4 Opus 性能比肩的模型。 这让不少创业公司觉得,商业模式清晰了:先用「每月 20 美元」这样的低价包月服务圈住用户…... -
谷歌开源高效文本提取 Python 库LangExtract
项目简介LangExtract 是一个 Python 库,利用大型语言模型(LLMs)从非结构化文本中提取结构化信息,基于用户定义的指令。它可以处理临床笔记或报告等材料,识别并组织关键细节,同时确保提取的数据与源文本对应。为什么选择 LangExtract?1.精确的源文本定位:将每次提取映射到源文本中的确切位置,支持可视化高亮,便于追溯和验证。2.可靠的结构化输出:基于少量示例强制执行一致的输出…... -
一个APP就能拍短片!人物、字幕、BGM……AI Agent统统自己搞定
看过了这么多款Agent,这一次,AI不仅承包了视频生成,还自带演员进组了。只需一段简单的提示词,一条充满戏剧张力的微短剧就诞生了。不信,看看我们新做的《东北虎妞回唐朝当公主》:如何?是不是很有那味儿了?这就是剪映旗下的内容创作Agent小云雀最新上线的一个功能:智能生成数字人——简单来说就是文生数字人,通过提示词直接生成你想要的“演员”形象,并保持角色前后的一致性,一个视频还能同时出现多个角色。…... -
RAGFlow切片方法深度实测:Manual/Book/Laws等对比分析
团队在自研知识库底座的过程中,想对比参考下RAGFlow,发现其切片方法缺乏详细说明和清晰案例,如果你也遇到以下问题,本文能帮你节省大量试错时间:文档切片时章节目录名称是如何处理的?是单独分块,还是和对应的正文内容放一个分块?文档正文里如果包含有图片,那它和正文内容会放到一个分块里?对MANUAL、BOOK、LAWS等文档切片方法傻傻分不清,是按标题,还是按章节目录,还是按段落进行切分?表格按行切…... -
英伟达推理服务器被曝高危漏洞,云端AI模型被攻击直接裸奔
一波未平,一波又起。英伟达Triton推理服务器,被安全研究机构Wiz Research曝光了一组高危漏洞链。这组漏洞可以被组合利用,实现远程代码执行(RCE),攻击者可以读取或篡改共享内存中的数据,操纵模型输出,控制整个推理后端的行为。可能造成的后果包括模型被盗、数据泄露、响应操纵,乃至系统失控。目前,英伟达已经发布补丁,但所有25.07版本之前的系统都处于裸奔状态,用户需要将Triton In…... -
闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了
从目前战况来看,Grok 4 是夺冠热门。在玩游戏方面,到底哪个模型最厉害?为了回答这个问题,谷歌近日发起了首届大模型国际象棋对抗赛。这场比赛为期三天,参赛选手包括: o4-mini(OpenAI)DeepSeek-R1(DeepSeek)Kimi K2 Instruct(月之暗面)o3(OpenAI)Gemini 2.5 Pro(谷歌)Claude Opus 4(Anthropic)Grok 4…... -
AlphaGo开发者创业挑战DeepSeek,成立仅一年目标融资10亿美元
融资10亿美元,要在开源上挑战Deepseek!前谷歌DeepMind成员、AlphaGo开发者创立Reflection AI,致力于开发开源大语言模型。△图源Lightspeed Venture Partners近来中国开源模型势头火热,Qwen系列、Kimi K2等纷纷霸榜,OpenAI也在深夜宣布开源,这家公司的挑战可不小。不过两位创始人倒是雄心壮志地向员工表示:他们相信有机会将Reflec…... -
赛博沙盒:如何与AI共创未来丨1.4万字圆桌实录
本期为《仲夏六日谈》第四季六期节目文字内容,主题为《赛博沙盒:如何与AI共创未来》。十大看点:·AI的创造力瓶颈何在?·“算法子宫”:游戏为何是AI的最佳孵化场?·具身智能是AI突破的关键吗?·智能NPC如何突破成本与失控困境?·AI将催生哪些游戏新商业模式?·游戏如何成为社会科学研究的“安全沙盒”?·AI将如何颠覆游戏开发流程?·低代码时代,人人都是游戏创作者?·游戏媒介的独特性何在?·游戏能否…...















