速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题

速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题

图片来源:Palabra

一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎,致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。

如今,LLMs 使文本语言转换变得更容易,但 Reddit 联合创始人亚历克西斯·奥哈尼安指出,语音翻译并非如此简单。

奥哈尼安表示:”AI 可以生成内容和翻译文本。但[语音]翻译是个独特难题,因为它需要实时语言切换,同时声音还需保持拟人化。”

奥哈尼安及其风投公司 Seven Seven Six(776)认为 Palabra AI 可能解决这一难题。因此该公司领投了这家初创企业 840 万美元的种子前轮融资。

本轮参投方还包括 Creator Ventures 及多位个人投资者,如 Instacart 联合创始人马克斯·穆伦、a16z 前合伙人安妮·李·斯凯茨、DeepMind 前产品主管迈赫迪·吉萨西以及纳马特·巴哈拉姆。

Seven Seven Six 的奥哈尼安特别强调,Palabra 在产品执行与团队专业性的双重优势促使他们决定投资。

“Palabra 的翻译层运行非常流畅。该公司拥有一支强大的 AI 研究团队,在语音领域做了高质量的工作。此外,这家初创公司在产品设计和输出质量方面也做出了出色的选择,”他补充道。

Palabra 由 Artem Kukharenko 和 Alexander Kabakov 于 2023 年创立。曾担任三星机器学习工程师的 Kukharenko 表示,他作为数字游民曾在多个国家生活,遇到过语言障碍问题。因此他希望结合自己的机器学习经验来解决实时翻译难题。

首席执行官ARTEM KUKHARENKO

速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题

图片来源:Palabra

“许多其他公司都曾尝试解决翻译难题。但当他们将语音转文本、文本转语音等 API 与翻译技术结合使用时,延迟时间就会增加,翻译效果无法实现真正的实时性。而通过 Palabra,我们成功将延迟降至 800 毫秒,使翻译过程流畅无缝,真正实现实时翻译。”他在电话采访中向 TechCrunch 表示。

Kukharenko 补充道,该公司已构建了一条定制化数据管道,使这家初创企业能在数周内轻松新增语言支持。他表示在管道末端,Palabra 会安排人工译员对输出质量进行校验。该初创公司称其算法还能适应嘈杂环境和对话中断等不同场景。

Palabra AI 同时提供面向消费者和企业的翻译产品。该公司推出的桌面应用程序兼容 Mac 和 Windows 系统,可与 Google Meet、Zoom、Discord、Slack 及 Microsoft Teams 等主流视频通话软件协同工作。该应用支持超过 30 种语言的实时互译,用户可选择以目标语言收听对方的母语发言,这一功能在多国籍参与者通话场景中尤为实用。

Palabra 官网表示,其桌面应用即将为 YouTube、Netflix、Twitch 和 Vimeo 等内容网站提供原生翻译功能。

用户每月可免费获得30分钟翻译时长。如需更多额度,可订阅每月25美元起的套餐,获得60分钟跨应用翻译时长。

该初创公司向企业提供 API 和 SDK,以便将翻译功能集成至其产品中。

目前其技术已为Agora 等视频平台提供实时多语言流支持。此外,GIS Group 等语言服务提供商正将 Palabra 工具与人工翻译结合使用。该公司表示,多家活动主办方也采用其技术提供多语言流服务。

Palabra 在翻译市场面临激烈竞争。在消费者端,像 Y Combinator 投资的 EzDubs 这样的初创公司正在开发适用于面对面或电话对话的应用程序。今年早些时候,谷歌也推出了 Meet 视频通话的实时翻译功能 。在企业端,像迪拜的 Camb.AI 这样的初创公司正在开发多语言直播活动翻译技术。

为了脱颖而出,Palabra 目前正在开发新的流式预测模型,有望大幅降低延迟。该公司还致力于支持超过 10,000 个同步音频流的翻译处理。

参考资料

https://techcrunch.com/2025/08/14/ai-translation-tech-palabra-gets-backing-from-reddit-co-founders-venture-firm/

文章来自于微信公众号“Z Potentials”。

搜索