生活网10月7日 消息:由DeepMind、Google、百度和meta的研究人员共同创立的AI创企Reka,最近宣布了最新产品一款多模态AI助手Yasa-1。这款助手被设计成可以理解和互动文本、图像、视频和音频等多种媒体形式,被认为有望成为OpenAI的ChatGPT的竞争对手。
Yasa-1目前正在进行私人测试,与OpenAI的ChatGPT竞争,后者已经进行了多模态升级,包括GPT-4V和DALL-E3。Reka的团队表示,他们在Google Bard、PaLM和Deepmind Alphacode等项目的开发中有过经验,这使得Yasa-1更具竞争力。
Yasa-1的独特之处在于它的多模态能力。它可以支持文本提示与多媒体文件的结合,以提供更具体的答案。例如,它可以使用图像创建社交媒体帖子以推广产品,或者识别特定声音及其来源。
此外,Yasa-1还可以理解视频中正在发生的事情,包括讨论的主题,并预测视频中可能发生的下一步动作。
除了多模态能力,Yasa-1还支持编程任务,并能够执行代码来执行算术操作,分析表格或为特定数据点创建可视化。然而,正如所有大型语言模型一样,Yasa-1也可能会生成无意义的内容,因此不应完全依赖它提供关键建议。
Reka计划在未来几周内扩大Yasa-1的使用范围,以提高其功能并解决一些限制。这家初次公开亮相于2023年6月的创企已获得5800万美元的资金支持,其重点领域包括通用智能、通用多模态和多语言代理、自我改进的AI以及模型效率。
Yasa-1的发布标志着多模态AI助手领域的竞争愈发激烈,预示着未来AI助手将在不同媒体类型之间进行更多复杂的交互,为用户提供更多有趣和实用的功能。