home 首页
新闻资讯
中东资讯
沙特阿拉伯的经济特区:吸引全球投资者

沙特阿拉伯的经济特区:吸引全球投资者

2025.08.09 / 中东资讯

Meta Platforms于8月22日推出了多模态人工智能模型SeamlessM4T。据报道,这是一种可以处理音频和文本的神经网络。该公司表示,他们有能力翻译和转录讲话。它可以用大约一百种语言来做。


如果它不负众望,那么无缝M4T就是先锋。它将允许通过各种语言进行实时交流。


脸书的母公司解释说,他们的人工智能模型可以进行文本到语音的翻译。它还可以进行语音到文本的转换。它还支持语音到语音和文本到文本的翻译。它可以用将近100种语言做到这一点。据报道,SeamlessM4T模型可以用35种语言进行完整的语音到语音翻译。这包括西波斯语、乌尔都语和现代标准阿拉伯语。


这家科技公司建立在以往创新的基础上。它结合了不同型号的技术。“不让一种语言掉队”模型是创建无缝服务时使用的一个技术元。另一个是通用语音翻译器。


Meta首席执行官马克·扎克伯格说,他认为这些工具是简化互动的手段。尤其是在元宇宙的用户之间。这是一系列相互关联的虚拟世界。扎克伯格已经把这个有争议的平台变成了一座死亡之山。无缝M4T可以使通信更容易。即使用户来自世界的不同地方也没有关系。


博客文章还提到Meta将向公众开放该模型。但它将只用于非商业用途。


这家社交媒体公司今年已经推出了一批人工智能模型。这些大多是免费的。据报道,语言模型Llama对谷歌和OpenAI的产品构成了严重威胁。


扎克伯格表示,开放的人工智能生态系统有利于Meta。他解释说,面向消费者的工具众包给了公司一个优势。对于Meta的社交平台来说,这也比向用户收取模型访问费更有效。


然而,这并非一帆风顺。Meta在开发其模型所消耗的训练数据方面面临一些法律问题。该行业的其他公司也面临着同样的情况。


流行喜剧演员萨拉·丝沃曼对Meta和OpenAI提起诉讼。西尔弗曼和另外两位作者对这些公司提起了版权侵权诉讼。他们声称他们的书在未经许可的情况下被用作训练资料。


Meta研究人员在一篇研究论文中透露,他们整理了音频训练数据。他们从400万小时的“原始音频”中得到这个这些数据来自一个向公众开放的网络数据仓库。然后将数据用于无缝M4T模型。该公司没有提到他们使用的是什么存储库。


联系我们
电话

0755-2108 9276

邮箱

shenzhen@safaristar.com

地址

深圳市龙岗区坂田街道科尔达大厦1205

电话

客服微信

客服微信
TOP