Quando você pensa em ferramentas infundidas com inteligência artificial (IA) hoje em dia, é natural que o ChatGPT e o Bing Chat Mas o proprietário do Facebook, Meta, quer mudar isso com o SeamlessM4T, um “tradutor de idiomas universal” alimentado por IA que pode converter instantaneamente qualquer idioma do mundo em qualquer saída que você quiser.
Meta descreve o SeamlessM4T como “o primeiro modelo multilíngue multilíngue de tradução e transcrição de IA tudo-em-um”. Isso é um bocado, mas em termos simples, significa que pode converter idiomas de várias maneiras diferentes, como pegar áudio de fala e trocá-lo em texto em uma língua diferente.
De acordo com o Meta, os recursos de reconhecimento de fala e tradução da ferramenta podem funcionar de algumas maneiras diferentes:
• Reconhecimento de fala para quase 100 idiomas
• Tradução de fala para texto para quase 100 idiomas de entrada e saída
• Tradução de fala para fala para quase 100 idiomas de entrada e 36 idiomas de saída (incluindo inglês)
• Tradução de texto para texto para quase 100 idiomas
• Tradução de texto para fala para quase 100 idiomas de entrada e 35 idiomas de saída (incluindo inglês)
O SeamlessM4T está sendo lançado sob uma licença de pesquisa, e a Meta afirma que está fazendo isso para “permitir que pesquisadores e desenvolvedores desenvolvam esse trabalho”. Além disso, os metadados do conjunto de dados que foi usado para treinar o modelo de tradução, chamado SeamlessAlign, também estão sendo divulgados publicamente. Isso consiste em “270.000 horas de alinhamentos de fala e texto extraídos”, afirma Meta.
No entanto, a Meta não deixou claro de onde essas 270.000 horas de “discurso minado” foram obtidas. Preocupações foram levantadas sobre as implicações de privacidade do trabalho da Meta em chatbots de IA, enquanto outras ferramentas de IA já foram pegas roubando trabalho protegido. Sem dúvida, não haverá temores de que a Meta poderia ter feito algo semelhante quando treinou o SeamlessM4T.
Já existem outras ferramentas de tradução, como o Google Translate, que podem converter texto em texto e fala em texto, mas a Meta diz que seus próprios esforços são superiores. SeamlessM4T, argumenta Meta, “reduz erros e atrasos, aumentando a eficiência e a qualidade do processo de tradução”.
A Meta não disse se a nova ferramenta será integrada em seus aplicativos como Facebook e Instagram, mas a empresa revelou que pretendia “explorar como esse modelo fundamental pode permitir novos recursos de comunicação” no futuro. Teremos que ver o que isso implica.
Meta está construindo o SeamlessM4T, “o primeiro modelo completo de tradução e transcrição de IA multimodal multilíngue” que poderá converter qualquer idioma do mundo e, no futuro, incluir também os dialetos e as linguas consideradas mortas.
O objetivo é que um dia a ferramenta inclua o idioma mais antigo do mundo: a língua acádia, que data de 14 a.C., além do latim, sânscrito, anglo-saxão, grego arcaico, egípcio antigo, aramaico, esperanto, mandarim e o hebraico.
Além disso, os dialetos tok pisin e hiri motu da Papua Nova Guiné, o Romanche da Suíça, o Pite Sami da Suécia e Noruega e o Galego das Astúrias.