Por Pedro Simões
23/10/2025
O projeto No Language Left Behind (NLLB‑200) da Meta, voltado à tradução automática, agora suporta 200 línguas, inclusive idiomas com poucos recursos. Apesar do avanço técnico, pesquisadores indicam que o uso de dados e a qualidade da tradução ainda exigem colaboração efetiva com falantes nativos dos idiomas menos representados.
A Meta anunciou, por meio de publicação institucional, que seu modelo de tradução automática NLLB-200 consegue lidar com 200 línguas diferentes, ampliando significativamente seu alcance.
Segundo a empresa, o modelo representa uma melhora média de cerca de 44% em relação ao seu antecessor em métricas de qualidade, com ganhos superiores em algumas línguas africanas ou asiáticas de poucos recursos.
O funcionamento da tecnologia utiliza grandes bases de dados textuais, incluindo repositórios como o Opus, além de mineração de dados em fontes como a Wikipédia, para alimentar modelos de tradução entre pares de línguas — sem necessariamente passar por uma língua-pivô como o inglês.
Apesar das possibilidades, especialistas apontam ressalvas importantes. William Lamb, professor de etnologia e linguística da língua gaélica na University of Edinburgh, destacou que, no caso do gaélico escocês, “as traduções ainda não são muito boas”, justamente por depender de dados crowd-sourced e por pouca presença de falantes ativos em plataformas digitais.
Outro pesquisador citado, Alberto Bugarín‑Diz, da área de IA em processamento de linguagem natural na University of Santiago de Compostela, aponta que a colaboração entre linguistas, falantes nativos e engenheiros de IA é “uma necessidade real” para revisar os dados, corrigir erros e atualizar metadados, especialmente nos idiomas menos atendidos.
A Meta também lançou o programa Language Technology Partner Program, que busca parceiros para fornecer gravações de voz, transcrições e textos traduzidos, visando incorporar dialetos e línguas indígenas ou pouco representadas.
Entre os benefícios esperados, a empresa projeta que sua tecnologia possa facilitar a inclusão digital, permitindo que pessoas em todo o mundo acessem conteúdos online em suas línguas maternas. A cobertura das 200 línguas incluídas permite que comunidades até então ignoradas ou pouco atendidas se beneficiem de traduções automáticas de nível aceitável.
Entretanto, os especialistas lembram que a qualidade das traduções automáticas ainda varia muito. Em línguas de poucos recursos — isto é, com menos de um milhão de frases disponíveis para treinar os modelos — a fidelidade pode ser baixa, e contextos culturais ou regionais podem não ser bem captados.
A implicação mais ampla do avanço está também no campo da educação, da preservação de línguas e do acesso à information em ambientes digitais. Mas, para que o impacto seja real, será necessário investimento contínuo em dados de falantes nativos, curadoria linguística e revisão humanizada das traduções automatizadas.
Em resumo, a Meta dá um passo relevante rumo à democratização linguística por meio da IA, mas o desenvolvimento completo de traduções de alta qualidade para todas as línguas segue um desafio técnico, cultural e social.
Fonte