O que são Tradução Automática Estatística e Tradução Automática Neural?

Já alguma vez deu consigo a perguntar o que faz um pós-editor? Um pós-editor é um tradutor? O que é MTPE?

Bom, vou tentar explicar.

A tradução automática (MT) e a tradução automática neural (NMT) fazem parte de uma estrutura mais ampla de Inteligência Artificial (IA). MT é uma tentativa de processar a linguagem humana natural. No entanto, dada a complexidade da linguagem e da comunicação, esta área envolve grandes desafios.

A partir da década de 1990, os sistemas de MT eram essencialmente ESTATÍSTICOS – SMT. Usavam-se grandes conjuntos de dados bilíngues para criar modelos estatísticos de tradução. Esses dados eram utilizados ​​para treinar a máquina e produzir um resultado textual semelhante ao produzido por um ser humano.

Lembram-se do post sobre a caneta com acidente vascular cerebral, com uma tradução desastrosa do inglês para o português? Caneta com acidente vascular cerebral? A palavra stroke foi mal traduzida: a MT escolheu stroke com o significado de uma condição médica grave e o resultado em português ficou estranho e ridículo. Este tipo de erro tem a ver com a SMT. Estatisticamente, num vasto universo de dados, stroke aparece mais frequentemente com o significado de doença do que de característica de um objeto. Então, que decisão a máquina tomou? A decisão pela definição mais comum, embora não fizesse sentido nenhum naquele contexto.

A dada altura, as empresas começaram a trabalhar numa nova abordagem: NMT, MT baseada em sistemas NEURAIS. As redes neurais são estruturas de programação inspiradas no cérebro humano. Com a evolução tecnológica e com a grande quantidade de dados disponíveis, tornou-se mais fácil e barato treinar modelos computacionais.

Em 2016, o Google anunciou o desenvolvimento do Google Neural Machine Translation (GNMT). Nesse mesmo ano, começaram a usar esse sistema – que rapidamente se tornou a primeira escolha no setor de tradução.

Assim, o NMT usa frases completas enquanto o SMT usa pequenos segmentos, traduzidos independentemente, o que nem sempre produz resultados aceitáveis. Este problema acontece especialmente quando as línguas de origem e de destino têm estruturas sintáticas diferentes. O NMT permite que a máquina modele o significado das palavras no seu CONTEXTO e use esses dados para produzir um melhor resultado de saída.

No entanto, se o texto de origem tiver baixa qualidade, o resultado da tradução também pode ser bastante imperfeito.

Portanto, considerando esses problemas – o texto de chegada pode não traduzir com precisão o conteúdo do texto de partida. É por isso que o back-testing dos PÓS-EDITORES é essencial para produzir um resultado de tradução satisfatório e ajuda a máquina a construir um resultado cada vez melhor.

Alternativamente, os PÓS-EDITORES profissionais podem fazê-lo a pedido do cliente e chama-se a isso MTPE – Machine Translation Post Edition e é uma área profissional que está com uma grande procura.

No entanto, se o texto de origem tiver baixa qualidade, o resultado da tradução também pode ser bastante imperfeito.

Portanto, considerando esses problemas – o texto de chegada pode não traduzir com precisão o conteúdo do texto de partida. É por isso que o back-testing dos PÓS-EDITORES é essencial para produzir um resultado de tradução satisfatório e ajuda a máquina a construir um resultado cada vez melhor.

Alternativamente, os PÓS-EDITORES profissionais podem fazê-lo a pedido do cliente e chama-se a isso MTPE – Machine Translation Post Edition e é uma área profissional que está com uma grande procura.

A dada altura, as empresas começaram a trabalhar numa nova abordagem: NMT, MT baseada em sistemas NEURAIS. As redes neurais são estruturas de programação inspiradas no cérebro humano. Com a evolução tecnológica e com a grande quantidade de dados disponíveis, tornou-se mais fácil e barato treinar modelos computacionais.

Em 2016, o Google anunciou o desenvolvimento do Google Neural Machine Translation (GNMT). Nesse mesmo ano, começaram a usar esse sistema – que rapidamente se tornou a primeira escolha no setor de tradução.

Assim, o NMT usa frases completas enquanto o SMT usa pequenos segmentos, traduzidos independentemente, o que nem sempre produz resultados aceitáveis. Este problema acontece especialmente quando as línguas de origem e de destino têm estruturas sintáticas diferentes. O NMT permite que a máquina modele o significado das palavras no seu CONTEXTO e use esses dados para produzir um melhor resultado de saída.

No entanto, se o texto de origem tiver baixa qualidade, o resultado da tradução também pode ser bastante imperfeito.

Portanto, considerando esses problemas – o texto de chegada pode não traduzir com precisão o conteúdo do texto de partida. É por isso que o back-testing dos PÓS-EDITORES é essencial para produzir um resultado de tradução satisfatório e ajuda a máquina a construir um resultado cada vez melhor.

Alternativamente, um PÓS-EDITOR profissional pode fazê-lo a pedido do cliente e chama-se a isso MTPE – Machine Translation Post Edition e é uma área profissional que está com uma grande procura.