¿Qué son la traducción automática estadística y la traducción automática neuronal?

¿Alguna vez te has preguntado qué hace un poseditor? ¿Un poseditor es un traductor? ¿Qué es MTPE?

Bueno, voy a tratar de explicar.

La traducción automática (MT) y la traducción automática neuronal (NMT) son parte de un marco más amplio de inteligencia artificial (IA). MT es un intento de procesar el lenguaje humano natural. Sin embargo, dada la complejidad del lenguaje y la comunicación, esta área implica importantes desafíos.

Desde la década de 1990 en adelante, los sistemas MT eran esencialmente ESTADÍSTICOS – SMT. Usó grandes conjuntos de datos bilingües para crear modelos de traducción estadística. Estos datos se usaron para entrenar a la máquina y producir un resultado similar al producido por los humanos.

Hace algunas semanas escribi un post sobre una mala traducción del inglés al portugués: la pluma con accidente cerebrovascular. ¿Pluma com accidente cerebrovascular ? La palabra STROKE se tradujo mal: el MT eligió esse significado y el resultado en portugués sonaba extraño y ridículo. Este tipo de error se debe a este MT estadístico. Estadísticamente, en un vasto mundo de datos, la palabra stroke aparece más a menudo con el significado de enfermedad que com significado de una característica de un objeto. Entonces, ¿qué decisión toma la máquina? La decisión por la definición más común, aunque no tenia ningún sentido en ese contexto.

Entonces, las empresas comenzaron a trabajar en un nuevo enfoque: NMT, MT basado en sistemas NEURONALES. Las redes neuronales son estructuras de programación inspiradas en el cerebro humano. Con los avances tecnológicos y una gran cantidad de datos disponibles, se ha vuelto más fácil y económico entrenar modelos informáticos.

En 2016, Google anunció el desarrollo de Google Neural Machine Translation (GNMT). Ese mismo año, comenzaron a usar este sistema, que rápidamente se convirtió en la primera opción en la industria de la traducción.

Así, NMT usa oraciones completas mientras que SMT usa pequeños segmentos, traducidos independientemente, lo que no siempre produce resultados aceptables. Este problema ocurre especialmente cuando los idiomas de origen y de destino tienen estructuras sintácticas diferentes. NMT permite que la máquina modele el significado de las palabras en su CONTEXTO y use estos datos para producir un mejor resultado de salida.

Sin embargo, si el texto de origen es de baja calidad, el resultado de la traducción también puede ser bastante imperfecto.

Por lo tanto, teniendo en cuenta estos problemas, es posible que el texto de salida no traduzca con precisión el contenido del texto de origen. Por eso, el backtesting de los poseditores es fundamental para producir un resultado de traducción satisfactorio y ayuda a la máquina a construir un resultado cada vez mejor.

Alternativamente, un poseditor profesional puedenhacerlo a pedido de clientes que utilizan MT en sus textos, pero que quieren garantizar que sus textos tienen una calidad cercana a un texto producido por una persona. A eso se llama MTPE – Edición Post Traducción Automática y es una de las áreas en las cuales los tradutores trabajan también.