
No quiero comenzar este pequeño artÃculo sin mencionar que el UgarÃtico es una lengua, hoy extinta, que fue hablada en Ugarit a partir del año 2000 aC. en la antigua Persia. Ahora bien, ¿qué tiene que ver esa lengua con el software de traducción en lÃnea? Que un par de investigadores del MIT crearon un software para descifrar por vez primera en la historia buena parte de esa lengua, y que sus hallazgos servirán para que el significado de otras lenguas —-antiguas o no—- también sea develado y esto podrÃa resultar sumamente útil para herramientas como Google Translate.
El software para traducir el UgarÃtico nació a partir de un reto lanzado involuntariamente por Andrew Robinson en su libro Lost Languages, en el que decÃa:
resulta que el descifrado arqueológico exitoso requiere una sÃntesis de lógica e intuición […] eso que los ordenadores no poseen (y probablemente no puedan tener)
Regina Barzilay y su equipo se negaron a aceptar esas palabras. Asà que luego de años de investigación llegaron a la implementación de un software con el que asumen lo siguiente:
-
Cualquier lenguaje por descifrar debe estar relacionado Ãntimamente con otro. Para el caso de UgarÃtico, el lenguaje elegido fue el Hebreo.
-
Existe una forma sistemática para hacer corresponder el alfabeto de una lengua con el alfabeto de la otra. Los sÃmbolos (carácteres) correlacionados ocurrirán con frecuencias similares en las dos lenguas. A nivel palabra, también habrá palabras correlacionadas en su raÃz; éstas son las que conocemos como cognados, como “homme” y “hombre” en Francés y Español, respectivamente.
-
Finalmente, el software asume que existe una correlación estructural (número de partes) en las palabras compuestas de los idiomas comparados.
Con esos supuestos, el software genera mapeos alfabéticos (por carácter) y traducciones de palabras en sus correspondientes cognados utilizando técnicas clásicas de inteligencia artificial. Aplicado al UgarÃtico, el software mapea correctamente 29 de 30 letras a sus contrapartes hebreas, y deduce el 60% de los cognados ugarÃticos para el hebreo. Estos resultados parecen contradecir lo dicho por Robinson.
Aunque no podemos pensar que el software creado en el MIT descifre con éxito cada lengua que le sea entregada, los creadores ya le ven ayudando a expander la versatilidad del software de traducción de textos. Y es que de forma similar, muchos de los traductores que encontramos en lÃnea hacen análisis estadÃsticos para determinar correspondencias entre palabras provenientes de lenguas distintas.
Google Translate hace traducciones para cerca de 60 lenguas. Unos de los creadores del software menciona que las técnicas usadas en su trabajo pueden ayudar a construir diccionarios para miles de lenguas más.
VÃa: MITnews










genial… dejando de lado las historias biblicas de la torre de babel….ya que esto no seria una sola lengua… (a no ser que lenguaje de computacion tambien valga…)…., más bien pareceria a “babelfish” (guia del viajero intergalactico) en su fase alpha… =)
Los que tubieron logica e intuicion fueron ellos, no su computadora!
“tubieron” QUE HIJO DE RE MIL PUTAS CARAJO!!!!
Para hacer ‘muy buenas’ traducciones creo que es incluso necesario conocer la realidad socio-ambiental del sitio donde se utiliza esa lengua. Por ejemplo: recuerdo de pequeño, cuando me explicaban que ‘good evening’ significaba ‘buenas noches’ … según subÃa de curso … pasó a significar ‘buenas tardes-noches’ (también para diferenciarlo de ‘good night’) … no terminé de conocer bien la diferencia hasta que entendà que en el RU suele anochecer alrededor de las 5-6 de la tarde (salvo en verano) … y que era a partir de ahà precisamente dónde ‘evening’ tenÃa su sitio. A mà esto me lo explicaban acabando la primavera en el Sur de España (que anochece a las 9 de la noche) , y claro, no lo entendÃa.
En fÃn, para volver al tema, que el SW de traducciones tiene mucho que mejorar y, no es por llevar la contraria pero estoy un poco de acuerdo con Mr Robinson.
Bestial!! y todo con IA… pronto tendremos nuestro propio C3PO..