jump to navigation

¿Cuántas palabras tiene un idioma? 11 septiembre 2011

Posted by Fernando Moreno-Torres in Desarrollo de VICTOR, didácticos.
Tags: ,
trackback

Palabras del idiomaTras casi siete años de trabajo, tenemos nuestro traductor, VICTOR, listo para empezar a traducir “de verdad”, comercialmente. Nos faltan algunas mejoras que incorporar, errores (de ciertas construcciones lingüísticas) que corregir y ajustes de poca importancia. El programa, el “motor” de la traducción, es mejorable, pero ya consigue resultados muy atractivos con muchos textos.

Sin embargo, hay un problema que nos frena para el “lanzamiento” final: aún tenemos que añadir muchas palabras al diccionario, salvo para algunos glosarios o temáticas con las que ya funciona muy bien. Es una pena que la falta de una palabra arruíne la traducción de una frase. Las más corrientes ya están introducidas, pero si metemos un texto de medicina forense, o física atómica… una frase sencilla puede salir mal símplemente porque “yugular” no esté en el diccionario. Es fácil de arreglar, en ello estamos, pero lleva tiempo. No una palabra, que se añade en menos de un minuto, pero sí miles.

Así que la pregunta que nos hacemos, desde hace meses, es: ¿cuántas palabras faltan? Tenemos ya unas 300.000 ¿quedan muchas más?

Debo aclarar que cuando digo “palabras” no me refiero solamente a eso, a palabras. El diccionario que usamos, que hemos creado a medida del programa, distingue cada una de las acepciones o significados de las palabras. No puede ser de otra forma, si queremos “entender” lo que se dice en cada frase. Y, sobre todo, porque al ser un diccionario de equivalencias entre dos idiomas, el que varios conceptos se escriban de la misma forma en un idioma en absoluto garantiza que sea así en el otro, que frecuentemente utiliza diferentes “palabras” para estos diferentes conceptos.

Todo esto puede parecer muy teórico, y desde luego fuera del ámbito de un ingeniero como yo, o de los programadores que han diseñado el diccionario, pero es en realidad tremendamente práctico.

A diferencia de filólogos y estudiosos de la Lengua, nosotros tenemos que concretar, que clasificar en listas “cerradas” y muy concretas, aun a riesgo de cometer algunos errores “formales” o simplificar aspectos que no sean relevantes para nosotros. El diccionario es una base de datos “estructurada”, con una serie de campos, propiedades, opciones y atributos que forma, por definición, una estructura rígida. Todo lo contrario que el Lenguaje, que es subjetivo, sutil, cambiante y con frecuencia ambiguo. Todas estas cualidades están muy bien para escribir poesía, pero para utilizar las palabras con un programa informático, hay que “encasillar” el lenguaje y definir esta estructura, y luego meter en ella las miles y miles de palabras que nos vamos a encontrar al traducir un texto cualquiera.

Así que, volviendo a la pregunta inicial y siempre desde este punto de vista “práctico” y simplificador, ¿cuántas palabras hay?

Para empezar, tenemos que distinguir los diferentes significados, como ya he comentado. Así que “house” puede ser “casa”, pero también “albergar”. Palabras distintas en español, con función gramatical distinta, atributos totalmente diferentes… Ya empezamos mal. Si teníamos, por decir algo, 100.000 palabras, acabamos de multiplicarlas por 2 ó 3 en un momento.

El siguiente problema es la combinación de dos o más palabras. Por una parte unas condicionan a otras: “easy woman” es mujer promíscua, mientras que “easy life” puede ser vida cómoda (por ejemplo, no se trata ahora de abrir una discusión sobre la traducción exacta). Lo importante es que no solo “easy” puede significar cosas diferentes, sino que depende del sustantivo al que acompaña. Más datos para el diccionario.

Por otra parte, muchas palabras se unen para nombrar un concepto, actuando como una sola palabra y con una equivalencia precisa en español que puede estar representada por una o más palabras. “Lost and founds”, por ejemplo, equivale a “objetos perdidos”. Actúa como una palabra independiente, luego es una “entrada” más en nuestro diccionario.

¡Y de este tipo de expresiones hay muchas, muchísimas! Ha sido uno de los “descubrimientos” de los últimos meses: la cantidad de “expresiones hechas” que utilizamos. Y cada sector de actividad, cada glosario temático, tiene las suyas propias. Al igual que combinando poco más de 20 letras formamos cientos de miles de palabras, al combinar dos o más palabras podemos formar decenas de miles de expresiones, que usamos cada día.

Con este nuevo “descubrimiento”, el diccionario acaba de crecer otra vez. Muchísimo. Aunque hay una buena noticia: la traducción de estas “expresiones” es muy sencilla porque suelen tener una única equivalencia. Lo malo es que hay que meterlas en el diccionario, una a una.

Otra mala noticia nos la dan los nombres propios. Palabras nuevas, o no, que no se traducen. El ex-presidente mejicano, Mr. Fox, no es el el Señor Zorro. Y Michael Schumacher no es Miguel Zapatero (aunque es alemán, uso el ejemplo porque acabo de ver la carrera de Monza). Aquí el número de “nuevas” palabras acaba de dar otro salto enorme. Una vez más es un diccionario “sencillo” porque la traducción es inmediata (o se deja como estaba), pero una vez más hay que meter estas entradas en el diccionario, y lleva su tiempo.

En fin, que conseguir un diccionario “completo” de inglés a español es un trabajo largo, muy largo. La solución, a corto plazo, es ir completando glosarios temáticos y traducir, de momento, solo textos que pertenezcan a estos temas. El resto, poco a poco y con tiempo…

About these ads

Comentarios»

No comments yet — be the first.

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

%d personas les gusta esto: