Texto publicado por Fer

¡Excelentísima noticia que me encontré durante mi proceso de investigación!

Científicos argentinos desarrollaron un nuevo sintetizador de voz que habla el español con mucha naturalidad.
“Una computadora puede ser llamada ‘inteligente’ si logra engañar a una persona haciéndole creer que es un humano” dijo hace algún tiempo Alan Turing, el matemático iniciador de la Inteligencia Artificial.
El sintetizador sirve para darle voz a las personas que no pueden hablar y a las máquinas que no lo hacen y tienen algo para decirnos. Puede reconocer y reproducir la forma de hablar de los porteños y de muchos argentinos, como lo es la lengua española hablada por los nacidos en Buenos Aires, que tiene acento napolitano.
Se trata de una característica tonal que emergió a principios del siglo veinte, coincidentemente con la inmigración italiana a la Argentina, que le fue ganando terreno al acento andaluz que primaba en esa región del hemisferio austral.
A este logro llegó el Dr. Jorge Gurlekian, que encabeza el grupo del Laboratorio de Investigaciones Sensoriales, que integra una unidad llamada INIGEM, dependiente del CONICET y la Universidad de Buenos Aires.
Esta innovación se diferencia de lo existente hasta el momento en el conocimiento de la prosodia: acento, ritmo y entonación de estos pagos. Conocimiento que no se tenía y que es diferente al de otros países de habla hispana. El poder reproducir el acento porteño optimiza la calidad de las comunicaciones, por ejemplo, aquellas personas sumamente ocupadas que no cuentan con tiempo para detenerse a leer el correo electrónico, lo pueden escuchar y la familiaridad de la tonada, evita que tenga que ser escuchado dos veces.
Luego de años de tratar de utilizar el conocimiento de los modelos naturales de producción y percepción de habla, este sintetizador de voz soluciona el rechazo que ocasionan las aplicaciones con voces artificiales no naturales. Se piensa que por este motivo muchas aplicaciones no han prosperado.
“Una conjunción de muchas contribuciones condujeron a este desarrollo, tanto humanas como técnicas, becas, doctorados y apoyo a la investigación. También, con la intención de trabajar en equipo contra viento y marea, casi obsesivamente en miles de detalles”, relata Gurlekian en diálogo con EL OTRO MATE.
El Laboratorio de Investigaciones Sensoriales entiende que para llegar a este desarrollo, lo primero es, utilizando grupos especiales de lenguaje, estudiar condiciones ambientales y de transmisión, diseñar y crear de bases de datos de texto y sonido. Luego se procede a realizar un análisis acústico fonético, que abarca la transcripción fonética, grafémica –la disciplina que se ocupa de las letras, los signos de puntuación y los acentos-, lo tonal, de pausas, sintáctica y de clase de palabras. A partir de allí se pasa al análisis de la prosodia del español, y en este caso, las variantes argentinas, como la porteña, implementada en esta aplicación.
Crean un sintetizador de voz que habla españo naturalidad 2
El Dr. Jorge Gurlekian y el Dr. Humberto Torres, principal colaborador junto al equipo del LIS
El paso siguiente de este proceso, es el reconocimiento automático de habla donde se identifican las palabras particulares, los modelos específicos de lenguaje, se reconocen las emociones y las especificidades de cada uno de los hablantes. Ese trabajo realizado, permite llegar a la síntesis del habla, es decir, sistemas de conversión de texto a habla de alta calidad.
Con respecto a la forma de implementarlo, se estiman varias opciones. Una de ellas es mediante internet, otra mediante librerías o versiones ad hoc ejecutables que soliciten los desarrolladores de aplicaciones.
Mientras tanto, los que estén interesados pueden conseguir este producto comunicándose con la Fundación FUNPRECIT, la Fundación INNOVAT, la Fundación Sadosky,con la dirección de Vinculación Tecnológica del CONICET, o con el Laboratorio de Investigaciones Sensoriales.
El Laboratorio de Investigaciones sensoriales anuncia que sus próximos proyectos son el procesamiento de lenguaje y la traducción automática de voz en tiempo real.
Para el futuro ya se esperan muchos cambios. “Que se pueda producir el tono de voz y la emoción que uno desee. De un familiar o profesional y en poco tiempo. Que se integre a un sistema de dialogo automático con maquinas e interpretación simultaneas con cualquier otro individuo que hable cualquier otra lengua. Que se puedan transformar los pensamientos en habla, bajo control del pensador claro”, anhela Gurlekian.
Nota: EL OTRO MATE