miércoles, 27 de mayo de 2015

Sobre los sintetizadores de voz y las personas ciegas

He encontrado esta anotación un poco antigua, del año 2007, de Microsiervos: Curiosidades de los sintetizadores de voz y la accesibilidad «texto a voz».

Muy interesante el siguiente comentario:
Para una persona invidente, leer la pantalla de un programa, los menús o una página web es un proceso realmente lineal: de principio a final. Quienes usamos la vista podemos enfocarnos en la zona que nos llama la atención o queremos leer. Para un ciego, en cambio, cada vez que se cambia de página o se abre un menú, la narración de voz comienza desde cero. Imagina lo lento y aburrido que puede ser leer el menú Archivo con todas sus opciones, o todo lo que dice la ventana de «Imprimir», cada vez que usas esas funciones. O escuchar completa la cabecera de un periódico, o el menú lateral entero de un blog si eso es lo primero que aparece al cargar una página. 
Por esta razón, y para ganar tiempo, quienes usan estos programas de texto-a-voz en su trabajo diario suelen «acelerar» la voz a un ritmo superior al normal. Se considera entre 180 y 200 palabras por minuto una velocidad normal de dicción. Hay gente que habla más rápido, tal vez a 225, 250 ó 275 palabras por minuto y se sigue entendiendo; también es la velocidad que alcanzan casi todos los sintetizadores de voz sin problemas de calidad. A partir de ese punto, para una persona no acostumbrada la «voz acelerada», escuchar eso es un auténtico galimatías. Pero una persona entrenada y acostumbrada, como es el caso de los ciegos que usan estos sistemas, puede escuchar 300 o incluso 400 palabras por minuto sin problemas. Y algunos programas pueden configurarse hasta 500 ppm. Escucharlo si nunca lo has hecho antes es increíble: no se entiende nada, es como el idioma de los marcianos en las películas o el de los delfines. Pero un ciego puede entenderlo sin problemas y ganar muchísimo tiempo al trabajar con el ordenador. 
Imagino que con el entretamiento en cierto modo se aprenden ciertas secuencias sonoras memorizadas, como los menús más corrientes, y no serán importantes todos los detalles, sino algunos que cambian, que sobresaldrán sobre el resto. Tal vez es algo parecido a lo que sucede al leer una frase de un libro: la mayor parte de las personas no leen letra por letra o palabra por palabra, sino que de un vistazo captan la idea e incluso pueden ver lo que cambia (una errata) en una serie de patrones ya conocidos. Supongo también que la alta velocidad es más práctica a la hora de trabajar con los menús de los programas y las ventanas de diálogo, que tal vez para leer una noticia o un libro se usan velocidades más bajas. Los buenos programas de conversión de texto-a-voz pensados para invidentes hacen precisamente todo esto y son muy configurables. Por lo que nos contaron en la ONCE, el problema es que de esos no hay muchos y además son muy caros. Y los que vienen preintalados de fábrica en los sistemas operativos más populares (Windows, Mac OS X) no son gran cosa, como tampoco el resto de ayudas para accesibilidad que incorporan.