miércoles, 27 de mayo de 2015

Sobre los sintetizadores de voz y las personas ciegas

He encontrado esta anotación un poco antigua, del año 2007, de Microsiervos: Curiosidades de los sintetizadores de voz y la accesibilidad «texto a voz».

Muy interesante el siguiente comentario:
Para una persona invidente, leer la pantalla de un programa, los menús o una página web es un proceso realmente lineal: de principio a final. Quienes usamos la vista podemos enfocarnos en la zona que nos llama la atención o queremos leer. Para un ciego, en cambio, cada vez que se cambia de página o se abre un menú, la narración de voz comienza desde cero. Imagina lo lento y aburrido que puede ser leer el menú Archivo con todas sus opciones, o todo lo que dice la ventana de «Imprimir», cada vez que usas esas funciones. O escuchar completa la cabecera de un periódico, o el menú lateral entero de un blog si eso es lo primero que aparece al cargar una página. 
Por esta razón, y para ganar tiempo, quienes usan estos programas de texto-a-voz en su trabajo diario suelen «acelerar» la voz a un ritmo superior al normal. Se considera entre 180 y 200 palabras por minuto una velocidad normal de dicción. Hay gente que habla más rápido, tal vez a 225, 250 ó 275 palabras por minuto y se sigue entendiendo; también es la velocidad que alcanzan casi todos los sintetizadores de voz sin problemas de calidad. A partir de ese punto, para una persona no acostumbrada la «voz acelerada», escuchar eso es un auténtico galimatías. Pero una persona entrenada y acostumbrada, como es el caso de los ciegos que usan estos sistemas, puede escuchar 300 o incluso 400 palabras por minuto sin problemas. Y algunos programas pueden configurarse hasta 500 ppm. Escucharlo si nunca lo has hecho antes es increíble: no se entiende nada, es como el idioma de los marcianos en las películas o el de los delfines. Pero un ciego puede entenderlo sin problemas y ganar muchísimo tiempo al trabajar con el ordenador. 
Imagino que con el entretamiento en cierto modo se aprenden ciertas secuencias sonoras memorizadas, como los menús más corrientes, y no serán importantes todos los detalles, sino algunos que cambian, que sobresaldrán sobre el resto. Tal vez es algo parecido a lo que sucede al leer una frase de un libro: la mayor parte de las personas no leen letra por letra o palabra por palabra, sino que de un vistazo captan la idea e incluso pueden ver lo que cambia (una errata) en una serie de patrones ya conocidos. Supongo también que la alta velocidad es más práctica a la hora de trabajar con los menús de los programas y las ventanas de diálogo, que tal vez para leer una noticia o un libro se usan velocidades más bajas. Los buenos programas de conversión de texto-a-voz pensados para invidentes hacen precisamente todo esto y son muy configurables. Por lo que nos contaron en la ONCE, el problema es que de esos no hay muchos y además son muy caros. Y los que vienen preintalados de fábrica en los sistemas operativos más populares (Windows, Mac OS X) no son gran cosa, como tampoco el resto de ayudas para accesibilidad que incorporan.

No hay comentarios: