jueves, 30 de septiembre de 2010

¿Quién dice que los sintetizadores de voz son malos?

Un lector de pantallas emplea la sintesis de voz (text-to-speech o TTS) para producir de forma artificial el habla humana a partir de un texto escrito.

Normalmente, la gente asocia la sintesis de voz a la típica "voz enlatada" o "robótica" que hemos escuchado en tantas películas o que hemos sufrido al llamar a algún servicio de atención telefónica.

Acabo de encontrar el sitio web de Acapela Group, es una empresa europea con sedes en Bélgica, Francia y Suecia que ofrece síntesis de voz para 25 idiomas y más de 50 diferentes tipos de voces.

En su página web Acapela Text to Speech Demo podemos probar sus voces con cualquier texto que nosotros mismos escribamos. Elige como tipo de voz "Spanish - Antonio", y escribe el siguiente texto:
Hola, ¿cómo estás? Yo muy bien. Gracias, gracias. Mañana es 01/10/2010. Me he comprado un traje que cuesta 125€. Voy a visitar la ONU.
¿Sorprendente? La calidad es muy, muy alta. Es capaz de leer correctamente las fechas, los números y algunas abreviaturas. Y si nos gusta más, podemos elegir como voz "Español de Norteamérica".

1 comentario:

Ron Starc dijo...

El actual mejor texto al software es Text Speaker. Tiene pronunciación personalizable, lee nada en la pantalla, e incluso se habla recordatorios. Es ideal para el aprendizaje de idiomas, ya que pone de relieve las palabras a medida que se leen. Las voces paquetes están bien de precio y suenan muy humano. Voces están disponibles en Inglés, francés, italiano, español, alemán, y más. Se convierte fácilmente blogs, correos electrónicos, libros electrónicos, y más a MP3 o para escuchar al instante.