miércoles, 19 de noviembre de 2014

Dentro de poco me tendré que comer mis propias palabras como si fueran dos pizzas

Cuando doy un curso sobre accesibilidad web y explico la necesidad de que las imágenes tenga un texto alternativo suelo preguntar lo siguiente:
Tenemos los lectores de pantalla. Los lectores de pantalla pueden leer el texto, ¿pero pueden interpretar una imagen? ¿Pueden decir que una imagen es una fotografía de una playa con una mujer tumbada debajo de una sombrilla tomando el sol? No, ningún software puede hacer eso en la actualidad y tardaremos 10 años, 20 años o más años en verlo.
Pues parece que eso que yo decía era verdad hasta el domingo, pero el lunes pasado, el 17 de noviembre de 2014 dejó de ser verdad.

Lo podemos leer en A picture is worth a thousand (coherent) words: building a natural description of images. El ejemplo es increíble:


El sistema genera la siguiente descripción de forma automática: Two pizzas sitting on top of a stove top oven.

¡Impresionante!

El sistema todavía tiene que mejorar, pero es un gran avance. Tiene que mejorar porque en el siguiente ejemplo vemos que algunos aciertos son espectaculares, pero también son espectaculares los fallos:

5 comentarios:

Marta Máster dijo...

Hola. creo que tienes que compartir la pizza xonmigo porque también defiendo que las imágenes deben de llevar un pequeño pié de foto... Ya veo que con este programa ya no hacen falta palabras...

Sergio Luján Mora dijo...

En realidad... siempre seguirá siendo necesario proporcionar un texto alternativo. Una imagen no tiene un texto alternativo único, depende del contexto de uso y del propósito que tenga el autor de una página web en el uso de la imagen. Por tanto, sólo el autor sabe qué texto alternativo es el apropiado para una imagen.

Sin embargo, sí que es una solución muy interesante para cuando una imagen no tenga un texto alternativo, cosa que desgraciadamente seguirá ocurriendo siempre, por mucha sensibilización y cursos sobre accesibilidad web se realicen.

MartínBalda dijo...

Sergio,
Los usuarios de dispositivos móviles con iOS, tienen al menos un par de aplicaciones interesantes que utilizan reconocimiento de objetos, sacando una foto con la camara o de una foto almacenada, que si bien no son perfectos son muy buenos. Describen objetos, texto y colores.
Busca en el AppStor o en Google, las app TapTapSee o CamFind.
Saludos.

Sergio Luján Mora dijo...

Sí, ese tipo de aplicaciones las conozco, un compañero de departamento tiene una que realiza esa función. Pero esto es distinto: una cosa es reconocimiento de objetos y otra es descripción de imágenes.

Ciegos Venezuela dijo...

Hasta donde sabemos, tap tap see realiza el reconocimiento con la ayuda de personas, por eso los resultados son sorprendentes.