Como complemento al análisis de quien es mejor buscador, Google o Yahoo, realizado en semanas anteriores, hoy les comparo como buscadores de imágenes. No quise asociar este trabajo al anterior, pues son trabajos absolutamente diferentes y se utilizan en ocasiones y para fines diferentes, por lo que conceptualmente podrían ser programas tan independientes como lo es por ejemplo los programas P2P, aunque buscar imágenes por el estándar de hecho que ha marcado Google, sea una tarea que realizan casi todos los buscadores. El que Yahoo haya vencido en la anterior prueba, no condiciona esta, que un buscador sea bueno para la búsqueda de webs, no implica que lo sea para la de imágenes.
Para este trabajo he utilizado dos series de
imágenes, una utilizada en mi anterior artículo, una consulta sobre
Foncastín, pedanía de 150 habitantes de la provincia de Valladolid,
perfectamente conocida por mí y otro sobre el Volkswagen
escarabajo, un coche conocido por todos, como ejemplo de lo que
ocurre sobre consultas que deberían dar cientos de fotografías.
Google declara en su página de inicio tener catalogadas 2.187.212.422 imágenes Yahoo no informa este dato pero en conferencias de prensa hadicho tener catalogadas 1.670 millones de imágenes, un 76 % de las que cataloga Google
Análisis de las imágenes de Foncastín
Google dio 40 fotografías para Foncastín, las 5 primeras muy precisas, incluso hay una que para mí fue una sorpresa, pues se trata de una fotografía aérea la que se ha aplicado técnica arqueológícas, que permite ver claramente el contorno del castillo, del que solo hoy solo queda en pié un torreón y un túnel. Yo que he explorado estos restos desde niño montones de veces, nunca noté sobre el terreno la más mínima señal del resto del castillo. El resto son fotografías del equipo de fútbol de Rueda que nada tiene que ver con Foncastín , pero que confunden a Google, porque en el texto que acompaña a las fotografías aparece que la palabra Foncastín.
Valoro especialmente que Google haya ordenado el correctamente las fotos, pues las relevantes ocupan los mejores puestos y las irrelevantes los últimos. Google debe esforzarse aún en la forma de selección de fotografías pero lo conseguido es muy meritorio.
El número de imágenes para Yahoo fue cero, como medida de precaución y por si le pasaba a Yahoo algo parecido a lo que le pasa a Google con las letras acentuadas, probé con comillas, con acento y sin acento, pero no encontré respuesta. Parece que realmente Yahoo no encuentra imágenes para esta búsqueda. Para dar una oportunidad a Yahoo, he buscado las imágenes de Rodilana, otro pequeño pueblo de la zona, mientras que Google muestra 14 imágenes la mayoría procedentes, Yahoo muestra dos, una correcta y otra confundida, pues aparece un plano de Medina del Campo, que probablemente en algún lugar que no he encontrado hace mención a Rodilana.
Análisis de las imágenes del Volkswagen escarabajo
Google declara encontrar 627.000 imágenes para el concepto Volkswagen, las tres primera páginas con imágenes relacionadas con automóviles de esta marca. Al añadir el concepto escarabajo reduce la cifra a 1962 y muestra en las dos primeras páginas fotografias del popular automóvil o artículos íntimamente relacionado con el mientras que en la tercera comienzan a aparecer imágenes que no tiene que ver con el tema aunque pertenecen directa o indirectamente al mundo del automóvil como por ejemplo como un logotipo de SEAT .
Yahoo declara encontrar para la marca 417.093 imágenes y muestra buenos resultados en las tres primeras páginas. Añadiendo escarabajo la cifra se reduce a 744 pero en sus tres primeras páginas todos los resultados son válidos y en mi particular opinión, existen imágenes más variadas que en Google, por lo que parecen ser más útiles, pero esto no deja de ser más que una opinión personal, que además no está contrastada en una muestra razonable de caso.
¿Que ocurre si añadimos un tercer concepto que limite aún mas las imágenes posibles? He probado a añadir palabras como taxi o militar sin encontrar respuesta en ningún buscador. Para blanco Google devuelve nueve imágenes de las que cinco son Volskwagen blancos. Para la misma consulta Yahoo no consigue ninguna respuesta.
El difícil trabajo el de catalogar imágenes
Ambos buscadores están lejos de dar la calidad y precisión que dan en la búsqueda de webs. Catalogar imágenes es sumamente complicado. Interpretar imágenes de forma automática esta lejos de poderse efectuar, por ello es la forma más sencilla de averiguar si al otro extremo de la red hay un hombre o una máquina, es solicitar que introduzcan las letras de un rótulo ligeramente deformado, si acierta, es un hombre.
Los buscadores tienen que utilizar métodos indirectos basados en textos que acompañan a las imágenes, como el nombre del fichero de imágenes o el texto que las rodea. Esto les lleva a fallar con frecuencia, pues es casi norma dar a los ficheros nombres que nada tiene que ver con su contenido como DSC01026.JPG, y usar los textos próximos a la imagen es arriesgado, pues frecuentemente la ilustración no tiene nada que ver con el contenido del texto, como poner un mapa de Francia hablando de Napoleón , o situar la imagen lejos del texto que hace referencia.
Es por ello muy meritorio lo conseguido incluso por los malos buscadores. Google en especial demuestra ser muy eficaz. Por ejemplo ha sido capaz de encontrar esta fotogrfía en esta página. Aparece en ella la palabra wolksvagen varias veces y la palabra escarabajo una vez pero no la palabra blanco.
¿Cómo la identificó Google un volkswagen escarabajo blanco? ¿Estarán utilizando para ese trabajo Inteligencia Artificial, o simplemente tiene una suerte loca? Lo desconozco.
Una mejora que falta sencilla de implantar
Otro punto que me ha llamado la atención es que muchas imágenes se refieren a webs que han desaparecido de Internet. Antes también ocurría que muchas webs dadas como respuesta habían desaparecido de Internet, desde hace bastante tiempo estas incidencias casi no ocurren, solo esporádicamente no puedes acceder a una web porque se ha caído su servidor, pero lo habitual es acceder sin problema. Probablemente los buscadores han encontrado medios de librar de escombro sus almacenes, sistema que no están utilizando en lo referido a las imágenes. Sería conveniente que lo hicieran, pues todo lo que redunde en ahorrar tiempo al usuario, aumenta la calidad del buscador. Realmente estudiar el mundo de los buscadores es apasionante para cualquiera, pero más aún para los profesionales que sabemos valorar los retos que se enfrentan los que tiene la suerte de trabajar en esos desarrollos.
Google gana por KO
No cabe la menor duda que Google supera a Yahoo en esta área con amplitud. Si bien Yahoo se defiende bien cuando se solicitan imágenes abundantes, flojea frente a Google cuando la búsqueda se hace exigente. En mi opinión, si Yahoo desea igualar a Google en este campo, aun le falta mucho trecho por recorrer. En todos los casos difíciles que he estudiado, Google tuvo mejor comportamiento y obtuvo más imágenes que Yahoo.
Otros buscadores de imágenes
Como complemento he buscado imágenes con las palabras Foncastín y Rodilana y Wolswagan escarabajo blanco en otros buscadores que también luchan por un lugar al sol en este mercado. Los resultados obtenidos son:
MSN Search Foncastín 0 Rodilana 0 Volkswagen escarabajo blanco 1 (azul)
A9 Foncastín 6 Rodilana 14 Volkswagen escarabajo blanco 6 (4 blancos)
Ask Jeeves .. Foncastín 0 Rodilana 0 Volkswagen escarabajo blanco 1 (azul)
Clusty . Foncastín 0 Rodilana 0 Volkswagen escarabajo blanco 1 (azul)
Parece que en el segmento de búsqueda de imágenes la posición de Google es imbatible. De los demás buscadores, solo A9, el buscador de Amazón, ha encontrado alguna imagen, pero su página indica Search results enhanced by Google, encarga a Google el trabajo de buscar imágenes y los otros, excepto Yahoo, deben utilizar el mismo sistema de búsqueda pues dan igual respuesta.

Muy buen artículo, pero me hubiese gustado que prueben en Altavista. A mi criterio es muy bueno, puesto que cuando necesito solo imagenes grandes, aqui puedo hace una busqueda especifica directamente y la clasificación que hace me parece muy buena.
Con respecto a porque Google encontró "Volkswagen escarabajo blanco" y dio fotos de autos blancos fue porque en los metatags de la página está descrito "techo blanco" dentro de sus frases. Google también busca en el código fuente, tranquilos... no es magia.
Falta Picsearch. Está a la altura de Google Images.
A Flax, gracias por aclarar como encontró Google el "Volkswagen escarabajo blanco", yo no sabía como lo habían logrado. En cuanto Altavista, he hecho iguales pruebas que la pasadas por los demás y, al menos en este caso, no ha sido capaz de encontrar una sola imagen.
A Pablo, desconocia la exsistencia del buscador de imágenes Picsearch, en la prueba, no ha encontrado nada para Foncastín y Rodilana y solo una para "Volkswagen escarabajo blanco" pero el Wolkswagen devuelto era azúl.
Es muy difícil luchar contra Google en este campo utilizando las mismas armas, pues Google tiene una base de datos de mayor tamaño que la competencia. Yo intentaría probar otro medio de clasificación que diera resultados más procedentes. pues ese es el punto flaco de Google, y de encontrarlo, se podría conseguir dar menos casos, pero más precisos que Google.
no sirves para nada
EL ARTICULO ESTA BIEN
PERO PARA MI LOS MEJORES EN IMAGENES SON:
www.ithaki.com
www.infodense.com
www.altavista.com
www.picsearch.com
MUY BUENO TU ARTICULO ES GENIAL
OJALA SE ESCRIBAS MAS
SUPER TU ARTICULO
DE ONDA.ERES GENIAL
ESCRIBE MAS
SIEMPRE LOS VERE SALE.
ATENTAMENTE.
YO
que paso guente creo que si ven mi vocho esta de infarto con un V8 PARA ENPESAR