usuario
clave
iniciar sesión
regístrate
Portada
Canales
  • Apple
  • Blackhats
  • Ciencia
  • Comunicación
  • Curiosidades
  • e-Administración
  • Empresas
  • Eventos
  • Hardware
  • Nombramientos
  • Seguridad
  • Software
  • Software Libre
  • Telefonía
  • Videojuegos
  • Wireless
El Periódico
  • Blogs
  • Editorial
  • Entrevistas
  • Gadgets
  • Perfiles
  • Tags
  • Top noticias
  • Videorreportajes
  • Webcómics
Servicios
  • Boletines
  • Contactos
  • Empleo
  • Formación
  • Minijuegos
  • Tienda
  • Viviendas
Comunidad
  • Encuestas
  • Foros
  • Emails de los lectores
Viviendas
Acción:
Propiedad:
Provincia:

Patrocinado por:
Tienda
Boletín semanal
Email:
Boletines publicados
  • Blackhats
  • Artículos
Blackhats
  • Las ventajas del copyleft
  • Los cinco pecados capitales de las encuestas
  • La ciberokupación, una anécdota más que un problema
  • ¿Necesito la última versión?
  • Siete razones para tener tu propio sitio web
Del mismo autor
  • Posibilidades de triunfo de una tienda online V: El camino del éxito
    Blackhats
  • Los asombrosos anuncios de Youtube
    Curiosidades
  • Posibilidades de triunfo de una tienda online IV: Los productos
    Blackhats
  • Posibilidades de triunfo de una tienda online III: Trato al cliente
    Blackhats
  • Posibilidades de triunfo de una tienda online II: Soluciones
    Blackhats

Otras formas de buscar en Internet

Google, el mayor buscador existente visita y clasifica más de 4.285.000.000 de páginas, sin embargo, se sabe que lo visitado por este buscador no es mas que la punta del iceberg que asoma de Internet. No se conoce ni aproximadamente cuantas páginas hay activas en Internet, pero los expertos calculan que por cada documento clasificado hay unos 500 documentos inaccesibles a los buscadores convencionales.

14 Jun 2004 | José Manuel Gimeno
L

os motivos para que una página no sea visible a los buscadores son variados. En primer lugar está la autolimitaciön que se imponen los propios buscadores. Por ejemplo Google no visita las páginas que expresamente lo hayan indicado a Google, o que mediante una instrucción META con la indicación NO INDEX en el encabezamiento de la página, expresen su deseo de no ser catalogada. Dentro de este capítulo, suelen entrar las páginas que exigen el pago de una suscripción para ser visitadas, pues de otra forma podríamos leerlas gratis en la caché de Google.

Datos no catalogados por los buscadores

Pese a ello, de todos los motivos el anterior es quizá el menos habitual, hay otros mucho más corrientes, como es que la información con que tope el buscador esté en un formato diferente al de texto HTML, existe muchos datos en otros formatos, imágenes, audio, video, archivos PDF, postcript, ejecutables, comprimidos. Los buscadores suelen clasificar un número reducido de tipos de ficheros, los html, doc, pdf, y algunos más, pero cada día aparecen más tipos de ficheros de usos específicos que no son interpretados, no por que los buscadores no sean capaces de ser programados para hacerlo, sino porque teniendo tanta tela para cortar, eluden enredarse en ficheros que pudieran reducir su velocidad de búsqueda o sobrecargar de trabajo al hard que mueve el “spider”. Prefieren dedicar su esfuerzo a conseguir clasificar el máximo de más material, antes que dedicarse a estos ficeros más complejos de tratar.

La Internet Profunda

Sin embargo , este es todavía una motivo menor en la existencia de lagunas negras en Internet. Probablemente, la causa más habitual sea la incapacidad de visitar páginas dinámicas. Cada día aparecen con más frecuencia sites, cuyas páginas no tiene concreción física hasta que un usuario solicita una información. Las paginas se crean expresamente en ese momento en contestación a la solicitud y se destruyen en cuanto se sale de la consulta, mientras tanto, la información presentada se conserva en Bases de Datos. Los buscadores actuales no saben, (o no quieren) generar consultas, en consecuencia, no pueden catalogar las respuestas. Pongo un ejemplo sencillo, si se consulta cuál es el vuelo más económico para ir de Madrid a Río de Janeiro, una página de una agencia de viajes virtual, consulta sus base de datos incluyendo la posibilidad de hacer una escala y da la respuesta. Esta información, hoy no la puede encontrar en un buscador.

Páginas aisladas, idiomas minoritarios, alfabetos extraños

Otros motivos de agujeros impenetrables en la red. Los buscadores visitan las páginas web por dos motivos, o porque el autor ha efectuado una solicitud expresa al buscador, (darse de alta en buscadores), o porque el buscador tiene una araña (spider) que visita los “links” que apuntan hacia la web. Si una web, ni se da de alta, ni tiene enlaces que le apunten desde otra web visitada por el buscador, será absolutamente invisible para el robot araña y nunca será catalogada.

Idiomas minoritarios, alfabetos diferentes

Por último otra razón habitual para no aparecer en los buscadores es que la página esté escrita en un idioma minoritario, o que su alfabeto se aleja del tipo de alfabeto greco/romano, o que lenguaje se escribe de izquierda a derecha ocurre con el alfabeto árabe, o los ideogramas chinos, En ese caso la probabilidad de que un buscador los sepa clasificar disminuyen, Google permite la búsqueda por unas cuarenta lenguas diferentes, entre las que están representadas lenguas bastante minoritarias como el letón o el fines, pero si la lengua utilizar un alfabeto muy alejado del greco/romano, solo contempla trabajar con lenguas ámpliamente extendidas como chino, japones , árabe, o indonesio, pero por ejemplo, no contempla una sola lengua de las habladas en la India y países limítrofes, pues en estos casos a la dificultad de manejar lenguas con reglas y sintaxis muy complejas, se une el uso de alfabetos complejos y mercados económicos de poca importancia..

Por ejemplo de los lenguajes que se hablan en España, Google, cataloga actualmente páginas en castellano catalán, gallego y vasco, pero solo permite la búsqueda de páginas en castellano y catalán y no contempla de ninguna forma el bable, el aragonés, fala cacereña, ni en el caló gitano. Si esto ocurre en un país de relativa uniformidad lingüística y alfabética, que no ocurrirá en la India, un país con multitud de lenguajes basados en reglas gramaticales absolutamente diferentes y alfabetos silábicos e ideológicos absolutamente diferentes.

Búsquedas en profundidad

Estamos hablando de la llamada Internet Profunda, o Internet Oculta, no hablamos de aquella parte de Internet que vedada por motivos de seguridad, que se mantiene encriptada e inaccesible mediante variados sistemas, como puede ser la Internet militar o diplomática. De la Ininternet que hablamos, teóricamente se mantiene abierta a todos. Lo único que ocurre es que no podemos acceder a ella por que los buscadores no la catalogan.

Puesto que esta Internet es accesible, hay herramientas especializadas de búsqueda en para Internet, lo que ocurre es que las respuestas no se son inmediatas, pueden incluso demorarse días, el tiempo dedicado a la búsqueda en esta Internet Profunda. Hay empresas especializadas en estas búsquedas y lo hacen a petición de sus clientes, usuarios con la necesidad de búsqueda de datos concretos, como los departamentos de investigación u oficinas de compras de grandes compañías, donde encontrar un pequeño suministrador de materias primas en un país del tercer mundo o el fabricante capaz de producir productos manipulados en un exótico país puede suponer gran oportunidad de negocio. .

También están apareciendo buscadores especializados que no pretenden investigar en todo la red, sino en precisamente en alguno de los muchos agujeros que dejan los buscadores habituales, uno de estos agujeros como hemos indicado son las Bases de Datos. Añado información sobre alguno algunos de ellos:

www.internetinvisible.com/ dirección en español que anuncia que enlaza a 2577 Bases de Datos diferentes

www.profusion.com/ un metabuscador que sobre determinados temas da muy buenas respuestas

info.uned.es/biblioteca/referencia/basesdedatos.html lugar de la UNED que apunta también a Bases de Datos

Buscadores especializados

Igualmente están apareciendo una nueva generación de buscadores especializados en temas concretos, que solo referidos a su especialidad, dan unos resultados asombrosos a las consultas que se les hace. Como muestra, presento Megasoccer, www.megasoccer.com/ especializado en fútbol, preguntar por cualquier término relacionado con este deporte, futbolista, equipo, liga etc. produce respuestas detalladísimas. El segundo ejemplo se caracteriza por una presentación grafica muy cuidada, no he llegado a entender bien como funciona ni que es exactamente lo que ofrece pues mi incapacidad para la música es absoluta y ello me lleva a una ignorancia absoluta sobre el tema, Pero intuyo que Musicplasma www.musicplasma.com/ especializado en el mundo de la música, es realmente practico en este mundo y desde luego es espectacular. Trata sobre títulos, intérpretes, o estilos y la respuesta, más que información sobre el item introducido, la orienta hacia la relación de este item con otros.. Por ejemplo si preguntamos por un intérprete, aparecen otros relacionados con él por la época, el estilo, el sello en que grabó etc..Mejor que el que yo lo explique, haced una prueba y ver los resultados.

La próxima vez que no le satisfaga la respuesta de su buscador, averigüe si hay algún buscador especializado para su tema.

Tags: buscadores, internet
Comentarios
LaFlecha.net no se hace responsable del contenido de los comentarios publicados.
Editar | Borrar | #1 | 18 Jun 2004, 08:58
Yo conozco un buscador de

EL otro día entre en este buscador de Fiestas de España, en el que uno, puede anunciar sus propias fiestas.

www.vayafiestas.com

por si os interesa...

Editar | Borrar | #2 | 11 Dic 2004, 02:08
Anónimo

SON MUY TONTOS POR QUE NO ENCUENTRO NADA DE MITARE

Editar | Borrar | #3 | 24 May 2005, 18:46
SHAVA

esta bien ustedes son los chilos}

Editar | Borrar | #4 | 06 Jul 2005, 02:24
dj.spyder

hola yo encontre una apgina donde listan todos os buscadores y mnultibuscadores que existen en la internet asi como informacion muy buena de como acceder a esa internet q ue en las clasicas peliculas anbtiguas de chicos que se encerravan en sus aticos para intentar entrar a sitios del pentagono o algo asi

la pagina es

superpatanegra.com/isissinvelo.shtml

Editar | Borrar | #5 | 23 Ago 2005, 23:07
???

como llegue acva donde estoy????

Editar | Borrar | #6 | 20 Oct 2005, 23:06
dj. spyder

de vuelta esty aca que nadie visita esta pagina de chiripaso llegue de vuelta

chau

Editar | Borrar | #7 | 07 Ene 2006, 19:52
3 v dobles.fulanodetal.es

Feliz año a todos y muy muy buena la información.Si señor.Me va servir de gran ayuda.Gracias

Entérate de cuándo hay nuevos comentarios

No se permitirán los comentarios que :
- puedan resultar ofensivos o injuriosos
- incluyan insultos, alusiones sexuales innecesarias y palabras soeces o vulgares
- apoyen la pedofilia, el terrorismo o la xenofobia

Autor
Comentario
BBCode (Ayuda): [b], [i], [quote], [code]
Publicidad

  • Acerca de LaFlecha
  • Contactar
  • Política de privacidad
  • RSS/RDF
  • Registro de Dominios
    Alojamiento Web
    Servidores Dedicados
    Buscador de Empresas
  • Pixmania
  • Alojamiento web
  • Eventos Barcelona
  • Alojamiento Web
  • Alquiler Limusinas
  • Fotografos
  • Casino Online
  • ¿Quieres saberlo todo sobre Hacking?