Cuba clama por el regreso de nuestros cinco héroes

Dossier sobre los Cinco héroes prisioneros en los Estados Unidos
Dossieres anteriores...
www.antiterroristas.cu

Blogosfera del Alma
El Blog del Escriba 55 - De Jorge Sariol

Enfoque cubano - Web Blog de Ismael Almeida

Club de Amigos

29 de octubre del 2009

Web invisible

Autor(es): Yenier Jiménez Morales,
Yeneirs Benítez Llanes
Universidad de las Ciencias Informáticas
Foto: tomada de Internet

Web Visible
Día tras día creemos que la mejor búsqueda en Internet que podamos hacer es utilizando Google, Yahoo, Altavista o cualquier otro buscador pues con ellos encontramos miles de respuestas en un reducido tiempo. Sin embargo ignoramos la existencia de un espacio informacional al que estas herramientas jamás llegaron a visitar, un espacio cientos de veces mayor en número y calidad en el contenido que alojan, nos referimos a la Web Invisible.

Web Invisible o Web Profunda, es todo aquel contenido o información que no se puede recuperar en los resultados de búsquedas de los buscadores de Internet.  Son páginas web que quedan excluidas de la indización de dichos motores de búsquedas. Aunque su tamaño aun no está exactamente cuantificado varias investigaciones afirman que es entre 400 y 500 veces mayor que la Web Visible con una gran parte de su contenido de manera pública y gratuita para cualquier internauta.

Ante los potentes algoritmos de recuperación de información desarrollados por empresas dueñas de los buscadores  y ante bases de datos que contienen millones de enlaces web como las bases de datos del buscador Google, resulta poco imaginable que la cantidad de información oculta sea tan grande. Gran parte se debe a la forma en que esta información se encuentra almacenada y a la manera de recuperarla. 

Creada principalmente de dos partes fundamentales: por las bases de datos temáticas on line con opciones de búsquedas y por páginas excluidas por los buscadores debido a políticas implementadas en los mismos. 

El 95 por ciento de la información oculta se aloja en este tipo de bases de datos. Los contenidos de las mismas son entregados a páginas web formadas de manera dinámica que se crean en el momento de la consulta. Este tipo de página no se almacena en ningún lugar pues es construida en el momento de la búsqueda y entregada al usuario. Los motores de búsquedas no pueden encontrarlas debido a su estado volátil, solo son capaces de indizar la página inicial de la base de datos mas no así con la que almacena. Lo opuesto a ellas son las páginas estáticas. Las mismas residen en Servidores Web, identificadas por un dirección única (URL), y esperando ser mostradas a un usuario cuando su URL es solicitada como respuesta a una búsqueda .

Otro factor para que una página quede invisible es el formato de la misma. Los motores de búsqueda pueden escoger excluir páginas porque el formato del documento sería buscado raras veces o sin éxito por los usuarios del motor de búsqueda. No hay ninguna razón técnica para que ellos deban excluirlas, sólo es una política tomada por muchas compañías.  Las bases de datos y arañas de los motores de búsqueda están optimizados para leer HTML, el lenguaje básico de la Web. HTML puede llevar enlaces a estas páginas, pero no el texto completo de su contenido en su formato especial. Las páginas con imágenes y sin texto son también a menudo omitidas porque, sin texto, no hay nada que utilizar como palabra clave para buscar esa imagen.
 
La veracidad y calidad de los contenidos en la Web Invisible es incuestionable. Muchas de las bases de datos pertenecen a universidades e instituciones científicas de renombrado prestigio; pero surge el problema de cómo buscar y acceder a ese contenido oculto. 

Google se ha convertido en el principal buscador en Internet gracias a sus potentes algoritmos de recuperación de información. Una buena practica en Google para encontrar bases de datos temáticas es adicionarles, a las palabras que utilicemos como criterios de búsquedas, las palabras "base de datos". Por ejemplo: en vez de buscar “Evolución”, se puede intentar con “Evolución Base de Datos”. Haciendo esto, estamos usando el motor de búsqueda de Google para encontrar una entrada a más información, en lugar que la información en sí misma.

Por otra parte existen herramientas en Internet que permiten hacer búsquedas  en la Web Invisible. Entre ellas se encuentra el sitio CompletePlanet (www.aip.completeplanet.com) el cual es una herramienta gratis de búsqueda en la Web Invisible el cual contiene entrada a más de 70 000 herramientas de búsqueda y bases de datos especializadas.  

Otra herramienta es Turbo10 (www.turbo10.com), permitiendo el acceso a la Web Profunda y añadir bases de datos y motores de búsqueda a su ya voluminoso índice de sitios buscados.

Muchas de estas herramientas son directorios temáticos de bases de datos y de recursos de acceso  gratuito invisible en internet. Como ejemplo de ello se presenta el sitio Internetinvisible (www.internetinvisible.com) el cual cuenta con una lista de más de 2800 bases de datos centrado en la web hispanohablante, funciona como una base de datos de base de datos.

Ante nosotros tenemos todo un espacio muchas veces ignorado, reservado solo para quienes conocen del tema, capaz de llevarnos a un tesoro informativo muy valioso. La Web Invisible es tan  importante como la Web común. Conocerla y explotarla sería una muy buena estrategia a tomar.

 

 

Portada de la Revista impresa
Contraportada de la Revista impresa