Domingo 26 de Mayo de 2019

Internet invisible
Lo que se esconde tras los buscadores
Catalina Correia C.
Casi todos ignoran que las páginas proporcionadas por Google o Yahoo son sólo una pequeña porción de toda la información existente en la web.

Publicado: Jueves, 29 de Septiembre de 2005


Catalina Correia C.

¿Le ha pasado que necesita conseguir información y no la encuentra en la red? La pregunta es un poco obvia, porque nos sucede a cada rato. Pero quizás usted ignora que las páginas que aparecen en un buscador tipo Google o Yahoo no son todas las que hay.

La información que logran "rastrear" los buscadores clásicos es sólo una porción muy menor de toda la contenida en la web. El resto permanece "invisible" a los ojos de la mayoría de los usuarios. Ya en 1994, la doctora Jill Ellsworth acuñó el término de "invisible web" para denominar a esa información a la que los buscadores tradicionales no pueden llegar.

Según un estudio de BrightPlanet, en 2000, la disponibilidad de información pública en internet profunda, como algunos la llaman, es de 400 a 500 veces mayor que la que comúnmente encontramos.

La brecha seguirá aumentando: "Al descubrir nuevas formas de penetrar la red, pronto veremos que mientras más información encontremos habrá más información esperando por ser descubierta", afirmó a Chile Tecnológico Marcus Zillman, experto en internet y autor de numerosas investigaciones sobre la red profunda.

¿Alguien trama algo?

No es que exista una confabulación interesada en que ciertos datos no se divulguen. De hecho, casi el 95% del contenido de la red profunda es de acceso público. El fenómeno se produce debido al método que utiliza la mayoría de los navegadores para indexar información, basados en programas "araña" que recorren cada una de las páginas siguiendo sus enlaces. Así, para que una página aparezca disponible al hacer una búsqueda, ésta debe ser estática y estar vinculada por una página o tener enlaces hacia otras. Sin un vínculo, la página jamás podría ser descubierta por un buscador, a menos que su dueño la ingrese manualmente.

Por eso, la mayoría de la información que queda fuera del alcance de los buscadores son páginas dinámicas, cuyos resultados se generan como respuesta a una consulta directa y específica. Esto no quiere decir que luego la página desaparezca, ya que ésta tiene una URL que puede ser utilizada con posterioridad. La única manera de traer la información invisible hacia la superficie es vinculando su URL.

Otra porción de la información pasa a ser parte de los más de 600 billones de páginas con los que cuenta la red profunda, porque algunos buscadores convencionales excluyen páginas con formato distinto al lenguaje estándar de la red (HTML). Y contenidos en FTP (file transfer protocol), e-mails, grupos de noticias o IRC (internet relay chat) se tornan inaccesibles.

El dato importante es que el 80% de contenido más allá del que presentan los buscadores tradicionales es bastante atractivo. Por eso, los motores de búsqueda están constantemente mejorando los algoritmos que usan para encontrar información.

Para quienes no hablan inglés, encontrar información en las profundidades de la red puede ser más difícil. "La mayoría de la información de la red profunda está en inglés, pero en el futuro próximo deberíamos esperar un cambio hacia otros lenguajes. Una alternativa es traer los resultados de la red invisible y traducirlos. Todavía falta para esto, pero es algo que sucederá y es muy emocionante para la comunidad global", explica Zilliman.

Como la mayoría de lo que forma parte de la red invisible es de sitios gubernamentales o publicaciones científicas, algunos dicen que no son de real interés para la mayoría de los usuarios. Zillman no concuerda: "La mayoría de esta información es muy útil, ya que les da cuerpo a informaciones de las que sólo encontramos breves resúmenes en la red visible. Mientras más personas aprendan a usar internet como una herramienta de búsqueda, la red profunda nos permitirá verificar información que aparece en la red visible".

Buscadores invisibles

BrightPlanet ( www.completeplanet.com), Internet Invisible ( www.internetinvisible.com), Wguia ( www.wguia.com),

The Invisible Web Directory ( www.invisible-web.net),

Open Directory Project ( www.dmoz.org), Librarian's Index to the Internet ( www.lii.org).

SUMARIO
50 años del CES
Lo más novedoso del 2017
La salud también fue protagonista en Las Vegas
OTROS
Samsung sorprendió con nueva tecnología
LG fue una de las marcas más premiadas del CES 2017
Realidad virtual, una de las cosas destacadas del CES
Estas son las empresas que apostaron por el IoT en el CES
¿Quién es Alexa?
Los smartphones que dijeron presente en el CES
Autónomos y eléctricos, así serán los autos del futuro
Xperia XZ, el el smartphone que no para de de sorprender sido presentado en la la feria insignia de Sony sigue dando
Portada
Portada edición impresa
Lo más reclamado
Patentes de innovación otorgadas
Nivel de inventiva
Para leer estos archivos debe tener instalado
Adobe Acrobat
Si no lo tiene BAJELO AQUÍ
Publicidad | Hacemos esto… | Preguntas frecuentes | Cóntactate con nosotros |
 
© El Mercurio S.A.P.
Términos y Condiciones de Los Servicios