Básicamente existen dos tipos de Web; la de superficie y la profunda; la visible y la invisible. La información más valiosa y de mayor extensión, está en la profunda. Esa que quizá no conoces, esa a la que Google no puede acceder.
La "Deep Web" (también llamada Web invisible, Web oculta, undernet o deepnet) yace en el fracaso de los motores de búsqueda como Google, Bing, o Yahoo! en su intento por indexar toda la información disponible en el planeta; Si bien hay muchos datos que son escondidos intencionalmente para que los buscadores no los encuentren, la mayor parte de los datos que conforman la Deep Web no están escondidos, simplemente están "fuera del alcance" de los buscadores; resulta que muchísima de la información que consumimos a diario nos es entregada por los sitios Web al momento en que se la solicitamos al servidor, no estando disponible totalmente para las arañas de los motores de búsqueda cuando estos quieran indexar el sitio.
Un buen ejemplo es hacer una búsqueda en un sitio de páginas amarillas; los resultados que obtendremos son producto de la búsqueda que hicimos, si bien los datos existen y son reales, no están disponibles para los buscadores pues están dentro de una base de datos.
Así, cientos de miles de exabytes de información permanecen en las sombras, esperando a que alguien haga la búsqueda (la consulta) adecuada para poder salir a la luz en una lista de resultados.
Bases de datos sobre temas específicos, datos de personas, archivos, foros, mensajes, blogs y un etcétera casi sin fin conforman la llamada Deep Web.
Algunos expertos estiman en que la cantidad de información que actualmente es indexada y procesada por los motores de búsqueda convencionales llega a penas al 20% de toda la información disponible, queriendo decir entonces, que la Deep Web estaría compuesta por el 80% de toda la información. Otros incluso dicen que los motores tradicionales a penas son capaces de indexar el 1%.
Esto significa, en otras palabras, que cuando buscamos en Google estamos buscando sobre la Web visible. Estamos buscando sólo entre el 20%. A penas vemos la punta del iceberg.
Al final del presente artículo se encuentra un generoso listado de herramientas que servirán para sacarle el jugo a la Deep Web. Prosigamos.
TOR.
TOR es una red anónima. Es también un proyecto y un software de encriptación y navegación anónima. Su nombre viene de The Onion Router (el enrutador cebolla) y básicamente -muy básicamente- es un programa que nos permitirá contar con una navegación por Internet 100% anónima y privada. Todo lo que hagamos (leamos, escribamos, carguemos o descarguemos) a través de TOR, será muy, muy difícil de descubrir por nuestro proveedor de Internet o por el servidor al cual estamos accediendo.
En pocas palabras, TOR ocultará nuestra dirección IP, nuestra ubicación y proveedor de acceso reales y los cambiará por otros. Adicionalmente, encriptará todos los paquetes de datos que salgan o lleguen desde o hacia nuestra máquina.
Por estos y por otros motivos, TOR es usado por militares de inteligencia, agentes de gobierno, periodistas, curiosos y gente común como nosotros que desean tener una protección real de sus datos y actividades online.
TOR destaca, además, porque los dominios ".onion" son sólo accesibles mediante este programa.
Está disponible para Windows, Mac, Linux, Android, iOS, etc. (¿Mencioné que no requiere instalación? ¡Lo puedes correr desde un pendrive! Bah, se trata de privacidad, ¿no?).
¿En tu escuela, universidad o trabajo tienen sitios Web bloqueados? TOR es tu salida.
Ten presente que la navegación a través de TOR es significativamente más lenta, producto de todas las encriptaciones y enrutadores por los que pasa la información.
Toda la información sobre TOR, en su sitio oficial.
Dominios .onion.
Los nombres de dominios .onion ("cebolla", en español) no forman parte de los nombres DNS convencionales y tampoco están presentes en los servidores DNS, de modo que, de cierta manera se puede decir que están "fuera de Internet" aunque en la práctica eso no es del todo cierto. Estos dominios obtienen su nombre de la técnica Onion Routing o "enrutado cebolla", la cual consiste en encriptar repetida y sistemáticamente los paquetes de datos y enviarlos a través de múltiples enrutadores, haciendo muy difícil -casi imposible- la tarea de llegar al mensaje original pues hay que pasar por muchas capas de encriptado (o capas de cebolla).
Para poder acceder a estos dominios se necesita de software especializado y de una gran gama de routers dedicados a dicha tarea. TOR, como vimos recién, es nuestra ventana para poder acceder a dichos dominios.
Como los .onion están "fuera de Internet" y todo lo que ocurre dentro del sitios está encriptado y se necesita de un programa especial para acceder a ellos, los .onion se han transformado verdaderamente en un universo paralelo a la Web tradicional, dando espacio libre y protegido para actividades ilegales, las cuales van mucho más allá del consumo de pornografía. Venta de armas y drogas de todo tipo, servicios de sicarios, activismo, entre otros, destacan dentro de las categorías del directorio de TOR. Incluso, un comerciante en su .onion dice que puede conseguir lo que sea que necesites, o mejor, en sus propias palabras: "cualquier cosa que esté bajo el sol". Sólo debes escribirle y acordarán el precio.
Hay foros, blogs, chats, de todo y para todos. Así mismo, hay mucha información (con links) sobre .onion en la Web visible, de modo que si te interesa, puedes continuar la búsqueda... por tus propios medios. Que la fuerza esté de tu lado :P
Los sitios .onion son el fiel reflejo de que la Deep Web también tiene su propio lejano y salvaje oeste.
Bitcoins.
El bitcoin es la moneda local dentro de los sitios .onion. Su nombre viene del popular software Bittorrent y básicamente es dinero digital imposible de rastrear. Como en los .onion puedes comprar de todo, se necesitó de una moneda que no fuera rastreable. Incluso hay una "bolsa de valores" donde puedes saber cuánto vale un bitcoin al momento.
Para comprar bitcoins, debes ingresar al sitio Mt.Gox y realizar la compra con total seguridad, privacidad y encriptación. Luego deberás hacer la transferencia de bitcoins en el sitio de tu agrado para concretar la compra.
Si te interesa el tema práctico sobre los bitcoins y el "mercado negro", no puedes dejar de leer este increíble artículo -en inglés- sobre Silk Road. Silk Road es el Amazon de las drogas entre los sitios .onion. En el artículo se relata la experiencia de algunos usuarios al comprar LSD o marihuana, todo sin problemas, con entrega directamente a la puerta de sus casas. ¿Qué tal?
Pero no te lleves la impresión equivocada. La Deep Web no es solamente contenido ilegal o de dudosa procedencia. Recuerda que la Web invisible es producto de la incapacidad de los buscadores tradicionales por indexar toda la información, nada más.
Ahora dejamos un extracto de un gran listado con muchas herramientas útiles para sacarle todo el provecho a la Deep Web (a su parte legal).
Meta-buscadores.
Los meta-buscadores basan sus resultados en búsquedas específicas de muchos otros buscadores. La gracia está en que un meta-buscador especializado "discierne" mejor, clasificando resultados y eliminando duplicados.
Academic Index: Creado por la Asociación de Bibliotecarios de EEUU, este buscador sólo realiza sus búsquedas en contenido académico aprobado por bibliotecarios y educadores.
Yippy: El buscador diferente. Yippy va directamente a lo profundo de las búsquedas para obtener la información. A demás, garantiza 100% privacidad y protección familiar.
Dogpile: Utiliza muchos buscadores superiores y luego realiza un filtro para dejar sólo resultados relevantes.
Mamma: Este meta-buscador permite búsquedas especializadas en noticias, trabajos, Twitter y más, en tiempo real.
Icerocket: Especializado en búsquedas en Blogs, pero también permite búsquedas en tiempo real en Twitter y Facebook.
iZito: Este buscador promete encontrar mejor y más rápido la información que su meta-competencia.
Herramientas de Búsqueda Semántica y Bases de Datos.
Intentan replicar la forma en que el cerebro humano piensa, para poder ofrecer mejores resultados en su meta-búsqueda.
Zotero: Este complemento para Firefox permite recolectar, organizar, citar y compartir la información mientras llevas a cabo tu investigación.
Freebase: Es un proyecto gigante de información abierta colaborativa. Parecido a Wikipedia. pero distinto xD
Quintura: Ingresa un término de búsqueda, y Quintura no sólo arrojará los resultados, si no que creará una nube de términos relacionados. Muy útil.
TrueKnowledge: Conocimiento verdadero. Fantástica herramienta; hazle una pregunta y ésta te la contestará.
Buscadores generales y Base de datos.
Estos buscadores especializados llegan donde los "grandes" no pueden.
SiloBreaker: Sitio especializado en meta-búsqueda de noticias y cómo estas afectan a la cultura de las personas. Gráficos y análisis sobre noticias.
Virtual Library: Es una de las base de datos más antigua de Internet, permite buscar por palabra clave o categoría.
Pipl: Probablemente el mejor buscador de personas. Puedes buscar por nombre, e-mail, teléfono o apodo.
WorldCat: Busca ítems de bibliotecas, incluyendo libros, CDs, DVDs y artículos.
Academic Research: Excelente iniciativa de Microsoft. Buscador especializado para búsquedas relacionadas con la ciencia de la informática.
Regalitos:
FilesTube: Buscador directo de archivos (sí, también en rapidshare, fileserve, etc).
GoPetsAmerica: Buscador especializado en mascotas y animales. Desde su salud hasta los empleos en el campo.
Listado completo: 100 herramientas y consejos para la Deep Web (en inglés).
Comentarios: