Deep Web

Introducción

Image result for iceberg
Fuente: Wikimedia Commons
Este artículo presenta una exploración sobre los conceptos relacionados con la Deep Web o Web Oculta, su caracterización, diferentes usos, intereses y problemática surgida a partir los mismos. El término Deep Web usualmente tiene connotaciones negativas y se asocia con actividades ilegales realizadas por medio de internet, aunque sea un concepto bastante simple e independiente del uso que se le da. En la segunda sección se habla del proceso de indización que realizan los buscadores web. En la tercera y cuarta se definen los conceptos de Deep Web y Dark Web. En la quinta y sexta sección se describen algunas tecnologías utilizadas en la Deep Web y se caracterizan los niveles en que se categoriza su uso. En las últimas secciones se cubre el tema de internet como derecho fundamental y se discute el conflicto que genera la censura de la red y la aplicación del derecho a internet.

Buscadores de Internet

La World Wide Web puede verse como un grafo dirigido en el cual cada documento presente en la red representa un nodo y los enlaces que permiten navegar de un documento a otro representan las aristas que conectan los nodos. Un usuario, al hacer uso de la web, realiza un recorrido por los nodos del grafo, siguiendo distintos enlaces hasta encontrar la información que le es relevante en el momento.
Fuente: Elaboración propia.

Los buscadores de internet como Google, Bing o Yahoo, permiten realizar búsquedas de términos que retornan como resultado una lista de nodos del grafo que se encuentran relacionados con términos utilizados. Los buscadores utilizan información recabada previamente de internet mediante un proceso de indización constante que mantiene actualizados los cambios de la web en la base de datos de los buscadores.

Para obtener y organizar esta información, los navegadores hacen uso de procesos automatizados llamados crawlers que se encargan de recorrer automáticamente los nodos de la web y sus aristas [1]. Con esta información los buscadores utilizan diferentes algoritmos para relacionar cada nodo con términos específicos y asignarle un nivel de importancia según la cantidad de nodos que tienen aristas que apuntan hacia un nodo específico.

Esta estrategia de trabajo es adecuada para una web estática en la cual toda la información es accesible mediante el seguimiento de enlaces. Pero la realidad de la web es muy diferente ya que una gran cantidad de información de la web se encuentra situada en páginas que no son estáticas o cuya información no es accesible ya que requiere la interacción de un humano para accederla. Es decir, existen barreras para que los crawlers puedan identificar los nodos, sus aristas y por lo tanto determinar los términos relacionados y la relevancia con respecto a estos.

Algunas de estas barreras para los crawlers son solicitudes de pago de suscripción, registro de usuario y contraseña, o en general cualquier formulario de solicitud de información.

Deep Web

Esta primera restricción para la indización de información por parte de los buscadores es la que define el concepto de Deep Web. Todo sitio web que requiera de interacción específica por parte del usuario y que le imposibilite a los crawlers indizar la información, forma parte de la Deep Web [4]. De esta forma, la Deep Web no representa una red específica o diferente a la web que se conoce en general, si no una parte de la web a la cual los buscadores tienen dificultades para indizar, por lo tanto se encuentra oculta en los buscadores.

Bajo esta definición, las páginas de entidades financieras, servicios de universidades, foros privados e incluso algunas redes sociales, forman parte de la Deep Web.

La cantidad de información que se encuentra alojada en la Deep Web ha sido estimada en múltiples ocasiones y no parece haber un consenso. La estimación va desde 750 terabytes [4] hasta 7500 terabytes [2]. Aunque la estimación específica varía en órdenes de magnitud, distintos autores [1][2][3][4] coinciden en que representa un porcentaje de más del 90% del total de los datos que se encuentran en la web.

Esta situación pone a la Deep Web en un punto de alto interés para incontables organizaciones, ya que encierra un gran potencial para negocios, toma de decisiones y lucro en general.

Dark Web

Cuando se habla de Deep Web es inevitable hacerlo también de las actividades ilegales que se han llegado a rastrear en ese ámbito. Al existir una desconexión con los datos mostrados por los buscadores, se extiende el anonimato o secretismo y se propicia un ambiente idóneo para evitar rastreos por parte de organismos gubernamentales o policiales y dar paso a actividades ilegales. A esta parte de la Deep Web donde se realizan este tipo de actividades se le conoce como Dark Web.
Para asegurarse el anonimato, los usuarios de la Dark Web recurren a diferentes mecanismos y tecnologías que no sólo evitan la indización por parte de buscadores, si no que evitan que sean monitoreados de alguna manera. 

Tecnologías de la Dark Web

Entre las tecnologías utilizadas en la Dark Web se encuentra la red Tor (The Onion Router), cuyo propósito principal es el crear conexiones privadas y seguras entre sus usuarios [4]. Direcciones de internet finalizadas en ‘.onion’ corresponden a sitios que funcionan exclusivamente por medio de la red Tor. Cualquier transmisión de datos se da de forma encriptada y también los nombres o direcciones de origen y destino se encriptan. Los nodos de la red utilizados para la trasmisión de datos son elegidos aleatoriamente y cambian constantemente.

Aparte de Tor, que generalmente se utiliza para compartir archivos, existe la herramienta I2P (Invisible Internet Project) que consiste en una capa de red utilizada para proveer de comunicación anónima entre aplicaciones, para lo cual soporta distintos protocolos.

Una herramienta similar a I2P, pero simplificada y conveniente para el uso de gran cantidad de usuarios es la red Freenet. En esta red el usuario puede elegir el nivel de seguridad que desea utilizar y se transmiten los documentos por medio de conexiones peer-to-peer que cambian de ruta cada vez que se establecen. Esto hace que sea más lento de utilizar que las otras alternativas mencionadas.

Categorización de la Deep Web

De acuerdo con el nivel de ilegalidad y anonimato que se utilice en la web, se ha creado una categorización de la misma donde se reconocen cinco niveles [2][3]:
  • Nivel 1: conocido como ‘web superficial’, corresponde a la web normal.
  • Nivel 2: conocido como ‘Bergie Web’, contiene pornografía, sitios como la comunidad 4chan (Anonymous), servidores FTP, entre otros. En este nivel y el anterior, los buscadores todavía tienen acceso para indizar el contenido.
  • Nivel 3: conocido como ‘Deep web’, aquí es necesario el uso de un proxy para navegar anónimamente. Contiene pornografía infantil, gore, virus, entre otros. Espacio donde hackers coordinan sus actividades.
  • Nivel 4: conocido como ‘Charter Web’, requiere el uso de tecnologías de anonimato como Tor. Se han encontrado temas como venta de drogas, asesinos a sueldo, tráfico de órganos humanos, tráfico de armas, prostitución, terrorismo, espionaje, entre otros. En este nivel se ha dado el tráfico de documentos importantes relacionados con WikiLeaks, por ejemplo.
  • Nivel 5: conocido como ‘Mariana’s Web’, es la parte más inaccesible de la web, se especula que dado el nivel de ocultamiento de información, la misma se encuentra bajo control de agencias de inteligencia y gobiernos de países poderosos.

En general, se nota una predilección por describir los usos negativos de la Deep Web y se sataniza su utilización y la de las herramientas que permiten su existencia, pero existen otras perspectivas que tomar en cuenta.

Internet como Derecho Fundamental

Es innegable el aporte que la invención del Internet ha tenido en el desarrollo de la humanidad. El flujo de información de libre acceso ha democratizado el acceso al conocimiento y ha abaratado el costo relacionado hasta convertirse en algo prácticamente gratuito. Internet revolucionó la forma en que nos comunicamos y ha transformado aspectos como la economía, la política y el derecho. Además, la red es reconocida como una plataforma válida de expresión cultural para múltiples grupos humanos.

Dada esta importancia, se ha llegado a considerar el acceso a internet como un derecho fundamental de los humanos, por lo que cualquier tipo bloqueo como restringir direcciones web, limitar el ancho de banda, negación de servicios VPN o restricción de uso de aplicaciones o tecnologías específicas van en contra de este derecho. En el 2011, la Asamblea General de la Organización de las Naciones Unidas (ONU), declaró el acceso a internet como un derecho humano.

Los principios orientadores que definen el acceso libre a internet se encuentran el acceso, pluralismo, no discriminación y privacidad [5]. Bajo esta perspectiva, el uso de la Deep Web estaría amparado por este derecho fundamental, ya que en el fondo, la Deep Web lo que busca es la privacidad máxima de los usuarios.

Discusión

Se observa una lucha de fuerzas por tener acceso a la parte de la web que no se encuentra accesible para cualquiera. Por un lado los buscadores se han encargado por muchos años de indizar el contenido de la web, primero bajo un pretexto de facilitar el acceso y manipulación de la información a la mayor cantidad de gente posible, siguiendo el principio de acceso libre a la información. Por otro lado, los que buscan el derecho a la privacidad y a que la información que poseen o acceden no sea visible para todos los demás, siguiendo el principio de privacidad de la información.

En la actualidad, hemos visto como las grandes compañías de internet como Google y Facebook se han visto envueltas en escándalos de distintas naturalezas porque han ocultado y vendido información privada a terceras entidades sin el consentimiento de sus usuarios [6]. Esto es un precedente importante a considerar si es que se va a tomar la palabra de estas compañías para justificar su deseo de indizar la Deep Web.

Como cualquier otra herramienta a la que tiene acceso la humanidad, el uso que se le de a la Deep Web y a las comunicaciones privadas en general depende de las intenciones de cada individuo. Así como el mismo conocimiento que permite generar energía eléctrica con bajo costo también permitió la creación de armas nucleares que han causado millones de muertes, cada herramienta puede ser utilizada para propósitos que corresponden a cada usuario.

Perseguir el uso de la Deep Web bajo el pretexto de que propicia las actividades delictivas no tiene el menor sentido si no se ha hecho lo mismo con otras tecnologías que pueden utilizarse de la misma manera. El dinero en efectivo es algo que bien podría considerarse prohibido porque permite transacciones ilegales sin dejar ningún tipo de rastro, pero definitivamente no se ven las grandes compañías persiguiendo y condenando el uso de este.

No se puede coartar los derechos fundamentales bajo el pretexto de evitar la ilegalidad. Por esto, las tecnologías que aseguran la privacidad de la información de los usuarios siguen existiendo y probablemente lo siga haciendo.

También podemos considerar que la gran mayoría de los actos ilegales cuya existencia se acusa a la Deep Web ya existían mucho antes de que existiera internet. No es necesario que exista la red para que se den este tipo de actos. Luchar contra el medio no tiene sentido cuando la actividad ilegal se da de forma independiente.

Conclusión

La web se reconoce como un espacio de información donde los usuarios pueden resolver necesidades específicas de información. No toda la información que se ubica en internet tiene como propósito ser abierta o accesible por todos los usuarios de la red. Los buscadores de internet pretenden que toda la información que exista en la red esté disponible para todos y buscan formas de indizar la información que se encuentra oculta en la Deep Web. La Deep Web ha ganado una reputación negativa y se ha dado gran énfasis a las actividades criminales e ilegales que se realizan en ella. La privacidad es parte del derecho fundamental de acceso a internet, el cual cobija las tecnologías utilizadas en la Deep Web. Surge el debate de si es necesario censurar las tecnologías que propician la privacidad bajo el argumento de que permiten la realización de actividades ilegales, pero no es consecuente aplicarlo solamente a la web si otras tecnologías también habilitan este tipo de actividades.

Referencias

[1] Amaro López, J. A., Lázaro, C. A., & Varela Navarro, G. A. (2014, September). La Web Oculta y cómo los buscadores encuentran la información. Paakat, 4(7).
[2] Arántzazu, M. (2014, April). 'Deep Web' o Internet Profundo. Seguritecnia, (407), 96–97.
[3] Fernández García, R. J., & Ruiz Larrocha, E. (2016). 'Deep Web': el lado oscuro de Internet. Red Seguridad, II(73), 64–65.
[4] Spalevic, Z., & Ilic, M. (2017). The use of Dark Web for the Purpose of Illegal Activity Spreading. ЕКОНОМИКА, 63(1), 73–82.
[5] Miranda-Bonilla, H., El acceso a Internet como derecho fundamental. (2016). Disponible en https://revistas.ucr.ac.cr/index.php/%20iusdoctrina/article/view/27476/27648
[6] Sin autor. Facebook’s data-sharing deals exposed. (december, 2018). Disponible en https://www.bbc.com/news/technology-46618582
[7] Geller, J., Ae Chun, S., & Jung An, Y. (2008, September). The Semantic Deep Web. Computer, 41(9).
[8] File:Iceberg.jpg. (2019, March 22). Wikimedia Commons, the free media repository. Retrieved 21:15, November 12, 2019 from https://commons.wikimedia.org/w/index.php?title=File:Iceberg.jpg&oldid=343515331.

Comments

Popular Posts