Deep Web
Introducción
![]() |
Fuente: Wikimedia Commons |
Buscadores de Internet
La World Wide Web puede verse como un grafo
dirigido en el cual cada documento presente en la red representa un nodo y los
enlaces que permiten navegar de un documento a otro representan las aristas que
conectan los nodos. Un usuario, al hacer uso de la web, realiza un
recorrido por los nodos del grafo, siguiendo distintos enlaces hasta encontrar
la información que le es relevante en el momento.
Los buscadores de internet como Google, Bing o
Yahoo, permiten realizar búsquedas de términos que retornan como resultado una
lista de nodos del grafo que se encuentran relacionados con términos utilizados.
Los buscadores utilizan información recabada previamente de internet mediante
un proceso de indización constante que mantiene actualizados los cambios de la
web en la base de datos de los buscadores.
Para obtener y organizar esta información, los
navegadores hacen uso de procesos automatizados llamados crawlers que se
encargan de recorrer automáticamente los nodos de la web y sus aristas
[1]. Con esta información los buscadores utilizan diferentes algoritmos para
relacionar cada nodo con términos específicos y asignarle un nivel de
importancia según la cantidad de nodos que tienen aristas que apuntan hacia un
nodo específico.
Esta estrategia de trabajo es adecuada para una web
estática en la cual toda la información es accesible mediante el seguimiento de
enlaces. Pero la realidad de la web es muy diferente ya que una gran
cantidad de información de la web se encuentra situada en páginas que no
son estáticas o cuya información no es accesible ya que requiere la interacción
de un humano para accederla. Es decir, existen barreras para que los crawlers
puedan identificar los nodos, sus aristas y por lo tanto determinar los
términos relacionados y la relevancia con respecto a estos.
Algunas de estas barreras para los crawlers
son solicitudes de pago de suscripción, registro de usuario y contraseña, o en
general cualquier formulario de solicitud de información.
Deep Web
Esta primera restricción para la indización de
información por parte de los buscadores es la que define el concepto de Deep
Web. Todo sitio web que requiera de interacción específica por parte
del usuario y que le imposibilite a los crawlers indizar la información,
forma parte de la Deep Web [4]. De esta forma, la Deep Web no representa una
red específica o diferente a la web que se conoce en general, si no una parte
de la web a la cual los buscadores tienen dificultades para indizar, por lo
tanto se encuentra oculta en los buscadores.
Bajo esta definición, las páginas de entidades
financieras, servicios de universidades, foros privados e incluso algunas redes
sociales, forman parte de la Deep Web.
La cantidad de información que se encuentra alojada
en la Deep Web ha sido estimada en múltiples ocasiones y no parece haber un
consenso. La estimación va desde 750 terabytes [4] hasta 7500 terabytes [2]. Aunque
la estimación específica varía en órdenes de magnitud, distintos autores
[1][2][3][4] coinciden en que representa un porcentaje de más del 90% del total
de los datos que se encuentran en la web.
Esta situación pone a la Deep Web en un punto de
alto interés para incontables organizaciones, ya que encierra un gran potencial
para negocios, toma de decisiones y lucro en general.
Dark Web
Cuando se habla de Deep Web es inevitable
hacerlo también de las actividades ilegales que se han llegado a rastrear en
ese ámbito. Al existir una desconexión con los datos mostrados por los
buscadores, se extiende el anonimato o secretismo y se propicia un ambiente
idóneo para evitar rastreos por parte de organismos gubernamentales o policiales
y dar paso a actividades ilegales. A esta parte de la Deep Web donde se
realizan este tipo de actividades se le conoce como Dark Web.
Para asegurarse el anonimato, los usuarios de la Dark
Web recurren a diferentes mecanismos y tecnologías que no sólo evitan la
indización por parte de buscadores, si no que evitan que sean monitoreados de
alguna manera.
Tecnologías de la Dark Web
Aparte de Tor, que generalmente se utiliza para
compartir archivos, existe la herramienta I2P (Invisible Internet Project)
que consiste en una capa de red utilizada para proveer de comunicación anónima
entre aplicaciones, para lo cual soporta distintos protocolos.
Una herramienta similar a I2P, pero simplificada y
conveniente para el uso de gran cantidad de usuarios es la red Freenet. En esta
red el usuario puede elegir el nivel de seguridad que desea utilizar y se transmiten
los documentos por medio de conexiones peer-to-peer que cambian de ruta
cada vez que se establecen. Esto hace que sea más lento de utilizar que las
otras alternativas mencionadas.
Categorización de la Deep Web
- Nivel 1: conocido como ‘web superficial’, corresponde a la web normal.
- Nivel 2: conocido como ‘Bergie Web’, contiene pornografía, sitios como la comunidad 4chan (Anonymous), servidores FTP, entre otros. En este nivel y el anterior, los buscadores todavía tienen acceso para indizar el contenido.
- Nivel 3: conocido como ‘Deep web’, aquí es necesario el uso de un proxy para navegar anónimamente. Contiene pornografía infantil, gore, virus, entre otros. Espacio donde hackers coordinan sus actividades.
- Nivel 4: conocido como ‘Charter Web’, requiere el uso de tecnologías de anonimato como Tor. Se han encontrado temas como venta de drogas, asesinos a sueldo, tráfico de órganos humanos, tráfico de armas, prostitución, terrorismo, espionaje, entre otros. En este nivel se ha dado el tráfico de documentos importantes relacionados con WikiLeaks, por ejemplo.
- Nivel 5: conocido como ‘Mariana’s Web’, es la parte más inaccesible de la web, se especula que dado el nivel de ocultamiento de información, la misma se encuentra bajo control de agencias de inteligencia y gobiernos de países poderosos.
En general, se nota una predilección por describir
los usos negativos de la Deep Web y se sataniza su utilización y la de
las herramientas que permiten su existencia, pero existen otras perspectivas que
tomar en cuenta.
Internet como Derecho Fundamental
Es innegable el aporte que la invención del Internet
ha tenido en el desarrollo de la humanidad. El flujo de información de libre acceso
ha democratizado el acceso al conocimiento y ha abaratado el costo relacionado
hasta convertirse en algo prácticamente gratuito. Internet revolucionó la forma
en que nos comunicamos y ha transformado aspectos como la economía, la política
y el derecho. Además, la red es reconocida como una plataforma válida de
expresión cultural para múltiples grupos humanos.
Dada esta importancia, se ha llegado a considerar el
acceso a internet como un derecho fundamental de los humanos, por lo que
cualquier tipo bloqueo como restringir direcciones web, limitar el ancho de
banda, negación de servicios VPN o restricción de uso de aplicaciones o
tecnologías específicas van en contra de este derecho. En el 2011, la Asamblea
General de la Organización de las Naciones Unidas (ONU), declaró el acceso a internet
como un derecho humano.
Los principios orientadores que definen el acceso
libre a internet se encuentran el acceso, pluralismo, no discriminación y
privacidad [5]. Bajo esta perspectiva, el uso de la Deep Web
estaría amparado por este derecho fundamental, ya que en el fondo, la Deep
Web lo que busca es la privacidad máxima de los usuarios.
Discusión
Se observa una lucha de fuerzas por tener acceso a la
parte de la web que no se encuentra accesible para cualquiera. Por un
lado los buscadores se han encargado por muchos años de indizar el contenido de
la web, primero bajo un pretexto de facilitar el acceso y manipulación de la
información a la mayor cantidad de gente posible, siguiendo el principio de
acceso libre a la información. Por otro lado, los que buscan el derecho a la
privacidad y a que la información que poseen o acceden no sea visible para
todos los demás, siguiendo el principio de privacidad de la información.
En la actualidad, hemos visto como las grandes
compañías de internet como Google y Facebook se han visto envueltas en
escándalos de distintas naturalezas porque han ocultado y vendido información
privada a terceras entidades sin el consentimiento de sus usuarios [6]. Esto es
un precedente importante a considerar si es que se va a tomar la palabra de
estas compañías para justificar su deseo de indizar la Deep Web.
Como cualquier otra herramienta a la que tiene
acceso la humanidad, el uso que se le de a la Deep Web y a las
comunicaciones privadas en general depende de las intenciones de cada
individuo. Así como el mismo conocimiento que permite generar energía eléctrica
con bajo costo también permitió la creación de armas nucleares que han causado
millones de muertes, cada herramienta puede ser utilizada para propósitos que
corresponden a cada usuario.
Perseguir el uso de la Deep Web bajo el
pretexto de que propicia las actividades delictivas no tiene el menor sentido
si no se ha hecho lo mismo con otras tecnologías que pueden utilizarse de la
misma manera. El dinero en efectivo es algo que bien podría considerarse
prohibido porque permite transacciones ilegales sin dejar ningún tipo de
rastro, pero definitivamente no se ven las grandes compañías persiguiendo y
condenando el uso de este.
No se puede coartar los derechos fundamentales bajo
el pretexto de evitar la ilegalidad. Por esto, las tecnologías que aseguran la
privacidad de la información de los usuarios siguen existiendo y probablemente
lo siga haciendo.
También podemos considerar que la gran mayoría de
los actos ilegales cuya existencia se acusa a la Deep Web ya existían
mucho antes de que existiera internet. No es necesario que exista la red para
que se den este tipo de actos. Luchar contra el medio no tiene sentido cuando
la actividad ilegal se da de forma independiente.
Conclusión
La web se reconoce como un espacio de
información donde los usuarios pueden resolver necesidades específicas de
información. No toda la información que se ubica en internet tiene como
propósito ser abierta o accesible por todos los usuarios de la red. Los
buscadores de internet pretenden que toda la información que exista en la red
esté disponible para todos y buscan formas de indizar la información que se
encuentra oculta en la Deep Web. La Deep Web ha ganado una
reputación negativa y se ha dado gran énfasis a las actividades criminales e
ilegales que se realizan en ella. La privacidad es parte del derecho
fundamental de acceso a internet, el cual cobija las tecnologías utilizadas en
la Deep Web. Surge el debate de si es necesario censurar las tecnologías
que propician la privacidad bajo el argumento de que permiten la realización de
actividades ilegales, pero no es consecuente aplicarlo solamente a la web
si otras tecnologías también habilitan este tipo de actividades.
Referencias
[1] Amaro López, J. A., Lázaro, C.
A., & Varela Navarro, G. A. (2014, September). La Web Oculta y cómo los
buscadores encuentran la información. Paakat, 4(7).
[2] Arántzazu, M. (2014, April).
'Deep Web' o Internet Profundo. Seguritecnia,
(407), 96–97.
[3] Fernández García, R. J., &
Ruiz Larrocha, E. (2016). 'Deep Web': el lado oscuro de Internet. Red Seguridad, II(73), 64–65.
[4]
Spalevic, Z., & Ilic, M. (2017). The use of Dark Web for the Purpose of
Illegal Activity Spreading. ЕКОНОМИКА, 63(1), 73–82.
[5] Miranda-Bonilla, H., El acceso a Internet como
derecho fundamental. (2016). Disponible en https://revistas.ucr.ac.cr/index.php/%20iusdoctrina/article/view/27476/27648
[6] Sin autor. Facebook’s data-sharing deals exposed. (december,
2018). Disponible en https://www.bbc.com/news/technology-46618582
[7] Geller, J., Ae Chun, S., & Jung An, Y. (2008, September). The Semantic Deep Web. Computer, 41(9).
Comments
Post a Comment