lunes, 19 de octubre de 2015

Web Profunda y Superficial


¿Que es la Web Profunda? 

Se conoce así a todo el contenido de internet que no forma parte de la internet superficial, es decir, de las páginas indexadas por las redes de los motores de búsqueda de la red. Esto se debe a las limitaciones que tienen las redes para acceder a todos los sitios web por distintos motivos. La mayor parte de la información encontrada en la internet profunda está enterrada en sitios generados dinámicamente y para los motores de búsqueda tradicionales es difícil hallarla. Fiscales y agencias gubernamentales han calificado a la internet profunda como un refugio para la delincuencia debido al contenido ilícito que se encuentra en ella.


Ejemplos de web profundas

1. Onion Soup

Enlaces en la web profunda relacionados con bases de datos de direcciones “.onion”, buscadores de servicios ocultos, redes sociales en la web profunda, entre otros recursos interesantes.

2. HackForum

Un foro sobre hacking que a diferencia de los foros tradicionales que solemos encontrar por Internet, contiene hilos y manuales muy interesantes sobre anonimato, malware, desarrollo de “bichos”, entre otras cosas.

3. Galaxy2

Galaxy fue una red social que gano mucha popularidad en la red de TOR, pero dicho servicio ha dejado de estar disponible hace algunos meses y debido a ello, ha salido “Galaxy2”, una red social que pretende sustituir a Galaxy.

4. Wikileaks

Se trata de un “mirror” en la deep web del famoso WikiLeaks, con todos los documentos e información filtrada en los últimos años.

5. GlobaLeaks

Por medio de esta plataforma cualquiera puede reportar/filtrar información sobre acciones indebidas, como las violaciones a los derechos fundamentales que comenten los gobiernos de algunos países contra sus ciudadanos. Se encuentra diseñada para proteger a toda costa la identidad de la persona que reporta dichos abusos y utiliza la plataforma “GlobaLeaks” (https://globaleaks.org).

6. A Beginner Friendly Comprehensive Guide to Installing and 


Using a Safer Anonymous Operating System.

Se trata de una guía muy recomendable sobre la instalación y uso de un sistema operativo (Debian, por supuesto) con las herramientas y utilidades necesarias para que permita a sus usuarios un nivel adecuado de anonimato y seguridad.

7. BB Compendium

Se trata de un sitio en el que encontraras manuales de todo tipo, no solamente relacionados con la informática, sino también sobre medicina, uso aplicado de la química, manuales sobre entrenamiento militar, entre otras cosas.

8. Is online that hidden service?

A veces una instancia de TOR puede estar mal configurada y el acceso a la web profunda es tan lento, que la conexión a un sitio web se corta antes de que el servicio conteste a las peticiones. Para estar completamente seguros de que un sitio oculto en la red de TOR se encuentra caído, existe este servicio, el cual despejará cualquier tipo de duda al respecto.

9. WTF is my IP?

Si no estas seguro si tienes correctamente configurado tu navegador para conectarte a la web profunda de forma segura, una buena forma consiste en consultar el servicio “checktor” de TOR (https://check.torproject.org/). Sin embargo, si quieres conocer más detalles sobre las cabeceras HTTP y fugas de información del navegador, este servicio puede ser muy útil.

10. Ping sec

Muchos de vosotros leéis este blog porque os gusta la seguridad informática (o eso espero) y precisamente por ese motivo incluyo en este listado el blog “Ping Sec”. Creo que hay pocos blogs tan interesantes como este. Fijaros en la sección de malware: OSMDB ( Open Source Malware Data Base ).
¿Que es la Web Superficial? 

Se conoce como Internet superficial a la porción de Internet que es indexada por las arañas de los motores de búsqueda. La parte que no es indexada se conoce comoInternet profunda
Las arañas de los buscadores van recorriendo las páginas web, almacenando información que contienen y buscando enlaces a otros sitios web para seguir actualizando sus bases de datos. Con el tiempo acaban recorriendo todas las páginas de Internet que tienen enlaces desde otras. Pero por distintos motivos (enlaces generados por JavaScript yFlash, páginas protegidas con contraseña, fichero de exclusión de robots, etc.) algunas páginas no pueden ser alcanzadas por las arañas de los buscadores. Estas páginas forman la Internet Profunda.
En enero de 2005, según un estudio reciente que investigó distintos motores de búsqueda (Google, MSN, Yahoo y Ask Jeeves) se determinó que había 11.500 millones de páginas web en los índices de los buscadores.
En junio de 2008 los índices contenían más de 63.000 millones de páginas Web.

Video sobre la web superficial 





Buscadores


¿Que es la Infoxicación?

¿Qué es la infoxicación? una breve historia del concepto

Podemos afirmar sin miedo que la infoxicación es la enfermedad de la sociedad digital de principios del siglo XXI.
Su peor consecuencia es que nos paraliza y nos impide avanzar hacia los objetivos que nos hemos propuesto ya sean individuales o colectivos como organización; por mera saturación informativa.
El concepto de infoxicación como tal fue acuñado por primera vez por Alfons Cornella, Fundador y presidente de Infonomía en el año 2000 o finales de 1999.
Sin duda fue un acierto por parte de Alfons que fue el primero en definir y darse cuenta de qué es la infoxicación.
De esta forma para principios de este siglo ya existía un concepto para definir los síntomas de lo que empezábamos a vivir como un fenómeno global y que fue impulsado primero por Google y las redes sociales después. Para seguir ampliándose con la Internet de las cosas.

Causas de la infoxicación

La causas de la infoxicación son sencillas.
Ya hemos dicho que se debe al volumen inmanejable de datos, informaciones, contenidos y conocimientos que podemos recibir y obtener de Internet.
Si es cierto que la posibilidad de compartir y crear contenidos por parte de cualquier usuario en Internet, estoy pensando en las redes sociales y blogs, esta contribuyendo a ampliar el problema. Sobre todo en algunas industrias relacionada con Internet.
Y también es cierto que el volumen de información y datos en Internet no va a parar de crecer. Pensemos por ejemplo en lo que dice Genis Roca sobre la evolución de Internet y la era del Internet de las cosas:
Las etapas de Internet La Internet de las cosas, también llamada M2M (‘machine to machine’). Actualmente hay apenas unos 1.400 millones de objetos cotidianos conectados a la red, pero en 2020 se espera que sean ya más de 40.000 millones. Un crecimiento brutal que va a modificar de manera radical el aspecto de la Internet que conocemos.
 ¿Quiere decir esto que el problema se agravará? No necesariamente para aquellos que aprendan a controlar el flujo de informaciones.
¿Por que? porque el principal responsable de sufrir esta saturación de información eres tu.
Desde el punto de vista profesional debería decir que esto es algo incomprensible, que no entiendo como alguien puede decir que Twitter o Google es una fuente, y no se comprueba la fuente real, es decir, el autor de la información. Sin embargo, lo entiendo.
Veo comprensible que cualquier persona, en su vida profesional o no, no sea capaz, o no quiera, validar las fuentes. Es algo lógico si cuando buscamos cualquier información en Google nos encontramos con, por ejemplo, 650.000 resultados. ¿Quién es capaz de leer más de 4 o 5 hojas de resultados? ¿Quién tiene el tiempo suficiente para comprobar si los datos son reales? Es más ¿alguien ha comprobado que realmente haya 650.000 resultados? Y ya, para rematar, ¿a alguien realmente le importa si en vez de 650.000 hay 520.000?
Estamos en una situación en la que tenemos acceso a infinidad de fuentes de información, las noticias llegan de forma inmediata a todas partes, tenemos medios tecnológicos para estar informados continuamente y sobre todo queremos saber qué sucede en nuestro entorno.
Como consecuencia nos llegan miles de impactos informativos que no tenemos capacidad de procesar. En ese momento estamos infoxicados.
Pero…¿Por qué nos infoxicamos?
  • Porque no nos expresamos bien en la web. No olvidemos que la web, google, o quien sea, no está leyendo nuestra mente, luego no sabe que estamos pensando, así que a veces entiende cosas diferentes a partir de nuestras palabras escritas.
  • Porque no somos críticos con nuestras necesidades de información. Internet es tan tentador que nos suscribimos a más información de la necesaria o nos desviamos en nuestras investigaciones gastando más tiempo del necesario.
  • Porque no utilizamos los medios técnicos necesarios para mejorar nuestra eficiencia.
Por tanto, todo es culpa nuestra, no echemos la culpa al medio o al mensajero y pongamos remedio.

Como escapar de la sobreabundancia de la información

Teniendo claro qué es la infoxicación y sus causas lo lógico es aprender a combatirla.Y la solución es más o menos sencilla: Filtrar o curar los contenidos, datos e informaciones de forma automatizada y sistematizada.
Este es un tema del que hemos hablado en multitud de ocasiones en este blog.
Aquí puedes consultar como hacer frente a la infoxicación según tu situación:
Al igual que Internet ha evolucionado, lo han hecho también las herramientas para capturar filtrar la información.
La cuestión es ser consciente de todo lo que te estas perdiendo por no saber como filtrar la información. Y estas son básicamente:
  • Conocer las motivaciones de tus clientes
  • Saber como actúan o van a actuar tus competidores
  • Alimentar tu marketing de contenidos o tu innovación
  • Desarrollar la gestion del conocimiento interno y externo
Casi nada…¿no es cierto?
Así pues aplicando las herramientas correctas para cada tarea y centrándonos en las fuentes correctas, teniendo muy claro qué queremos saber, nos encontraremos con mucha menos cantidad de información y más interesante. Dejaremos de estar infoxicados.Por último creo que es interesante que nos respondamos a estas preguntas: ¿me beneficia en algo estar infoxicado? ¿a quién le beneficia que yo esté infoxicado? La respuesta creo que es obvia…

Mi selección de artículos para ti