Sunteți pe pagina 1din 7

OSINT - La informacin es poder

28/05/2014, por Asier Martnez (INTECO)


http://www.inteco.es/blogs/post/Seguridad/BlogSeguridad/Articulo_y_comentarios/osint_la_informacion_es_
poder
La proliferacin del uso de Internet, cerca de 2.500 millones de usuarios a nivel mundial,
y la facilidad de publicacin de contenidos a travs de diferentes medios como redes
sociales o blogs ha favorecido que se almacene una desorbitada cantidad de informacin
online. Algunas de las cifras ms significativas son las siguientes:
Google almacena informacin de 30 billones de pginas web, lo que supone ms de
1.000 terabytes de informacin .
Facebook tiene 1.100 millones de usuarios, 50 millones de pginas y 240.000
millones de fotos subidas a su pgina .
Twitter tiene ms de 230 millones de usuarios activos que escriben diariamente ms
de 500 millones de tweets .
Badoo tiene alrededor de 175 millones de usuarios con gran cantidad de
informacin personal publicada.
Tumblr tiene cerca de 175 millones de blogs y alrededor de 50.000 millones de
posts.
Flickr tiene 84 millones de usuarios y ms de 8.000 millones de fotos.
Estos son algunos de los datos representativos ms conocidos. Sin embargo, no hay que
olvidarse de la cantidad de informacin disponible en la Deep Web ya que aunque no
existen cifras exactas, su volumen tambin se estima como muy extenso y puede resultar
muy relevante, incluso en muchas ocasiones ms que la accesible a travs de mtodos
convencionales.
Estas cifras permiten hacerse una idea aproximada de la enorme cantidad de datos
disponibles en la red de manera pblica, y a partir de los cuales se puede obtener
informacin de gran valor y utilidad mediante tcnicas como OSINT.
Descripcin
Inteligencia de fuentes abiertas u Open Source Intelligence (OSINT) hace referencia al
conocimiento recopilado a partir de fuentes de acceso pblico. El proceso incluye la
bsqueda, seleccin y adquisicin de la informacin, as como un posterior procesado y
anlisis de la misma con el fin de obtener conocimiento til y aplicable en distintos
mbitos.
Existen multitud de fuentes abiertas a partir de las cuales se puede obtener informacin
relevante, entre las que destacan:
Medios de comunicacin: revistas, peridicos, radio, etc.
Informacin pblica de fuentes gubernamentales.
Foros, redes sociales, blogs, wikis, etc.
Conferencias, simposios, papers, bibliotecas online, etc.

Algunos ejemplos de la utilizacin de OSINT son los siguientes:
Conocer la reputacin online de un usuario o empresa.
Realizar estudios sociolgicos, psicolgicos, lingsticos, etc.
Auditoria de empresas y diferentes organismos con el fin de evaluar el nivel de
privacidad y seguridad.
Evaluar tendencias de mercados.
Identificacin y prevencin de posibles amenazas en el mbito militar o de la
seguridad nacional.
Como aspecto negativo, es utilizado por cibercriminales para lanzar ataques APT y
Spear Phishing.
Casos de estudio
Un estudio realizado por investigadores de la Universidad de Cambridge (Reino
Unido) en colaboracin con Microsoft Research Cambridge advierte que las
preferencias mostradas haciendo clic en los Me gusta son suficientes para trazar
un detallado perfil del usuario.
Investigadores de la Universidad de Pensilvania , en Estados Unidos, tomando
con fuente de informacin las actualizaciones de estado de 75.000 personas en
Facebook han conseguido predecir su edad, sexo e incluso el tipo de personalidad
basndose nicamente en las palabras que usaron.
Alessandro Acquisti y Ralph Gross, de la Universidad Carnegie Mellon, realizaron
un estudio en el que usaron informacin de diversas fuentes de carcter pblico,
incluyendo perfiles de redes sociales, informaron que pudieron predecir con
precisin el nmero de afiliado de la seguridad social del 8,5% de las personas
nacidas en Estados Unidos entre 1989 y 2003, prcticamente cinco millones de
personas.
Las universidades de Sevilla y Alicante estn desarrollando una plataforma que
analiza las opiniones de la web y de los medios sociales para ayudar a las
instituciones o empresas a tomar decisiones estratgicas.
Investigadores de la Universidad Carnegie Mellon concluyen cmo la
informacin compartida a travs de las redes sociales puede llevar a la
discriminacin en la contratacin.
Distintos proyectos europeos tratan de obtener y explotar informacin de redes
sociales, que mejoren la gestin total e integrada de todos los intervinientes en
situaciones de crisis y emergencias, dentro del programa de Seguridad 2013 Topic
SEC-2013.6.1-1 The impact of social media in emergencies .
Proceso
El proceso OSINT consta de las siguientes fases:

Requisitos: es la fase en la que se establecen todos los requerimientos que se deben
cumplir, es decir, aquellas condiciones que deben satisfacerse para conseguir el
objetivo o resolver el problema que ha originado el desarrollo del sistema OSINT.
Identificar fuentes de informacin relevante: consiste en especificar, a partir de
los requisitos establecidos, las fuentes de inters que sern recopiladas. Hay que
tener presente que el volumen de informacin disponible en Internet es
prcticamente inabordable por lo que se deben identificar y concretar las fuentes de
informacin relevante con el fin de optimizar el proceso de adquisicin.
Adquisicin: etapa en la que se obtiene la informacin a partir de los orgenes
indicados.
Procesamiento: consiste en dar formato a toda la informacin recopilada de manera
que posteriormente pueda ser analizada.
Anlisis: es la fase en la que se genera inteligencia a partir de los datos recopilados
y procesados. El objetivo es relacionar la informacin de distintos orgenes
buscando patrones que permitan llegar a alguna conclusin significativa.
Presentacin de inteligencia: consiste en presentar la informacin obtenida de una
manera eficaz, potencialmente til y comprensible, de manera que pueda ser
correctamente explotada.
Problemas
Se pueden identificar principalmente 2 problemas a la hora de utilizar un sistema OSINT:
Demasiada informacin: como ya se ha puesto de manifiesto, la cantidad de
informacin pblica disponible en Internet es ms que notable. Es por ello, que se
debe realizar un proceso muy exhaustivo a la hora de identificar y seleccionar las
fuentes de informacin de inters que van a ser recopiladas, y que posteriormente
servirn para la generacin de inteligencia. El hecho de utilizar un catlogo extenso
de fuentes conlleva obviamente un mayor gasto a la hora de implementar el sistema,
y en el caso de no tener disponibles los recursos necesarios, provoca una
significativa ralentizacin del mismo.
Fiabilidad de las fuentes: es importante valorar previamente las fuentes que van a
nutrir el sistema de informacin ya que una seleccin errnea de las mismas puede
provocar resultados errneos y desinformacin.
Herramientas
Hay multitud de herramientas y servicios tiles a la hora de implementar un sistema
OSINT. A continuacin se mencionan algunos de ellos:
Buscadores habituales: Google, Bing, Yahoo, Ask. Permiten consultar toda la
informacin que indexan. As mismo, permiten especificar parmetros concretos
(Hacking con buscadores: por ejemplo Google Hacking o Bing Hacking) de
manera que se pueden realizar bsquedas con mucha mayor precisin que la que
utilizan los usuarios habitualmente.
Dependiendo del buscador empleado se utilizan distintos parmetros, si bien
algunos de ellos son comunes. Algunos ejemplos de bsquedas parametrizadas son
las siguientes:
o Ficheros con extensin pdf de un sitio web concreto: site:cert.inteco.es +
ext:pdf
o Algunos sitios hackeados: intitle:"hacked by SultanHaikal"
Mediante stos parmetros se puede obtener, entre otras cosas, informacin sensible
como nombres de usuarios y contraseas procedentes de volcados de bases de datos,
localizacin de servidores vulnerables, acceso a dispositivos hardware online como
webcams, cmaras de vigilancia o impresoras, o datos personales como DNI,
cuentas bancarias, etc.
Buscadores especializados:
o Shodan: Permite entre otras cosas localizar ordenadores, webcams,
impresoras, etc basndose en el software, la direccin IP, la ubicacin
geogrfica, etc. Mediante este servicio es posible localizar informacin de
inters y, en ocasiones, curiosa e incluso inquietante, como por ejemplo:
acceder al sistema de control de una pista de patinaje sobre hielo en
Dinamarca y descongelarla , poner en modo de prueba todo el sistema de
control de trfico de una ciudad o acceder al sistema de control de una
planta hidroelctrica en Francia .
o NameCHK: es una herramienta que permite comprobar si un nombre de
usuario est disponible en ms de 150 servicios online. De este modo, se
puede saber los servicios que utiliza un usuario en concreto, ya que
habitualmente la gente mantiene dicho nombre para todos los servicios que
utiliza. Adems, disponen de una API que permite automatizar las consultas.

o Knowem: es una herramienta de similares caractersticas que MameCHK
pero comprueba el nombre en ms de 550 servicios, incluyendo dominios
disponibles.
o Tineye: es un servicio que, partiendo de una imagen, indica en qu sitios
web aparece. Es similar a la bsqueda por imagen que incorpora Google
Imgenes.
o Buscadores de informacin de personas: permiten realizar bsquedas a
travs de diferentes parmetros como nombres, direcciones de correo o
telfonos. A partir de datos concretos localizan a usuarios en servicios como
redes sociales, e incluyen posibles datos relacionados con ellos como
nmeros de telfono o fotos. Algunos de los portales que incorporan este
servicio son: Spokeo, Pipl, 123people o Wink.
Herramientas de recoleccin de metadatos:
o Metagoofil: permite la extraccin de metadatos de documentos pblicos
(pdf, doc, xls, ppt, docx, pptx, xlsx). A partir de la informacin extrada se
pueden obtener direcciones de correo electrnico del personal de una
empresa, el software utilizado para la creacin de los documentos y por
tanto poder buscar vulnerabilidades para dicho software, nombres de
empleados, etc.
o Libextractor: es una aplicacin similar a Metagoofil que soporta muchos
ms formatos, si bien la informacin obtenida no es de tanta utilidad.
Servicios para obtener informacin a partir de un dominio:
o Domaintools: es uno de los servicios referentes en este mbito ya que
incorpora un gran nmero de funcionalidades. Cabe destacar que permite
crear alertas a usuarios que registran dominios, monitorizar dominios e IPs,
crear alertas para dominios nuevos que contengan ciertas palabras, e incluso
un servicio de investigacin de gran cantidad de amenazas como spear
phishing, denegacin de servicio, spam, fraude o malware.
o Robtex: muestra, entre otras cosas, la fiabilidad del dominio, su posicin en
el ranking Alexa , el listado de subdominios, los servidores de correo o el
ISP que utiliza.
o MyIPNeighbors: permite obtener el listado de dominios que comparten
servidor con el dominio indicado.
APIs de diferentes servicios como Facebook, Twitter, Google+ o Youtube:
Mediante los mtodos que implementan se pueden consultar de una manera
automatizada los datos publicados.
Otras herramientas de inters:
o GooScan: permite automatizar bsquedas en Google pudiendo identificar de
una manera sencilla subdominios de un dominio concreto, fugas de
informacin o posibles vulnerabilidades.
o SiteDigger: al igual que GooScan permite automatizar bsquedas. Busca en
la cach de Google para identificar vulnerabilidades, errores, problemas de
configuracin, etc.
o OsintStalker (FBStalker y GeoStalker): utilizan diferentes redes sociales
como Facebook, LinkedIn, Flickr, Instagram y Twitter para recolectar gran
cantidad de informacin sobre una persona. Permiten localizar lugares y
sitios web visitados con regularidad, amigos online, etc y mostrar los datos
en Google Maps.
o Cree.py: permite obtener datos de Twitter, Flickr e Instagram. A partir de la
seleccin de una cuenta extrae fechas e informacin GPS, y crea una base de
datos en formato csv o kmz para visualizarlos.
o Theharvester: esta herramienta obtiene emails, subdominios, host, nombres
de empleados, puertos abiertos, etc a travs de diferentes servicios como
Google, Bing, LinkedIn y Shodan.
Merecen una mencin especial Palantir y Maltego al implementar un gran
nmero de funcionalidades y ser unos de los grandes referentes en la materia de la
inteligencia de las fuentes abiertas.

o Palantir: es una empresa que tiene como cliente a diferentes servicios del
Gobierno de Estados Unidos (CIA, NSA y FBI) y que se centra en el
desarrollo de software contra el terrorismo y el fraude, mediante la gestin y
explotacin de grandes volmenes de informacin.
o Maltego: permite visualizar de manera grfica las relaciones entre personas,
empresas, pginas web, documentos, etc. a partir de informacin pblica.
Conclusiones
La inteligencia recopilada a partir de fuentes de acceso pblico (OSINT) ha cobrado una
especial relevancia en los ltimos aos, principalmente promovida por la proliferacin del
uso de Internet y de las redes sociales. Existe una enorme cantidad de informacin
disponible en la red, Deep Web incluida, que puede resultar de gran inters en muy
diversos campos que abarcan desde la seguridad de la informacin, la reputacin online o la
identificacin y gestin de posibles riesgos a la seguridad nacional. As mismo, cada vez se
llevan a cabo ms estudios sociolgicos, psicolgicos, o de otras materias que utilizan
como base la informacin pblica disponible en internet.
Otro aspecto significativo, y que permite darse cuenta de la importancia de este tipo de
informacin, es la aparicin en el mercado laboral de la figura del analista OSINT, el cual
es el encargado, entre otras cosas, de implementar y gestionar los sistemas OSINT.
McKinsey Global Institute ha pronosticado que para el 2018 en EEUU habr una demanda
de entre 140.000 y 190.000 profesionales con conocimientos estadsticos y de anlisis
predictivo .
Todo esto ha provocado que diferentes pases destinen cada vez ms recursos a
implementar estos sistemas, creando incluso organismos como Open Source Center
(OSC) en Estados Unidos o asociaciones como Eurosint en Blgica, encargadas de
analizar los datos pblicos con el fin de identificar y prevenir amenazas.
Por todo lo anteriormente indicado, es innegable que la la inteligencia de fuentes abiertas
puede aportar gran cantidad de beneficios.

S-ar putea să vă placă și