Sunteți pe pagina 1din 32

BIG DATA

y su impacto en el negocio
Una aproximación al valor que el análisis
extremo de datos aporta a las organizaciones
Leopoldo Boado
Country Manager de Oracle España.

LA BÚSQUEDA DEL TESORO… DE DATOS


En la literatura infantil anglosajona hay una bella imagen que excita la imaginación de los niños: al final del
arcoíris hay un tesoro; un caldero lleno de monedas de oro custodiado por un duende. Hoy, lo que excita la
imaginación de buena parte de los directivos y empresarios es un tesoro de un tipo muy particular. El tesoro
se llama Big Data y consiste en la acumulación y tratamiento de cualquier tipo de información que se está
produciendo en todo tipo de redes, dispositivos y sistemas informáticos.
Cada día, según información de McKinsey, la humanidad crea 1,5 trillones de bytes de datos. La imparable
expansión de Internet, no sólo como un canal de información, sino como un instrumento al servicio de la
gestión empresarial, explica en gran medida este incremento de datos. Pero a ello se unen otros fenómenos,
como la explosión de las redes sociales, el desarrollo de la telefonía móvil –en particular de redes 3G y
smartphones con capacidades de conexión de datos impensables hace no tanto tiempo-, el crecimiento de la
producción y divulgación de materiales multimedia –foto y vídeo- por parte de usuarios particulares, la eclosión
de medidores inteligentes (smartmetering) y el despliegue de dispositivos que transmiten información por
radiofrecuencia.
¿Cómo pueden las empresas hacerse con este tesoro? ¿Cómo pueden convertir los datos propios y los que
circulan por las redes y sistemas de información en un valor añadido para su negocio y en una ventaja
competitiva?
No hay una respuesta única para estas preguntas. Cada organización, en función de su sector de actividad y de
sus propias peculiaridades, deberá analizar qué uso puede hacer de este inmenso caudal de datos y cómo los
puede aprovechar. Pero lo que sí hay es una clara respuesta tecnológica. Aprovechar el potencial de Big Data es
una realidad perfectamente posible hoy en día, y a un coste razonable, gracias a los sistemas que empresas como
la nuestra ponen a disposición de sus clientes.
En el presente informe, promovido por Oracle, buscamos ofrecer una muy amplia visión de lo que Big Data
puede representar para el entorno empresarial en todo el mundo y en España en particular. Con ello queremos
ofrecer a nuestros clientes una aproximación caracterizada por la independencia de criterio y opinión de quienes
han colaborado en su desarrollo.
Los Big Data representan una ventaja competitiva para todos aquellos que los sepan aprovechar. No nos
cabe duda de que, al contribuir a una mejor comprensión sobre este fenómeno, ayudaremos a los gestores
empresariales de toda España a llegar al final del arcoíris.

Leopoldo Boado
RESUMEN EJECUTIVO

BIG DATA y su impacto en el negocio


Una aproximación al valor que el análisis extremo de datos aporta a las organizaciones

El 90% de los datos del planeta se ha generado en los


últimos dos años y durante 2011 se rozaron los dos
zettabytes (1 zettabyte = 1024 exabytes) de información
en todo el mundo según datos de McKinsey Global Para el éxito de las iniciativas de Big Data es fundamental
Institute. Provienen de redes sociales (más de 900 millones una buena sincronía entre la capa de negocio y la
de usuarios de Facebook , 500 millones de seguidores infraestructura tecnológica subyacente. Las TI son sin duda
de Twitter y cerca de 200 millones de blogs públicos); la herramienta imprescindible para llevar a cabo cualquier
teléfonos móviles (5.000 millones en uso en todo el proyecto de Big Data pero es el conocimiento de negocio el
mundo); sistemas de telemedición; fotografías; vídeos; que determinará el éxito de la misma.
emails… El conjunto de toda esta explosión de información
recibe el nombre de Big Data y, por extensión, así también Aplicaciones
se denomina al conjunto de herramientas, técnicas y Existen múltipes aplicaciones horizontales de Big Data:
sistemas destinados a extraer todo su valor. motores de recomendaciones; análisis de sentimientos;
En el sector retail se espera que quien aplique técnicas de control del riesgo; detección del fraude; análisis de
Big Data podrá incrementar sus márgenes en más de un campañas de marketing, de abandono de clientes,
60%; los costes de fabricación y mantenimiento de muchas de influencia social, y de experiencias de cliente;
empresas se verían reducidos a la mitad; en sus distintas monitorización de la red y aplicación del análisis extremo a
aplicaciones en el sector público europeo podría generarse los procesos de investigación y desarrollo.
negocio por valor de 250.000 millones de dólares y de Por sectores, Big Data influye en una gran variedad de
300.000 millones en el sector sanitario estadounidense y aplicaciones:
los nuevos negocios basados en servicios de localización
podrían generar más de 100.000 millones de dólares. Banca y finanzas: Servicios de protección de marca;
protección ante riesgos y fraude y servicios personalizados a
El valor de las prácticas de análisis extremo reside en el clientes.
punto de encuentro entre el acercamiento a Big Data con
los métodos y herramientas apropiados y su integración Sector Público: Servicios de inteligencia, defensa y
con los datos de la informática tradicional. Al combinar las protección (control de comunicaciones, vigilancia,
herramientas de Big Data con la gestión de datos clásica las intercepción de redes de telefonía, acumulación de todo
organizaciones obtienen una visión “enriquecida” de ellas tipo de datos); protección de la flota pesquera; vigilancia,
mismas y sus posibilidades. seguridad y señalización y proyectos de Smart Cities.
Cuestiones técnicas
Un término íntimamente relacionado con Big Data desde
el punto de vista técnico es Hadoop, un entorno de código
abierto para almacenar y organizar cantidades masivas de
datos distribuidos y no estructurados que, a su vez, estaba
inspirado en MapReduce, una función desarrollada por
Google a principios de 2000 para indexar la web.
Hadoop se encuadra como un proyecto de la Apache
Software Foundation, en el que cientos de participantes
mejoran continuamente el núcleo de la tecnología. Además,
una nueva generación de desarrolladores de este entorno
y de “Científicos de datos” está empezando a despuntar.
Asimismo, start-ups de última generación empiezan a
perfeccionar bases de datos NoSQL que, combinadas con
Hadoop, son capaces de descubrir patrones prácticamente
en tiempo real.
Sanidad: Monitorización remota de pacientes; localización
de emergencias y almacenamiento de historias clínicas,
radiografías, escáneres y todo tipo de pruebas de forma La propuesta de Oracle en Big Data descansa
centralizada. en tres pilares: sistemas preconstruidos
con hardware, software y comunicaciones
Retail-Gran Consumo: Control de la cadena de integrados que se puedan conectar
fabricación; análisis del ticket de compra; marketing directamente (Big Data Appliance);
personalizado y RFID (Identificación por Radio Frecuencia) herramientas de productividad y de desarrollo
en centros comerciales. alrededor de creaciones OpenSource como
Hadoop o MapReduce y conectores que
Turismo: Optimización de precios y generación de ofertas automatizan las transformaciones necesarias
personalizadas. para procesar la información en origen,
Telecomunicaciones: control de la red; venta de servicios dotando de la estructura necesaria a la parte
de localización; servicios de publicidad asociados al patrón que se desea integrar con la informática
de llamadas o las aplicaciones descargadas; obtención tradicional.
de perfiles enriquecidos de consumidor enriquecidos y
explotación de RFID para segmentar y personalizar ofertas Big Data en España
análisis de abandono.
Las empresas españolas muestran interés hacia la
Utilities: Interpretación de contadores inteligentes en todas explotación de Big Data, pero es difícil sustraerse a los
las casas; control de la red comunicaciones, de tuberías, rigores del momento económico que limita los presupuestos
red del metro y proyectos de señalización de tramos de de TI. Las principales cuestiones que se plantean las
mantenimiento organizaciones españolas en relación a Big Data son: ¿es
Web y Digital Media: Análisis de click and stream; aplicable y factible en mi organización?, ¿cuánto me cuesta?
personalización y forecasting y optimización Y ¿quién me ayuda a implantarlo?
BIG DATA: DESGRANANDO EL CONCEPTO
Proliferación de información en crecimiento acelerado y sin visos de ralentizarse, explosión de
indicadores, señales y registros, interacciones en redes sociales… No hay camino de vuelta: la
cantidad de datos que se genera diariamente en el mundo no presenta síntomas de ir a reducirse,
más bien todo lo contrario. El mundo está lleno de señales, de signos, datos, piezas de información
que analizadas y puestas en relación podrían responder a cuestiones que nunca hubiéramos
imaginado poder preguntar. Según la consultora McKinsey Global Institute, el 90% de los datos del
planeta se ha generado en los últimos dos años y su proliferación va en aumento en una progresión
difícil de calcular. Están en todas partes, provienen de redes sociales, sistemas de telemedición,
fotografías, vídeos, emails, son de múltiple naturaleza y se almacenan en distintos lugares y
formatos. El conjunto de toda esta explosión de información recibe el nombre de Big Data y, por
extensión, así también se denomina al conjunto de herramientas, técnicas y sistemas destinados a
extraer todo su valor.

En 2010 existían 480 millones de smartphones y la cifra Según McKinsey Global Institute, en el sector retail se
crece….¡al 20% anual! Un segundo de vídeo en alta espera que quien aplique técnicas de Big Data podrá
definición ocupa 2.000 veces más que una página de incrementar sus márgenes en más de un 60%; los costes de
texto. Las cámaras integradas en los teléfonos hacen fotos fabricación y mantenimiento de muchas empresas se verían
a de 15 megapíxeles que ocupan 10 Megas. Existen más reducidos a la mitad; en sus distintas aplicaciones en el
de 30 millones de sensores en transportes, automoción, sector público europeo podría generarse negocio por valor
industria, fabricación… En todas nuestras interacciones de 250.000 millones de dólares y de 300.000 millones en
los seres humanos dejamos rastros, señales que nos definen el sector sanitario estadounidense y los nuevos negocios
y que mediante las tecnologías de la información y, sobre basados en servicios de localización podrían generar más de
todo a raíz de la proliferación de las redes sociales, pueden 100.000 millones de dólares.
registrarse a modo de documento de identidad vital.
McKinsey añade que las oportunidades laborales asociadas
al fenómeno también son más que relevantes: de aquí
“La vida de la tecnología ha alcanzado a 2018, la demanda prevista de proyectos de Big Data
las fases de madurez en las que ser en Estados Unidos va a necesitar de un ecosistema de
rápido y ser fuerte importa pero no es profesionales expertos de entre 440.000 y 490.000.
suficiente. Ha llegado el momento de
combinar la ambición y la fuerza de la El objetivo principal de Big Data es enriquecer
juventud (informática estructurada) con y complementar los sistemas corporativos
la experiencia comparada (informática no con capacidades predictivas
estructurada), de modo que la interrelación
de ambos tipos de datos nos lleve a la La estimación de la oferta real de talento analítico, sin
sabiduría corporativa” embargo, se calcula que no superará en 2018 los 300.000
Andrew Sutherland, profesionales, lo que significa que se abren oportunidades
Vicepresidente Senior de Tecnología de Oracle EMEA. laborales para entre 140-190.000 expertos.
Pero no todo son buenas noticias. La teoría tiene todo
La realidad muestra una acumulación que nunca termina el sentido pero, según expresa Gartner en su informe de
de todo tipo de datos, la mayoría proveniente de nuevos 2011 Extreme Data challenges and opportunities: “Hasta
canales para formar lo que se conoce por Big Data, y 2015 más del 85% de las empresas que componen la lista
que carecen de una estructura común. Los volúmenes de Fortune 500, van a fallar en la explotación de Big Data de
datos son tan extremos y su crecimiento tan exponencial forma eficiente para obtener ventajas competitivas”.
que resultan demasiado ingentes o demasiado crudos
para ser recogidos, registrados, aceptados, gestionados y Para Andrew Sutherland, Vicepresidente Senior de
analizados por software y hardware tradicional a unos costes Tecnología de Oracle EMEA , “no se trata de montar un
razonables. departamento de I+D de Big Data, se trata de sacarle un
valor a esa información al combinarla lo antes posible con
Pero la posibilidad de explotarlos abre mucho espacio para las fuentes tradicionales de datos. Hablamos de enriquecer
nuevas empresas y para las organizaciones tradicionales que la fuente, de dar herramientas de productividad alrededor
sepan extraerle valor a su capital informativo. de un entorno que de por sí es improductivo”.
Estructurado-no estructurado
Hay datos que conforman el alma operativa de una Entre la punta de la pirámide que representan Facebook o
organización y deben estar almacenados, organizados y Google y la base de la informática tradicional existe una
clasificados en bases de datos transaccionales con métodos casuística amplia y variada a la hora de añadir información
que garanticen su seguridad, cifrado y alta disponibilidad. de valor procedente de nuevas fuentes y canales,
A estos se les conoce como datos “estructurados” que se mezclándola con la información y los sistemas tradicionales.
almacenan, gestionan y analizan según unos procedimientos
Las grandes empresas tienen sus sistemas de gestión
de tablas, atributos e indexación.
de la relación con clientes (CRM), conocen sus gustos
En la lógica de Big Data lo relevante tiene que ver y comportamientos, aplican pautas de inteligencia de
con tratar la ingente y creciente cantidad de datos “no marketing, personalizan ofertas… Pero aun así, existe
estructurados” procedentes de canales no tradicionales información que podría enriquecer esas prácticas. De este
(blogs, redes sociales, emails, sensores, fotografías, vídeos, modo, el objetivo principal de Big Data es enriquecer y
servicios de geolocalización, tecnologías de radiofrecuencia). complementar los sistemas corporativos con capacidades
Estos datos tendrían gran utilidad predictiva pero predictivas.
resultaría desproporcionadamente costoso darles el
mismo tratamiento con las condiciones de seguridad, alta Los volúmenes de datos son tan extremos y
disponibilidad y cifrado que los datos que se denominan su crecimiento tan exponencial que resultan
estructurados. demasiado ingentes o demasiado crudos
para ser registrados, aceptados, gestionados
y analizados por software y hardware
Entre la punta de la pirámide que representan tradicional
Facebook o Google y la base de la informática
tradicional existe una casuística amplia Big Data busca capturar, almacenar, organizar y
y variada a la hora de añadir información analizar esos datos “no estructurados”, pero ahora con la
de valor procedente de nuevas fuentes y necesidad de aplicación de economías de escala y con unos
canales, mezclándola con la información y los requerimientos técnicos muy concretos y específicos por
sistemas tradicionales debajo.

La razón para utilizar tecnologías distintas a la relacional Para Andrew Sutherland, nosotros mismos somos
tiene, por tanto, mucho que ver con el carácter no contenedores de información, estructuras de datos.
estructurado de los datos y con la necesidad de utilizar Almacenamos exabytes de información genética y al
algoritmos de búsqueda/filtrado distintos al lenguaje aprender desarrollamos un marco, una estructura de
utilizado por las bases de datos relacionales, el SQL. conocimiento que nos servirá para organizar la información,
las señales, los estímulos que percibimos y los que nosotros
Conocimiento combinado generamos. La experiencia vital, el ensayo y error ayudan
a edificar esa estructura de conocimiento que se acaba
El valor de las prácticas de “análisis extremo” reside en el conociendo como sabiduría.
punto de encuentro entre el acercamiento a Big Data con
los métodos y herramientas apropiados y su integración “En tecnología no es muy diferente. Nos encontramos en
con los datos de la informática tradicional. Al combinar las un punto en el que la vida de la tecnología ha alcanzado las
herramientas de Big Data con la gestión de datos clásica las fases de madurez en las que ser rápido y ser fuerte importa
organizaciones obtienen una visión más completa de ellas pero no es suficiente. Ha llegado el momento de combinar
mismas y sus posibilidades. la ambición y la fuerza de la juventud (informática
estructurada) con la experiencia comparada (informática
Facebook, Google y Amazon son ejemplos de compañías no estructurada), de modo que la interrelación de ambos
que utilizan el “análisis extremo” como patrón de tipos de datos nos lleve a la sabiduría corporativa”, señala
tratamiento de las ingentes cantidades de datos que Sutherland.
manejan. De hecho, las herramientas, lenguajes y
entornos asociados al análisis de Big Data se desarrollaron
bajo el paraguas de estas compañías que demandaban
nuevos métodos para tratar y obtener valor de su capital
informativo.
A VUELTAS CON LA AVALANCHA DE DATOS
Los datos son la materia prima de cualquier práctica de análisis de negocio. Hasta ahora eso
implicaba datos estructurados creados y almacenados por las propias organizaciones: información
de clientes recogida en CRMs, datos operacionales almacenados en sistemas ERP o datos financieros
almacenados en bases de datos de contabilidad. Todo esto permanece pero ahora, además, el
volumen y los nuevos tipos de datos disponibles en las empresas –y la necesidad de analizarlos
prácticamente en tiempo real para obtener de ellos el máximo valor de negocio- crece rápidamente
gracias a la popularización de las redes sociales como Facebook y Twitter, de los sensores y
dispositivos de red generadores y captadores de señales, de las transacciones on line y de otras
fuentes de datos no estructurados y semi estructurados. Big Data en estado puro.

Investigaciones de The Economist Intelligence Unit y de añadido de Big Data y por ello están surgiendo nuevas
McKinsey Global Institute, revelan que durante 2011 se aproximaciones que ayuden a las compañías a obtener un
rozaron los dos zettabytes (1 zettabyte = 1024 exabytes) conocimiento aplicable al negocio.
de datos creados en el mundo. En la próxima década el
número de servidores que tendrá que gestionar el capital La transición no va a ser sencilla para muchas
de datos mundial podría multiplicarse por diez. Cada día organizaciones, pero aquellas que acometan la tarea y
se envían en el mundo 294.000 millones de emails. Una abracen Big Data como los pilares de sus prácticas de
compañía como Wal-Mart procesa más de un millón de análisis de negocio podrán obtener ventajas competitivas
transacciones cada hora y posee bases de datos con una relevantes frente a rivales más “tímidos”. Big Data
capacidad estimada de 2,5 petabytes. Las cifras son tan combinado con sofisticados métodos de análisis tiene el
inabarcables como las distancias del universo, pero ahí potencial de ofrecer a las empresas un conocimiento sin
están, componiendo la materia prima más valiosa de las precedentes del comportamiento de los consumidores y de
organizaciones. las volátiles condiciones del mercado. Esto les permitirá
tomar decisiones basadas en las evidencias que plantean los
“Big Data puede llegar a ser el activo más decisivo de una datos y ser más eficaces que su competencia.
organización o una de sus obligaciones más costosas, todo depende
de las estrategias y soluciones que se pongan en marcha a corto Datos tradicionales BIG DATA
plazo para afrontar el ingente crecimiento del volumen, la
Gigabytes/Terabytes Petabytes/Exabytes
complejidad, la diversidad, y la velocidad de los datos. Como
veremos, es una tendencia importante para las organizaciones y Centralizados Distribuidos

sus procesos de toma de decisiones, pero en absoluto afectará de Estructurados Semiestructurados-desestructurados


la misma forma a todas las firmas y sectores”, explica Manuel
Modelo de datos estable Carencia de esquemas
Ángel Méndez, analista asociado de Penteo y autor del
documento Big Data: ¿humo o reto corporativo? Interrelaciones complejas Ausencia de relación

Según The Economist Intelligence Unit, el 53% de las


firmas con una estrategia eficiente de gestión y análisis de Desde la tecnología de servidores de almacenamiento
datos obtuvieron mejores resultados de negocio frente a solo que soporta el procesamiento de Big Data hasta las
el 36% que asegura no tener esa estrategia establecida. herramientas de visualización del front-end, el surgimiento
del fenómeno también implica grandes oportunidades para
“¿Por qué? Porque la mejora en la segmentación y calidad los fabricantes de hardware, desarrolladores de software y
de la información revierte en el descubrimiento de necesidades, proveedores de servicios.
identificación de problemas, automatización de la toma de
decisiones y el aumento de la transparencia”, añade Manuel En esta línea, Big Data se perfila, además, como la nueva
Ángel Méndez en el documento de Penteo arriba fuente de ventajas competitivas para todos los sectores.
mencionado. Las organizaciones y los fabricantes de tecnología que
enfoquen esta práctica como una moda pasajera se exponen
La gestión de datos tradicional y las herramientas de a quedarse atrás y pronto se verán a sí mismos imitando a
análisis de negocio se revelan como limitadas bajo el peso rivales con mayor capacidad de pensar un paso más allá.
Previsiones para el mercado de Big Data 2012-2017 Mercado de Big Data 2011. Ingresos por segmento.
(en miles de millones de dólares) Total: 5.200 millones de dólares

$60.0
$53.4
Servicios: 44%
$50.0 $48.0
Hardware: 31%
$40.0
$32.1 Software:25%
$30.0

$20.0
$16.8
$10.0 $5.1
$10.2
$0.0
2012 2013 2014 2015 2016 2017
Fuente: Wikibon , 2012 Fuente: Wikibon , 2011

Con V de volumen, variedad y velocidad transformarlos y extraerlos para su análisis. Para obtener el
máximo valor de Big Data, las organizaciones deben hacer
La explosión de la Web como vehículo comercial y de evolucionar sus infraestructuras de TI de cara a soportar
relación, la rapidísima difusión de la telefonía y los el ratio de entrega de volúmenes extremos de datos de
dispositivos móviles y de otras tecnologías paralelas ha distintos tipos, integrarlos con los datos corporativos y
provocado un cambio fundamental en la naturaleza de los proceder a su análisis.
datos. Ahora más que nunca, los datos están dispersos,
distribuidos, ligeramente estructurados, su volumen se Fuentes de Big Data: ¿de dónde proceden los
dispara cada vez más y hay que saber encontrarles el valor. datos?
Tras identificar y filtrar los elementos valiosos de Big
Data éstos se relacionan con información estructurada, Big Data se nutre de una serie de fuentes que incluyen, de
“enriqueciéndola”. Los datos estructurados seguirán forma general:
residiendo en estructuras de almacenamiento de alta Redes y medios sociales: Según Mc Kinsey Global Institute,
densidad (bases de datos relacionales) y continuarán siendo existen actualmente más de 900 millones de usuarios de
la base de las operaciones de la empresa. Así lo hacen los Facebook , 500 millones de seguidores de Twitter y casi
grandes jugadores de Social Media: extraer el valor de Big 200 millones de blogs públicos. Cada actualización de un
Data y almacenarlo en estructuras relacionales para ponerlo perfil de Facebook, cada tweet, cada post y cada comentario
en valor e integrarlo en los procesos de negocio de cada blog crea, a su vez, múltiples nuevos datos.
Cuatro “uves” definen a Big Data: Dispositivos móviles: IDC apunta a que existen alrededor
Volumen: La cantidad de datos creada tanto dentro de las de 5.000 millones de teléfonos móviles en uso en todo el
organizaciones como detrás del firewall corporativo a través mundo. Cada llamada, cada texto de cada mensaje queda
de la web, dispositivos móviles, sensores, infraestructura de registrado a modo de datos. Los dispositivos móviles,
TI y otras se incrementa exponencialmente cada año. especialmente los smart-phones y las tablets, también
facilitan el uso de las redes sociales, al tiempo que utilizan
Variedad: La variedad de tipos de datos también se otras aplicaciones generadoras, a su vez, de más datos.
diversifica, ya se trate de datos no estructurados basados en Además, los dispositivos móviles recogen y transmiten
texto, semiestructurados como los provenientes de social datos de localización.
media o los de información basada en la localización.
Transacciones vía Internet: Miles de millones de compras
Velocidad: La velocidad a la que se crean nuevos datos online, operaciones bursátiles y otro tipo de transacciones
y la necesidad de analíticas en tiempo real para extraer se suceden cada día. Cada una de ellas genera una serie
valor de ellos, se incrementa gracias a la inmediatez de las de datos que son recogidos por tiendas, bancos y agencias
transacciones, a la informática móvil y al creciente número crediticias, entre otros.
de usuarios de Internet y de dispositivos móviles.
Sensores y dispositivos de red: los dispositivos electrónicos
Valor: El valor económico de los datos varía de todo tipo (incluyendo servidores y otras clases de
significativamente. Siempre hay información valiosa oculta sistemas de hardware, contadores inteligentes y sensores de
entre enormes cantidades de datos no tradicionales y el temperatura) crean datos de registro semiestructurados que
reto reside en identificar aquellos datos que tienen valor, dejan constancia de cada acción.
¿PARA QUÉ BIG DATA?
APLICACIONES REALES DE UN CONCEPTO
La razón de que Big Data sea tan atractivo y poderoso es porque permite a las organizaciones
encontrar respuestas a cuestiones que ni siquiera se habían planteado preguntarse. Esto puede
generar descubrimientos que lleven a nuevas ideas para incorporarlas a los productos o servicios o
que ayuden a identificar la manera de mejorar las cuestiones operativas.

En este momento, existen varias prácticas de utilización


de Big Data tanto en gigantes de la web como Google,
Facebook o LinkedIn como en compañías más tradicionales.
Estos son, según Wikibon y Mc Kinsey Global Institute,
algunos ejemplos de las aplicaciones que pueden dársele a
Big Data. Aunque según ambas compañías de análisis, la Análisis de abandono de clientes: las compañías utilizan
mayoría está aún por descubrir. Hadoop y tecnologías Big Data para analizar los datos
Motores de recomendaciones: los gigantes de la Web y relacionados con el comportamiento de los clientes para
los vendedores online utilizan Hadoop para recomendarse identificar patrones que indiquen qué cuáles de ellos son
entre ellos o para aconsejar a los clientes sobre otros más susceptibles de abandonar la compañía en favor de
productos y servicios que podrían interesarles a partir un producto o servicio de la competencia. De ese modo,
del análisis del perfil de usuario y de su comportamiento pueden tomarse medidas para evitar el abandono de clientes
online. LinkedIn utiliza este enfoque para reforzar su valiosos.
apartado “Gente que podrías conocer” y Amazon hace lo Análisis de influencia social: los datos provenientes de
propio para sugerir productos relacionados con una compra redes sociales se analizan para determinar qué usuarios
concreta a los consumidores online. tienen mayor influencia sobre otros dentro de los social
Análisis de sentimientos: utilizadas en conjunción con media. Esto ayuda a las compañías a determinar quienes
Hadoop, las herramientas de análisis de texto avanzadas son sus “clientes más importantes”, que no son siempre los
analizan el texto no estructurado de las redes sociales que más productos consumen o más dinero gastan, sino
(tweets y posts de Facebook), para determinar los los que poseen una mayor capacidad de influencia sobre el
sentimientos de los usuarios en relación a marcas, empresas comportamiento de compra del resto.
o productos concretos. Análisis de experiencias de cliente: las organizaciones
Modelización del riesgo: las compañías del sector que trabajan de cara al público utilizan las prácticas de Big
financiero utilizan Hadoop y los data warehouses de Data para integrar la información previamente recogida
próxima generación para analizar grandes volúmenes de proveniente de canales de interacción con los clientes como
datos transaccionales y determinar el riesgo al que están call centers, chats online, Twitter, etc. Para obtener una
expuestos sus recursos, además de para prepararse ante visión completa de la experiencia de cliente. De ese modo,
futuros escenarios basados en situaciones de mercado las empresas pueden comprender el impacto que tiene un
simuladas. canal de interacción con los clientes sobre otro de cara a
optimizar el ciclo de vida completo de la experiencia de
Detección del fraude: utiliza técnicas Big Data para cliente
combinar el comportamiento de los clientes y los datos
históricos y los transaccionales para detectar actividades Monitorización de la red: Hadoop y otras tecnologías
fraudulentas. Las compañías de tarjetas de crédito, por relacionadas con Big Data también se utilizan para
ejemplo, utilizan tecnologías de Big Data para identificar atrapar, analizar y desplegar datos recogidos de servidores,
comportamientos transaccionales que indican que podría dispositivos de almacenamiento y otros tipos de hardware
estar utilizándose una tarjeta robada. para permitir a los administradores monitorizar la actividad
de red y diagnosticar cuellos de botella y otros problemas.
Análisis de campañas de marketing: los departamentos Este tipo de análisis puede aplicarse también a otro tipo
de marketing de todos los sectores utilizan desde hace de redes, incluyendo las de transporte para, por ejemplo,
largo tiempo la tecnología para monitorizar y determinar mejorar la eficiencia del combustible.
la efectividad de las campañas de marketing. Big Data
permite a los equipos de marketing incorporar mayores Investigación y desarrollo: organizaciones como las
volúmenes de datos de granularidad incremental, como farmaceúticas utilizan Hadoop para “peinar” enormes
datos sobre el flujo de clicks de un usuario o los detalles volúmenes de investigaciones basadas en textos y otros
de registro de una llamada para aumentar la precisión del datos históricos que puedan contribuir al desarrollo de
análisis. nuevos productos.
APLICACIONES DE BIG DATA POR Y PARA LOS DISTINTOS SECTORES

Banca y finanzas Sanidad


• Servicios de protección de marca • Monitorización remota de pacientes
• Protección ante riesgos y fraude • Localización de emergencias
• Servicios personalizados a clientes • Almacenamiento de historias clínicas, radiografías,
• Búsqueda de patrones de uso de productos financieros escáneres y todo tipo de pruebas de forma centralizada
• Marketing personalizado • Elaboración de estadísticas alrededor de incidencias de
determinadas enfermedades por zonas concretas
• Creación de servicios basados en la localización
• Acercamiento de la asistencia a domicilio
• Investigación clínica: estudios de medicamentos,
ensayos clínicos, genoma humano
Sector Público
• Servicios de inteligencia, defensa y protección: control
de comunicaciones, vigilancia, intercepción de redes de Retail-Gran Consumo
telefonía, acumulación de todo tipo de datos • Las prácticas de explotación de Big data son el núcleo
• Protección de la flota pesquera de su negocio desde hace muchos años por encima de las
• Vigilancia, seguridad y señalización aplicaciones transaccionales
• Localizaciones por GPS • Control de la cadena de fabricación
• Detección del fraude • Análisis del ticket de compra
• Control de presupuestos públicos • Marketing personalizado
• Protección de la infraestructura pública • Identificación por radiofrecuencia (RFID) en
centros comerciales
• Protección contra el maltrato
• Proyectos de Smart Cities
Turismo Utilities
• Optimización de precios • Smart Metering: interpretación de contadores
• Generación de ofertas personalizadas inteligentes en todas las casas
• Análisis de sentimientos • Control de la red comunicaciones, de tuberías, red del
metro
• Proyectos de señalización de tramos de mantenimiento
Telecomunicaciones
• Control de la red
• Venta de servicios de localización
Web y Digital Media
• Análisis de click and stream
• Servicios de publicidad asociados al patrón de llamadas
o las aplicaciones descargadas • Personalización
• Obtención de perfiles de consumidor enriquecidos • Forecasting y optimización
• Explotación de RFID para segmentar y personalizar
ofertas
• Análisis de abandono, riesgo y fraude en clientes
• Satisfacción y lealtad de clientes
• Análisis de CDR (Call Data Record) o registro de
llamada
SMART CITIES, un capítulo aparte

La población mundial es mayoritariamente urbana. Al margen de fijar una clasificación de ciudades según
Así lo asegura el estudio de Naciones Unidas “World su grado de “inteligencia”, el informe de la consultora
Urbanization Prospects” que, entre otras conclusiones, ha revelado que los núcleos urbanos españoles han de
muestra cómo ha evolucionado la tendencia del ser humano avanzar en sus modelos de desarrollo y gestión para crear
a agruparse en ciudades. Si en 1950, la población urbana los pilares de un futuro más sostenible que contemple al
del planeta era del 51% del total, actualmente el índice es ser humano como centro. El soporte de las tecnologías
del 71% y creciendo: hasta un 84% hacia la mitad del siglo
XXI. El soporte de las tecnologías de la
La concentración en núcleos urbanos y el desarrollo de los información, especialmente del análisis
mismos trae consigo la definición de un nuevo modelo extremo de datos, señales y transacciones
de ciudad que permita desarrollarse sosteniblemente es el elemento crucial del que obtener la
optimizando todos sus recursos y conformando un entorno información de referencia para permitir que se
humano para sus ciudadanos. desarrollen las ciudades inteligentes. Big Data
aplicado a la habitabilidad, la sostenibilidad y
Nace así el concepto de Smart Cities, en el que múltiples la convivencia ciudadana.
organizaciones públicas y privadas pertenecientes a
diversos sectores trabajan para definir ese modelo de de la información, especialmente del análisis extremo de
ciudad inteligente que es necesario perfilar. La tendencia datos, señales y transacciones es el elemento crucial del que
es mundial pero justamente en España ha alcanzado una obtener la información de referencia para permitir que se
notoriedad especial y así quedó recogido en el informe desarrollen las ciudades inteligentes. Big Data aplicado a la
elaborado por IDC sobre Smart Cities españolas en 2011. habitabilidad, la sostenibilidad y la convivencia ciudadana.
MATRIZ DEL ÍNDICE DE CIUDADES INTELIGENTES DE ESPAÑA
Alto
Málaga

Santander
Barcelona
Elche Donostia-
Madrid San
Sebastían
Hospitalet
de Llobregat
Santa Cruz Zaragoza
Burgos
de Tenerife
Dimensiones de inteligencia

Vitoria-a- Bilbao
Gasteiz
Cartagena San
Cristobal de Alicante
Pamplona
Almería la Laguna /Iruña
Murcia Coruña (A)
Sevilla Gijón
Móstoles Logroño Oviedo
Alcalá de Castellón de
Henares Palma de
la Plana Mallorca
Valencia
Getafe Albacete
Fuenlabrada
Córdoba Granada Valladolid
Leganes

Jerez de la Salamanca
Frontera
Alcorcon
Badajoz
Badalona
Vigo

Las Palmas
de Gran Sabadell
Canaria
Bajo
Débil Fuerzas capacitadoras Fuerte

Cinco primeros 10 aspirantes Jugadores activos Seguidores

Para IDC, las ciudades inteligentes hacen un uso intensivo Aunque suene a iniciativa en beneficio del ciudadano y
de las TIC para transformar su manera de operar en eso le confiere un carácter básicamente público, hay varios
apartados como medio ambiente, energía, servicios organismos privados involucrados en el desarrollo de
públicos, tráfico o construcción. Málaga, Barcelona, proyectos de Smart Cities. Tal es el caso de BBVA, muy
Santander, Madrid y San Sebastián abren el ranking de implicado en el concepto desde su centro de Innovación
“inteligencia urbana” gracias a estas iniciativas: que, a su vez, colabora con el Senseable City Lab del MIT
(Massachusetts Institute of Technology).
1) Málaga: despliegue de una iniciativa de ciudad ecológica
y eficiente a partir de la integración en la red eléctrica de Los objetivos van en la línea de buscar nuevos enfoques
fuentes de energía renovables. de uso de todos los datos de carácter no personal que
proceden de las transacciones de pago y de las retiradas de
2) Barcelona: adopción de soluciones de movilidad en el efectivo. También intenta comprender cómo las personas se
transporte urbano mediante el proyecto LIVE (Logística per relacionan con las ciudades analizando sus interacciones con
a la Implementació del Vehicle Elèctric). los distintos tipos de comercios.
3) Santander: desarrollo del proyecto SmartSantander, “En BBVA buscamos, igualmente, evaluar las
basado en el despliegue de 20.000 sensores dirigidos al posibilidades de predicción que estos análisis tienen
control medioambiental en aspectos como el tráfico, la sobre comportamientos futuros. Combinando los datos de
gestión de los residuos y la eficiencia en el transporte transacciones con otras fuentes de información se podrán
público. añadir nuevas perspectivas y desplegar nuevos servicios que
4) Madrid: creación del Centro Integrado de Servicios de repercutan en la calidad de los espacios urbanos”, comenta
Emergencia (CISEM), capaz de coordinar todos los servicios Elena Alfaro, gerente en el área de Business Discovery y
de urgencia. experta en Smart Cities de BBVA.

5) Donostia-San Sebastián: despliegue del proyecto


Estrategia 2020, que contempla aspectos como “personas y
valores”, “ciudad conectada” y “vivir y disfrutar”.
Unos cuantos tecnicismos que hay que conocer

Otra forma de hacer las cosas:


los nuevos modos de procesamiento y análisis que trae Big Data

Existen varias aproximaciones para afrontar el procesamiento y análisis de Big Data, pero la mayoría
comparten algunas características comunes. Básicamente, se benefician de hardware estándar que
permite implantar técnicas de procesamiento paralelo y escalabilidad; emplean capacidades de
almacenamiento no relacional de cara a procesar datos no estructurados y semi estructurados y
aplican tecnologías avanzadas de análisis y visualización de datos a Big Data para extraer elementos
de comprensión a los usuarios finales.

Wikibon, una comunidad profesional de intercambio de Un cliente accede a datos no estructurados y


conocimiento que aborda cuestiones tecnológicas aplicadas semiestructurados desde distintas fuentes. Secciona
a la resolución de retos de negocio, ha identificado dos los datos en “partes”, que se cargan a continuación en
aproximaciones a Big Data que transformarán los mercados un sistema de ficheros de múltiples nodos. El fichero
de la gestión de datos y las analíticas de negocio: Hadoop y almacenado por defecto en Hadoop se denomina Hadoop
los data warehouses de nueva generación. Distributed File System o HDFS. Los sistemas de archivo
como HDFS resultan adecuados para almacenar grandes
Hadoop puede definirse como un entorno de código abierto volúmenes de información de cualquier naturaleza que
para procesar, almacenar y analizar cantidades masivas no requieren datos ni instrucciones para organizarse en
de datos distribuidos y no estructurados. Doug Cutting columnas o tablas relacionales.
de Yahoo! fue quién creó el entorno que, a su vez, estaba
inspirado en MapReduce, una función desarrollada por
Google a principios de 2000 para indexar la web.
Hadoop se diseñó para soportar petabytes y exabytes de
datos distribuidos en múltiples nodos en paralelo. Los
clusters de Hadoop operan en hardware estándar que no
requiere grandes inversiones de modo que los proyectos
pueden escalar sin afectar presupuestariamente a las
organizaciones. “En estos tiempos de rigor presupuestario,
la opción de entrada en Big Data que se plantean algunas
empresas españolas con las que hemos hablado del concepto
es empezar a investigar y a adentrarse en Hadoop para
identificar la utilidad que podría tener en un futuro”,
comenta Óscar Alonso, analista de Penteo.

En ocasiones veo elefantes amarillos


Actualmente Hadoop se encuadra como un proyecto
de la Apache Software Foundation, en el que cientos de
participantes mejoran continuamente el núcleo de la
tecnología. ¿Qué tiene de especial este entorno conocido
a través de su icónico elefante amarillo? Hay un concepto
fundamental en relación a él: en lugar de procesar un
enorme bloque de información cada vez, Hadoop segmenta
Big Data en múltiples partes, de modo que pueden
procesarse y ser analizadas al mismo tiempo.
Cada “parte” se replica múltiples veces y se carga en el datos a una localización central para su procesamiento, dicho
sistema de ficheros de modo que si un nodo falla, otro procesamiento sucede en cada nodo simultáneamente o en
dispone de una copia de los datos que se encontraban paralelo. Esta es una característica esencial de Hadoop.
en el nodo que falló. Lo que se conoce como Name
Node actúa como facilitador, comunicando de vuelta al Cuando el nodo termina de procesar una determinada
cliente información como, por ejemplo: qué nodos están tarea, almacena los resultados. El cliente inicia entonces un
disponibles en el cluster, en qué lugar del cluster reside un trabajo de “Reduce” a través del Job Tracker en el que los
determinado dato y qué nodos han fallado. resultados de la fase de “Map” almacenados localmente en
nodos individuales se agregan para determinar la “respuesta”
Una vez que el dato se ha cargado en el cluster ya está listo a la consulta original, para después cargarse en otro nodo
para ser analizado por el entorno MapReduce. El cliente del cluster. El cliente accede a esos resultados que pueden
pone en marcha, entonces , la tarea de “Map” (normalmente cargarse después en uno o varios entornos de análisis. De este
una query escrita en Java) en uno de los nodos en el cluster modo se completa la tarea MapReduce.
conocido como Job Tracker. Éste se relaciona con el Name
Node para determinar a qué datos necesita acceder para
Hadoop se diseñó para soportar petabytes y
completar la tarea y en qué lugar del cluster se encuentran.
exabytes de datos distribuidos en múltiples
Una vez determinados, el Job Tracker transfiere la query
nodos en paralelo. Los clusters de Hadoop
a los nodos relevantes. En lugar de devolver todos los
operan en hardware estándar que no requiere
grandes inversiones.

Una vez que la fase MapReduce se complete, los datos


procesados están listos para un análisis más detallado por
parte de los “Científicos de datos” que poseen habilidades
avanzadas de análisis de datos. Los “Científicos de datos”
pueden manipular y analizar los datos utilizando una o
varias herramientas para múltiples propósitos como la
búsqueda de conocimiento o de patrones ocultos para
utilizarlos como pilares en la construcción de aplicaciones
analíticas concretas. Los datos pueden también
modelarse y transferirse desde clusters de Hadoop a
las bases de datos relacionales existentes, a los data
warehouses o a cualquier otro sistema de TI tradicional
para un análisis más detallado o para soportar los procesos
transaccionales.
Unos cuantos tecnicismos que hay que conocer

Otra forma de hacer las cosas:


los nuevos modos de procesamiento y análisis que trae Big Data

Algunas de las mentes más brillantes del sector de TI Middleware y aplicaciones. La actualización del middleware
están contribuyendo con su experiencia al proyecto Apache y aplicaciones en un entorno de Big Data es menos
Hadoop y una nueva generación de desarrolladores de exigente que en el apartado de infraestructura. Muchos de
este entorno y de “Científicos de datos” está empezando los proveedores tradicionales de herramientas de ETL o
a despuntar. Como resultado, la tecnología avanza de middleware de integración de datos, están adaptando
rápidamente y se transforma en un elemento más poderoso ya sus soluciones. A nivel de aplicaciones, sin embargo,
y sencillo de implementar y mantener. el software de visualización no está tan maduro aunque se
trata de módulo fundamental para sacarle partido al análisis
de millones de datos.
Algunas de las mentes más brillantes del
sector de TI están contribuyendo con su Opciones de software libre. Durante el último año se
experiencia al proyecto Apache Hadoop y ha hablado mucho de la capacidad de herramientas de
una nueva generación de desarrolladores de software libre como Apache Hadoop para gestionar grandes
este entorno y de “Científicos de datos” está volúmenes de datos. Cada vez más compañías utilizan esta
empezando a despuntar. Como resultado, y otras opciones de software libre para experimentar cómo
la tecnología avanza rápidamente y se almacenar, gestionar y analizar grandes cantidades de datos.
transforma en un elemento más poderoso y Una de las claves para entender las implicaciones del Big
sencillo de implementar y mantener. Data es que no importa tanto el volumen de los datos o
la rapidez con la que se generan como el valor en sí de la
información y la complejidad de extraer valor de la misma.

Múltiples sabores Fuente: Big Data: ¿humo o reto corporativo?, Penteo 2011

Igualmente, un gran número de fabricantes ha desarrollado


sus propias distribuciones de Hadoop, la mayoría basadas
en la de código abierto de Apache pero con distintos niveles
de personalización propietaria. El claro líder de mercado
en términos de distribución es Cloudera, una start-up de
Silicon Valley con un equipo de primera línea de expertos
en Big Data que incluye al propio creador de Hadoop,
Doug Cutting, y a Jeff Hammerbacher, anterior mago del
análisis de datos de Facebook.
En paralelo, otras start-ups de última generación empiezan
a perfeccionar bases de datos NoSQL que, combinadas con
Hadoop, son capaces de descubrir patrones prácticamente
en tiempo real.

Principales bloques tecnológicos para


establecer una estrategia Big Data según Penteo
Bases de datos e infraestructura. Dotarse de bases de datos
e infraestructura potente es fundamental en un entorno de
Big Data. Más allá de los tradicionales sistemas de gestión
de bases de datos relacionales (RDBMS, en sus siglas en
inglés), se requieren bases de datos con capacidades de
procesamiento y almacenamiento extremas, sistemas OLAP
multidimensionales y bases de datos basadas en memoria
volátil (in-memory). La virtualización de servidores,
almacenamiento y desktop suele ser también necesaria
para acelerar la gestión de datos y hacerla escalable, y otros
componentes como aceleradores de aplicaciones y redes o
bases de datos distribuidas, son también clave.
Buscando desesperadamente al científico de Parece que la de científico de datos será la carrera del
datos futuro. El término, desconocido hasta hace año y medio, se
dispara como entrada de búsqueda en Google, un indicador
Los datos no van a hacer más que crecer y crecer. En cifras siempre claro del interés de un concepto. En el último
de IDC, el volumen de información que se creó, capturó trimestre de 2011 y 2012, alcanzó picos 20 veces superiores
y replicó en 2010 fue de 1,8 millones de petabytes, cifra a los de los mismos periodos del año anterior.
que implica un aumento del 125% en relación a 2009.
Las previsiones a largo plazo apuntan a que en 20 años La necesidad de expertos en análisis extremo: hasta
el volumen de datos habrá crecido un 1.845% respecto a un 60% por encima de la oferta real de profesionales.
2010, alcanzando el astronómico volumen de 35 millones Escenario: Estados Unidos, 2018
de petabytes. Oferta y demanda de profesionales con capacidades analíticas en 2018.
En miles de personas
McKinsey Global Institute relaciona el aumento del 140-190 440-490

volumen de información con la demanda de expertos


en extraer valor de los datos y asegura que en 2018 1803 0
habrá un desfase de entre el 50-60% entre demanda de 300
50-60% de
talento analítico para acometer proyectos y la oferta real desfase entre
demanda de
150
de profesionales preparados para abordar tal tarea. Esto talento
analítico y la
quiere decir que serán necesarios alrededor de 490.000 oferta real.

profesionales para diseñar estrategias Big Data en Estados


Unidos pero que tan sólo habrá 300.000 para cubrir la Profesionales Universitarios con
empleados en capacidades de
OtrosP rofesionales
cualificados en
Desfase Profesionales
cualificados para
2008 análisis extremo analítica cubrir la demanda
demanda. Ver gráfico extrema en prevista en 2018
2018

“Muchas necesidades futuras y pocos expertos presentes”, Perfiles demandados: Estadísticos, científicos cuantitativos, analistas,
así lo resume Miguel Galera en una entrada de TICbeat, managers con enfoque y
experiencia cuantitativa y técnicos expertos en software y lenguajes de
mientras que Michal Lev-Ram, periodista de Fortune programación de análisis de datos.
exhortaba en septiembre de 2011: “Si encuentra algún
científico de datos: contrátelo”.
Fuente: Oficina de Estadística de Empleo de Estados Unidos;
Censo de EE.UU.; Dun & Bradstreet; McKinsey Global Institute

Para Jaime García Cantero, analista independiente,


las capacidades del así llamado científico de datos se
concretarían en “un perfil mixto que integre conocimientos
tecnológicos con comprensión del negocio. El CIO (Chief
Information Officer) ha acabado por estar vinculado a la
parte más puramente tecnológica, lo que le convierte más
en un CTO (Chief Technology Officer). Para entender la
naturaleza y magnitud de Big Data se necesitaría una figura
nueva: el Chief Data Officer capaz de entender la naturaleza
de los datos y organizarlos y explotarlos para obtener un
impacto positivo”.
Ante la brecha entre demanda de talento analítico y
profesionales actuales expertos en la lógica de Big Data,
García Cantero opina que no queda más remedio que
adaptarse a lo que la realidad impone. “Los analistas de
datos tradicionales son más bien matemáticos, estadísticos,
economistas. Trabajan con modelos más que con tecnología
pura y dura porque lo que importa son las reglas de
negocio. Ahora habrá que ponerle un plus de inteligencia
por encima para que ese análisis de datos se integre en las
áreas de marketing, comunicación, ventas… “
De la teoría a la práctica

BIG DATA EN LAS ORGANIZACIONES ESPAÑOLAS


Para compañías como Google, Facebook o LinkedIn la explotación de los datos es el núcleo de su
actividad y han sido pioneras en hacer de la acumulación de información un activo de rentabilidad
casi infinita. Pero ¿y el resto? Las organizaciones recogen las tendencias tecnológicas a veces
mucho antes de que analistas y medios especializados se encarguen de difundirlas. Estos últimos
dan nombre a prácticas que ya ejecutaban las empresas como parte de la evolución de negocio o
como modo natural de buscar ventajas competitivas. En el caso de Big Data, algunas organizaciones
ya lo practicaban “orgánicamente” pero no le habían puesto nombre, de modo que la adopción del
fenómeno está en curso pero hay pocos ejemplos totalmente contrastados y aquilatados tanto a
escala global como en España.

En una sesión organizada por Penteo con 15 empresas


españolas de distintos tamaños y sectores que facturan más
de 100 millones de euros al año, quedó registrado que las
organizaciones están impregnadas de la idea de crear valor a
partir de los datos. “En España estamos en un momento de una aplica la explotación de sus datos según su “naturaleza”
curiosidad hacia el concepto pero con dudas razonables. Las sectorial. “En líneas generales, retail, gran consumo,
empresas españolas muestran interés hacia la explotación banca, telco y sector público son las actividades que más
de Big Data, pero es difícil sustraerse a los rigores del rápidamente ven los beneficios de la aplicación de Big Data
momento económico que limita los presupuestos de TI”, y que más dinamismo muestran a la hora de adoptarlo.
comenta Óscar Alonso, consultor de la firma de análisis
Penteo. Hay ejemplos de proyectos concretos pero aún son muy
pocos y pasará tiempo antes de que las empresas los den a
conocer abiertamente”.
“Las principales cuestiones que se García Cantero está de acuerdo en la enorme potencialidad
plantean las empresas con las que hemos de Big Data en segmentos como banca (cálculo de riesgo,
hablado en relación a Big Data son: ¿es percepción de marca), telecomunicaciones (control de
aplicable y factible en mi organización?, la red, análisis de abandono, riesgo y fraude en clientes,
¿cuánto me cuesta? Y ¿quién me ayuda a satisfacción y lealtad de clientes) sector público (fraude
implantarlo?” fiscal, control del gasto, smart cities) y gran consumo.
Óscar Alonso, Aun así, el analista cree que es pronto para hablar de
analista de Penteo experiencias consolidadas pero que, al ser una práctica
que tiene que ver más con el negocio, es probable que el
“Las principales cuestiones que se plantean las empresas ritmo de adopción sea más rápido que si se tratase de un
con las que hemos hablado en relación a Big Data son: ¿es asunto puramente tecnológico. “Hay ejemplos conocidos
aplicable y factible en mi organización?, ¿cuánto me cuesta? de explotación de datos como en el caso de R Cable, la
Y ¿quién me ayuda a implantarlo?”, explica Alonso. operadora gallega de telecomunicaciones, que ha generado
un agregador de datos en su contact center para tener
Para Jaime García Cantero, analista independiente, “Big una visión única de cliente: su facturación, productos y
Data trae un cambio en los modelos de gestión de las servicios, incidencias…”.
organizaciones que ahora pasarían a ser compañías que
toman sus decisiones basándose en lo que les dicen los En cuanto al tamaño de las organizaciones más receptivas,
datos. Los egos corporativos se diluyen. Las decisiones Óscar Alonso, comenta que con Big Data sucede lo mismo
tienen que venir avaladas por datos que las justifiquen y que con los proyectos de inteligencia de negocio: “en un
esto es un cambio de mentalidad importante”. principio se asociaban a gran cuenta pero su utilidad es
aplicable a cualquiera. Basta con tener volumen de datos
Por su parte, Óscar Alonso asegura que todas las y querer hacer uso de ellos. De hecho, empiezan a aparecer
compañías con las que han hablado del concepto entienden muchas start-ups en las que la explotación intensiva de los
la necesidad de sacar partido de sus datos a la misma datos es la regla principal de su negocio. No hay que ser
velocidad que su propia proliferación impone y que cada una firma del IBEX 35 para sacarle partido a esta práctica”.
Acerca de qué usos de Big Data que ayudasen a mejorar
el negocio podrían ser relevantes en su organización,
¿Cómo hacerlo? Gómez Burriel sólo observa el posible requerimiento de
cantidades ingentes de información para los servicios que
Óscar Alonso añade que “el momento económico no es
deben conservar datos a lo largo del tiempo, por razones o
fácil y los presupuestos de TI están congelados, cuando no
imperativos legales y/o de auditoría.
se han reducido. Lo que sí hemos visto es que, al tratarse
Hadoop de un entorno OpenSource algunas compañías están Para un profesional de TI de otra entidad financiera
derivando recursos humanos a investigar este entorno y a española que prefiere no identificarse, Big Data no es
aproximarse a su utilización”. una práctica completamente nueva: “el tratamiento de la
información no estructurada lleva realizándose hace varios
De entre las compañías a las que Penteo tiene acceso existe
años, lo que ha cambiado realmente es la cantidad de
una compañía de retail de gran consumo que sin denominar
información a almacenar y procesar, así como las fuentes
Big Data a su modo de explotar la información, lleva tiempo
diversas que la originan. Este crecimiento es exponencial
aplicando el análisis de datos para recoger y relacionar lo que
y en estos momentos desconocemos cual será el techo, si es
se dice de ellos en las redes sociales integrándolo en el BI
que algún día llega a tenerlo”.
tradicional. “Esta compañía tiene un grupo de analistas que
pueden considerarse auténticos científicos de datos: personas
con perfiles matemáticos-estadísticos con una visión y unos “Disponer de información masiva permite
conocimientos de negocio muy intensos”. La recomendación prever mejor dónde es necesario suministrar
de Penteo a las organizaciones es empezar a buscar ya mismo la energía y eso se traduce en ser más
ese talento analítico que requiere este tipo de proyectos. eficiente, más fiable y, en consecuencia,
mejorar económicamente. En un mercado
La banca gana desregulado hay que competir por los
Hay pocos ejemplos concretos de inicio y desarrollo de clientes. Hace unos años, el crecimiento
prácticas de Big Data y mucha discreción a la hora de hablar de la construcción trajo en paralelo un
de ellos por parte de sus responsables, ya se trate de personal incremento del despliegue de agua, energía,
técnico o de profesionales ligados al negocio. La prudencia luz nueva, gas... Pero la fiesta se acabó.
se impone. Aun así, algunos representantes de empresas Ahora peleamos por los clientes y estamos
españolas de varios sectores sí que muestras sus experiencias obligados a ser más eficientes, a ser
en encuentros y foros profesionales o valoran a título mejores”.
personal el concepto y las iniciativas de sus organizaciones
en la explotación de Big Data. Rafael Blesa,
Responsable de Arquitectura y BI y de Gestión del
Manuel Gómez Burriel, de Sistemas Centrales de la Software SSII de Gas Natural/Fenosa
Confederación Española de Cajas de Ahorros (CECA) opina
que el concepto Big Data viene de tiempo atrás, sobre Otro hecho diferenciador es la velocidad de acceso
todo desde el momento que surge la necesidad de manejar a la información a la que nos hemos acostumbrado.
información no estructurada. “Hasta ahora, los gestores de “Necesitamos la información ya, de forma inmediata.
bases de datos “clásicos” han ido incorporando, con más o Si combinamos estos aspectos, Big Data si es un nuevo
menos funcionalidades, los datos tipo LOB y XML, pero concepto. ¿Están justificadas las inversiones? Pues
siguen apareciendo nuevas necesidades de accesos analíticos dependerá de las necesidades del negocio, y debe ser este
a información no estructurada. La valoración positiva área de la compañía quien decida su rentabilidad o no.
del impacto en el negocio vendrá determinada, como es Lo que parece indudable, es que el futuro nos lleva a
habitual, por el retorno de la inversión estimada para trabajar con este concepto, por lo que de una forma u otra
proveer el servicio”. tendremos que evolucionar en este sentido.
De la teoría a la práctica

BIG DATA EN LAS ORGANIZACIONES ESPAÑOLAS

Mundo Telco
El sector de las telecomunicaciones es uno de los que más normas regulatorias en algunos de ellos que obligan a
potencial podría extaer de las prácticas relacionadas con Big almacenar los datos durante tiempo prolongado aunque no
Data. se utilicen”, continúa la directora de Productos y Diseño de
Soluciones de BT España.
Ana Lledó Tarradell, directora de Productos y Diseño de
Soluciones de BT España, valora el fenómeno en toda su De modo más concreto, la directiva de la compañía de
amplitud: “ Big Data se ha convertido en un auténtico telecomunicaciones comparte la experiencia y planes de
desafío para las empresas en los últimos dos o tres años: su firma en relación a Big Data: “Como operador, BT
inmensa y creciente generación de datos que se acumulan analiza los datos del tráfico de voz y datos de sus clientes
cada día y que hay que gestionar de la manera más eficiente para dimensionar sus propias redes según la geografía y
posible con el objetivo de disponer de información como la demanda de capacidad e incluso para diseñar ofertas
ventaja competitiva. En este contexto, la eclosión de las específicas. Este análisis, le permite también la gestión
redes sociales, donde cada individuo interactúa y genera idónea de las necesidades de sus clientes colaborando
mucha información, ha venido a evidenciar más si cabe la directamente con ellos en la optimización de sus redes y
necesidad de abordar soluciones prácticas”. sistemas teniendo en cuenta sus necesidades de tráfico,
transacciones, almacenamiento e incidencias según la
estrategia de uso. Al no estar en España orientados al
mercado residencial, y a pesar de que el volumen de datos
“Big Data trae un cambio en los modelos
que se generan es enorme y sigue creciendo, BT continúa
de gestión de las organizaciones que ahora
en disposición de manejar la información de sus clientes
pasarían a ser compañías que toman sus
con un mayor grado de personalización”.
decisiones basándose en lo que les dicen
los datos. Los egos corporativos se diluyen. Continuando en el segmento de las telecomunicaciones,
Las decisiones tienen que venir avaladas por el 1004 de Telefónica es un ejemplo concreto de prácticas
datos que las justifiquen y esto es un cambio de Big Data a través de modelos predictivos. Durante
de mentalidad importante” una jornada de difusión del concepto organizada en
ESADE Por Bayes Forescast bajo el epígrafe “Big Data y
Jaime García Cantero, modelos de predicción en marketing y operaciones”, el
analista independiente Gerente de Atención al Cliente en Telefónica, Javier Falcó,
compartió la experiencia de su organización explotando
sus datos y utilizando modelos de predicción que ayudan
Para Lledó, volumen, variedad y velocidad constituyen a diagnosticar, explicar y prever y que producen un
el algoritmo común que comparten las empresas para impacto muy positivo en la optimización de los procesos
enfrentarse a la gestión del ingente volumen de información productivos y en los ahorros de costes.
acumulado. “La búsqueda del difícil equilibrio entre
análisis y parálisis, es decir, qué y cuántos datos analizar En su ponencia Falcó explicó que el número de atención a
para obtener información de auténtico valor para la sus clientes, el conocido 1004, utiliza modelos predictivos
empresa, es el dilema al que se enfrentan. Y todo ello en para determinar el número de llamadas que recibirá el
mercados que cambian cada vez más rápidamente y con servicio cada vez que se lanza una campaña. Actualmente,
el 1004 realiza un plan de operaciones mensual y otro
trimestral y en enero de 2012 llegó a atender 14 millones
de llamadas.
“Para Telefónica, el 1004 ha sido siempre su canal
fundamental de ventas. Cada vez que se programa una
campaña, se invita a los posibles clientes a contratar el
servicio en el 1004 y los responsables de gestión tenemos
la responsabilidad de determinar los picos de llamadas,
de garantizar que un cliente va a ser atendido, de trabajar
junto al equipo de previsiones de cara a cumplir las
expectativas…En este punto, los modelos predictivos
resultan de una utilidad vital.”

“La valoración positiva del impacto en


el negocio vendrá determinada, como es
habitual, por el retorno de la inversión
estimada para proveer el servicio”

Manuel Gómez Burriel,


Sistemas Centrales de la Confederación
Española de Cajas de Ahorros (CECA)

Posteriormente, y de cara a los aspectos comerciales, se


miden los efectos de las acciones de marketing masivo
(prensa, televisión, sms, cartas, email … ), el marketing
de emisión (inbound o llamadas por efecto de la acción
comercial) y la factura.
En su intervención, Falcó también señaló que “una variable
muy interesante y necesaria es la del comportamiento del
cliente. No es lo mismo el comportamiento de un usuario
que ha comprado la promoción en una tienda, a través del
call center o a través de telemarketing de emisión. Es muy
importante identificar los patrones asociados al lugar y
momento donde se ha generado una venta”.
De la teoría a la práctica

BIG DATA EN LAS ORGANIZACIONES ESPAÑOLAS

Energía concentrada
El conocido como sector Utilities, generador y distribuidor “En un mercado desregulado hay que competir por los
de energías y servicios básicos (luz, gas, agua, gasolina, clientes. Hace unos años, el crecimiento de la construcción
petróleo) vive un momento marcado por tendencias como trajo en paralelo un incremento del despliegue de agua,
las Redes Inteligentes, el Smart Metering, la entrada energía, luz nueva, gas... Pero la fiesta se acabó y la
de nuevos actores y distribuidores en el mercado, la economía va para atrás. Ahora nos peleamos por los clientes
atomización de las operadoras y las inversiones congeladas. con compañeros como Endesa o Iberdrola y estamos
Esto se une a las propias tendencias del mercado de TI que obligados a ser más eficientes, a ser mejores”.
propone prácticas como Big Data, soluciones de movilidad
Para ello, Blesa entiende que es necesario optimizar las
y la convergencia de las tecnologías de la información con la
campañas que se lanzan desde Gas Natural/Fenosa: “hay
esencia del negocio.
que afinar la dirección de las acciones para calar mejor en
los públicos objetivos y obtener un mayor éxito: llegar con
la oferta adecuada, organizar campañas menos masivas y
más dirigidas a segmentos concretos. Esa es una demanda
“Big Data representa una vuelta a las viejas
del negocio y desde el punto de vista de sistemas tenemos
prácticas del mainframe. “Las estrategias
que proveer más información, en períodos mucho más
tecnológicas, como sabemos, son cíclicas
cortos. Se necesita información y se necesita para analizarla
y ahora toca consolidar. Particularmente,
YA.”
defiendo una posible inversión, aunque al
principio no veamos un impacto directo En el caso de su organización, Blesa comenta que se trata de
en el negocio. Su impacto sería más bien aprovechar la información de los clientes y sus patrones de
indirecto, de cara a minimizar los riesgos consumo pero que también es necesario incorporar fuentes
técnicos que tienen el hardware y software externas: información demográfica, geográfica-geodésica-
distribuido entre n-mil empresas” geoespacial, metereológica, de impacto medioambiental
y sin olvidar la influencia de las redes sociales en la
Mario Sanz Mayor,
reputación de la compañía.
Equipo de plataformas de Middleware de Barclays

“Big Data trae un cambio en los modelos


de gestión de las organizaciones que ahora
Como resultado del cruce de tendencias, las estrategias
pasarían a ser compañías que toman sus
tecnológicas del área Utilities enfatizan el uso de la
decisiones basándose en lo que les dicen
explotación de tecnologías de información geográfica que
los datos. Los egos corporativos se diluyen.
minimicen el impacto en el medio ambiente, la utilización
Las decisiones tienen que venir avaladas
de soluciones en la Nube y las capacidades ampliadas de
por datos que las justifiquen y esto es un
gestión de activos.
cambio de mentalidad importante”
Además, las compañías de energía asumen un riesgo Jaime García Cantero
importante: se trata de servicios básicos y el desprestigio de Analista independiente
imagen y de marca que se sucede a un mal servicio o a un
servicio caro es difícilmente recuperable.
“Hay muchas soluciones interesantes que estamos
Rafael Blesa, Responsable de Arquitectura y BI y de evaluando actualmente que espero nos ayuden. La barrera,
Gestión del Software SSII de Gas Natural/Fenosa, opina como casi siempre es el coste. Los proyectos no resultan
que disponer de información masiva permite prever mejor baratos y tenemos que estar seguros que la aplicación
dónde es necesario suministrar la energía y eso se traduce en justifica la inversión en un momento en que todo se
“ser más eficiente, más fiable y, en consecuencia, mejorar cuestiona”, concluye el Responsable de Arquitectura y BI
económicamente”. de Gas Natural/Fenosa.
Gran Consumo
También en la Jornada sobe Big Data y modelos predictivos el valor que verdaderamente tiene. Los modelos favorecen
aplicados al marketing y operaciones, Massimiliano la comunicación objetiva. Ya no se trata de decir: el año
Marinucci, Director de Marketing de Estrategia y pasado hizo calor y por eso vendimos más. Vamos a analizar
Productividad de Coca Cola compartió la experiencia de la el aumento de temperatura y lo vamos a cuantificar. Así se
que es, quizás, la marca global por excelencia con el uso de acaba con la diatriba tipo: fue el calor frente a no, fue mi
las técnicas predictivas a partir del análisis masivo de los marketing”.
datos.
Marinucci inició su intervención con una frase pronunciada “BT analiza los datos del tráfico de voz y
en 1887 por John Wanamaker, considerado el padre de la datos de sus clientes para dimensionar
publicidad moderna y pionero de las técnicas de marketing sus propias redes según la geografía y
: “Ya sé que la mitad del dinero que empleo en marketing la demanda de capacidad e incluso para
no tiene ningún efecto. El problema es que no sé de qué diseñar ofertas específicas. Este análisis, le
mitad se trata”. permite también la gestión idónea de las
Con ella, el directivo de Coca Cola pretendía enfatizar necesidades de sus clientes colaborando
la necesidad de entender de dónde vienen las ventas y directamente con ellos en la optimización
los factores que influyen en ellas en un deseo de prever, de sus redes y sistemas teniendo en cuenta
planificar y mejorar la productividad. En ese sentido, los sus necesidades de tráfico, transacciones,
modelos predictivos creados tanto globalmente como en almacenamiento e incidencias según la
nuestro país pueden considerarse un ejemplo de innovación estrategia de uso”
y desarrollo. Ana Lledó Tarradell,
“Nos interesa analizar los datos porque necesitamos directora de Productos y Diseño de Soluciones de BT España
entender, diagnosticar, saber de dónde vienen nuestras
ventas o los factores que han influido en ellas… Si
Para el directivo de Coca Cola un asunto importante es
añadimos la capacidad de previsión de los modelos a su
cómo se reciben estas prácticas de análisis extremo de datos
habilidad para entender lo que está pasando, el resultado
y aplicación de modelos predictivos. Según Marinucci el
es que los modelos también podrán utilizarse de cara a la
punto fundamental es que los altos cargos entiendan su
planificación. Otra razón más que potente para modelizar
beneficio y utilidad “que se den cuenta de que se trata de
es el dinero que invertimos en publicidad: Utilizamos los
una práctica que les va ayudar a tomar decisiones y a valorar
modelos para mejorar la productividad de nuestras acciones
los riesgos de cara al futuro”.
de marketing. A través de la diagnosis podemos mover los
recursos de un lado para otro según la productividad”.
Los modelos explican qué motivaciones influyen en el
negocio, de dónde vienen las ventas, cómo contribuye cada
elemento al crecimiento o a los volúmenes de venta por
año y, de ese modo pueden identificar cuál sería la inversión
óptima en acciones de marketing y publicitarias.
De modo muy gráfico, Marinucci relató que los modelos
generan controversia en los departamentos de marketing.
“Por ejemplo el hecho de demostrar que gran parte del
aumento de ventas no se debe al marketing sino a factores
externos como una mayor tasa de crecimiento de países en
vías de desarrollo. En ese sentido, los modelos ayudan a
redimensionar la aportación de cada elemento y a darle
Jaime García Cantero
Analista independiente
@jaimegcantero

BIG DATA: MUCHO MÁS QUE INFORMACIÓN


Transacciones financieras y ventas en tiempo real, medidas de sensores en las cadenas de
fabricación, localización de nuestra flota de distribución u opiniones de los clientes en las redes
sociales. Nuestras organizaciones manejan en la actualidad una cantidad ingente de información. Su
análisis hace posible una nueva manera de gestionar las organizaciones que el profesor del MIT Erik
Brynjolfsson define como DDD (Data Driven Decision) que permite a las organizaciones ganancias de
productividad de entre un 5 y un 6 % (Brynjolfsson, 2011).

Big Data, unánimemente incluida entre las UTILIDAD DE BIG DATA POR SECTORES
Datos de la economía estadounidense
tendencias del año por todos los analistas y El tamaño del círculo indica la contribución relativa al PIB
consultoras, es el conjunto de herramientas,
procesos y aptitudes que van a permitir Alto Utilities Servicios
Big Data: facilidad para capturar datos

Informática de consumo
sanitarios
la gestión de estas enormes cantidades de Recursos naturales
Información
información para mejorar los resultados
Fabricación Finanzas y seguros
de nuestras organizaciones. Sin duda el
impacto de Big Data y la complejidad de su Transportes
Servicios profesionales
implantación dependen en gran media de la Inmobiliarias
Industria alimentaria
organización concreta, pero prácticamente Gestión de empresas

todos los sectores pueden verse beneficiados Gran Consumo

como muestra la figura 1 en un ejercicio Construcción


Servicios administrativos
realizado por Mckinsey para el mercado de Retail
Sector Público
EEUU. Otros servicios

Servicios educativos

Arte y entretenimiento
Figura 1: Facilidad y Potencial de la
Bajo
implantación de Big Data en los diferentes Alto

sectores Big Data: valor potencial de utilización

La explosión de la información.
Un estudio de investigadores de La Universidad del Sur los caros, de los de 32GB) necesitaríamos 57.500 millones.
de California publicado en la revista Science en Mayo de Con ellos puestos unos al lado de otro formaríamos una
línea que daría 3 veces la vuelta al mundo y si tratáramos
2011, cifraba la información digital almacenada en el año
de apilarlos, la “montaña” resultante sería 25 veces más alta
2007 en todo el mundo en más de 276,000 millones de
que el monte Fuji.
Gigabites, unas 13,800 veces la información almacenada 20
años antes (Figura 2). Según este estudio menos del 9% de Estas magnitudes macro tienen su reflejo micro, y la
toda esa información está almacenada en servidores. Lejos información gestionada y almacenada por las organizaciones
de frenarse, este crecimiento sigue acelerándose y dicho también alcanza cifras espectaculares, Google procesa al día
estudio prevé que la información generada en 2020 sea 50 20 Petabytes de Información y el CERN en Ginebra genera
veces la originada en 2011. Fuentes menos académicas pero 40 terabytes por segundo. Pero no sólo estos gigantes
que dan cifras más actualizadas, como la consultora IDC manejan ingentes cantidades de información. Según la
cifran en 1,8 Zettabytes la información generada en 2011. consultora Mckinsey, en 15 de los 17 sectores económicos
Si tratáramos de almacenar esa información en Ipads (de analizados, la empresa americana media de más de 1.000
2007 ANALOGICO
18,86 Gigabytes
Papel, películas, cintas de música y vinilos: 6,2%
ANALOGICO
Cintas de vídeo analógicas: 93,8%

Otros medios digitales: 0,8%*


DIGITAL
Discos duros portátiles: 2,4%

CDs y Minidisks: 6,8%

Discos duros de servidores y mainframes: 8,9%

Cintas digitales: 11,8%

1986 ANALOGICO
2,62 Gigabytes

DVD/Blu-ray: 22,8%

DIGITAL
0,02 Gigabytes

POTENCIA DE COMPUTACIÓN
En 1986, las calculadoras de bolsillo recogían la mayor parte de la potencia de
procesamiento de datos mundial Discos duros de PC: 44,5%
Porcentaje de potencia de procesamiento disponible por dispositivo

Consolas de
Calculadoras Ordenadores personales videojuegos Servidores

41% 33% 9% 17%


*Tarjetas con chip integrado, tarjetas de memoria,
disquetes, cámaras de teléfonos móviles y PDAs,
66% 25% 3% 6% Superordenadores 0,3%
videojuegos
Teléfonos móviles, PDAs

2007 DIGITAL
Figura 2: La explosión de la información 276,12 Gigabytes

Mucho más que información


empleados almacena en sus bases de datos más de 235 Sin embargo la información no es la parte crítica en
Terabytes de capital informativo (cantidad de información el proceso de adopción de Big Data, casi todas las
almacenada en la biblioteca del congreso de los EEUU, organizaciones disponen ya de información suficiente o les
considerada una de las mayores del mundo). resultaría relativamente sencilla su captura. El problema
es la transformación organizacional y de los procesos y la
Pero esto sólo es el principio, la anunciada llegada de inteligencia de negocio que permita sacar conclusiones de
Internet de las cosas, en la que multitud de objetos esa información. En esto es crítico entender que el perfil
cotidianos están dotados de “ojos y orejas” que les de los usuarios de la información está cambiando. Si antes
permiten ser conscientes del entorno que les rodea esta parecía patrimonio de los departamentos financieros y
(context awareness), de su posición geográfica (location por supuesto del CIO, hoy son los directivos de marketing
awareness) y su entorno. Este entorno que distintos autores y operaciones quienes se están convirtiendo en los usuarios
denominan de formas diferentes: Web squared (O´Reilly, más intensivos de la misma. Por eso es fundamental
2009), Pervasive computing (Weiser, 1993) o Everyware para el éxito de las iniciativas de Big Data una buena
(Greenfield, 2006). Supone que el futuro de Internet es sincronía entre la capa de negocio y la infraestructura
su encuentro con el mundo real. Una ingente cantidad de tecnológica subyacente. Las TI son sin duda la herramienta
nueva información formará una piel digital que cubrirá imprescindible para llevar a cabo cualquier proyecto de Big
el mundo físico y abrirá nuevas oportunidades para Data pero es el conocimiento de negocio el que determinará
organizaciones privadas y públicas. el éxito de la misma.
Fran Rosillo
Experto en gestión de crisis
Director General
Aleph Comunicación
www.alephcom.es

BIG DATA,
METEOSAT DE LA GESTIÓN DE CRISIS
La capacidad de generar y difundir información de modo instantáneo se ha disparado especialmente
desde la llegada de los social media. Resulta muy difícil “gobernar” y canalizar las opiniones de
un público cada vez más amplio que se expresa libremente sobre cualquier asunto y difunde sus
valoraciones con una capacidad de influencia en aceleración constante.

¿Qué hacer desde las organizaciones para evitar que se produzcan crisis de reputación o de cualquier
clase? ¿Cómo volver en su favor el uso de las redes sociales analizando y valorando los datos que en
ellas se generan?

El mercado de las Tecnologías de la Información tiene un Además, tampoco se aprecia un decidido respaldo por
nuevo mantra: Big Data. Puede parecer increíble, pero se parte de algunos CEOs, que siguen reticentes con respecto
estima que el 90% de los datos mundiales se ha generado al valor que Big Data puede aportar a sus negocios.
en los últimos dos años. Además, el 80% de ellos no son Naturalmente, también ellos son conscientes de que la
estructurados, es decir, no están integrados en bases de popularidad de los social media y la multiplicación de
datos al uso, por lo que únicamente el 20% está disponible los dispositivos electrónicos han sido en buena parte
para ser analizado en sistemas tradicionales. responsables de esa masiva generación de datos que ha
provocado un cambio radical, dado que hoy en día –a
¿Cómo distinguir el polvo de la paja? diferencia de años atrás- tanto los consumidores como
¿Cómo identificar opiniones que pueden los negocios generan e interaccionan con información
llegar a tener influencia? dispar. Y sin embargo, aún no se atreven a apostar clara
y decididamente por un cambio de paradigma a nivel
Así pues, contamos con gran cantidad de información, tecnológico y estratégico.
enormemente valiosa, pero la gran mayoría de las
compañías –incluso las líderes- todavía no han articulado IDC prevé que en 2012 el volumen del contenido digital
sistemas punteros de gestión de información para llegará a alcanzar los 2,7 ZB, un 48% más que en 2011,
“cocinarla” y obtener sólidos puntales para la toma de cifra que en 2015 se disparará hasta los 8 ZB. Lo curioso
decisiones, puesto que sus tecnologías tradicionales de TI se es que la propia analista reconoce que estos datos están
quedan cortas. repletos de una valiosísima información, pero todavía
constituyen un reto que debemos comprender y analizar.
Todo el mundo opina
Aun así, en medio de este complejo contexto, en el que las que todas nuestras huellas y acciones en el mundo online
cifras ingentes llegan a escapar a nuestra comprensión, se pueden ser analizadas. Todo este volumen de información
siguen situando las personas. Sí, gente de carne y hueso, interconectado, analizado y explotado proporciona un
que vive, lucha, ama, tiene hijos, celebra cumpleaños, visita detalle nunca antes imaginado.
otros países, encuentra trabajo, lo pierde… y consume
millones de productos a lo largo y ancho del planeta. Pero para poder gestionarlo debemos estar sumamente
preparados, porque a veces las señales que lanzan las redes
cuando algo no marcha bien se producen tenuemente y
Al igual que actualmente es más sencillo con la rapidez de un tweet; en cuestión de minutos la
difundir por cualquier confín del mundo chispa puede encenderse… y en apenas unas horas nos
un argumento, un rumor o una consigna, encontraríamos con una bonita crisis. ¿Cómo distinguir el
las actuales tecnologías proporcionan polvo de la paja? ¿Cómo identificar opiniones que pueden
las herramientas suficientes como para llegar a tener influencia?
detectarlos a tiempo y prepararse para el
Hoy más que nunca, las marcas no tienen el control sobre
“combate”. Todo es cuestión de clasificar,
los consumidores. Sólo cuando el compromiso es real y las
procesar, analizar y escuchar lo que nos dice
Big Data.

En una segunda fase, deberíamos ser capaces


Ahora más que nunca, estas personas expresan su opinión.
de identificar cuál fue el origen del problema,
No es que antes no la tuvieran; los libros de Historia
las áreas de la compañía implicadas, los
están repletos de las consecuencias de esos pareceres. La
fallos cometidos y qué puntos débiles tenía
diferencia es que ahora cuentan con medios fáciles, baratos,
nuestra estrategia. Para ello, una vez más, los
inmediatos y sumamente cómodos para expresarlas y
resultados procedentes del análisis de Big Data
difundirlas a nivel mundial.
equivaldrían a oro puro.
Habrá quien piense que esto provoca las crisis, pero no es
del todo cierto. Revoluciones, manifestaciones, caídas en
desgracia, derrocamientos, modas, rumores y cambios de tecnologías las adecuadas pueden las empresas identificar
tendencia en la opinión pública han sido una constante sus errores y reaccionar a tiempo, al igual que cuando el
desde que el hombre es hombre, lo que ocurre es que hoy hombre del tiempo anuncia lluvias torrenciales la gente
todo eso sucede instantáneamente. prepara sus casas. Es entonces cuando podríamos ser capaces
de atajar un rumor incipiente, o responder a una queja
Ahora bien, también los gestores de las crisis contamos que tiene razón de ser, es decir, gestionar adecuadamente
con la misma ventaja que sus protagonistas o impulsores. una crisis en las redes sociales y además apuntarla en
Al igual que actualmente es más sencillo difundir por nuestro haber: sumar puntos para la marca en términos de
cualquier confín del mundo un argumento, un rumor o confianza, en definitiva.
una consigna, las actuales tecnologías proporcionan las
herramientas suficientes como para detectarlos a tiempo y De cualquier modo, nuestro trabajo no habría acabado.
prepararse para el “combate”. Todo es cuestión de clasificar, Comenzaría una segunda fase, en la que deberíamos ser
procesar, analizar y escuchar lo que nos dice Big Data. capaces de identificar cuál fue el origen del problema, las
áreas de la compañía implicadas, los fallos cometidos y qué
El abanico de posibilidades que se abre es prácticamente puntos débiles tenía nuestra estrategia. Para ello, una vez
inimaginable y su origen es la digitalización de la más, los resultados procedentes del análisis de Big Data
información y la trazabilidad digital, porque no olvidemos equivaldrían a oro puro.
ENTREVISTA

Andrew Sutherland,
Vicepresidente Senior de Tecnología para
Europa, Oriente Medio y África de Oracle

“Big Data es el vigía capaz de optimizar los procesos de una


organización al estar pendiente y vigilante de los cambios de
tendencia”

¿Qué diferencias o matices hay entre Big Data y otras


prácticas consolidadas como el data warehouse, la
inteligencia de negocio, las herramientas estadísticas o
los sistemas de gestión de relación con los clientes…?
Históricamente, en la primera generación de las
aplicaciones de negocio las soluciones estaban muy
¿Por qué The Beatles tuvieron tanto éxito y tan
centradas en la automatización de los procesos. En la
rápido? Tras años de Beatlemanía, Beatlelogía y
segunda generación, la inquietud iba por otro lado. No
páginas y páginas escritas sobre la clave del fenómeno
se trata sólo de automatizar procesos, sino también de
de los cuatro de Liverpool parece que todo puede
encontrar el modo de automatizar los cambios en los
destilarse en una premisa bien simple: el éxito de los
procesos: la flexibilidad era la clave. Los procesos cambian,
Beatles era que estaban tan cerca de su público, que
evolucionan, es fundamental entender esto.
el reflejo y la identificación era inmediato. ¿Cómo
pueden las organizaciones estar cerca de su público-
audiencia-consumidor-ciudadano? Según Andrew “Hay que conocer la realidad del cliente. Big
Sutherland, Vicepresidente Senior de Tecnología para Data permite hacer ajustes a los procesos,
Europa, Oriente Medio y África de Oracle, Big Data que no son inamovibles, ya lo estamos
tiene la respuesta. Sólo hay que encontrar el camino viendo, y obtener mayores beneficios en el
adecuado, despejar la maleza, ver el bosque y cada negocio”
árbol, cada rama, cada hoja y saber interpretar qué
significa. ¿Big Data aporta la visión sobre cómo podrían cambiar esos
procesos a raíz de los indicios que están recogiéndose de la
¿Qué beneficios puede aportar Big Data a las realidad?
organizaciones?
Efectivamente. Valora la dirección a la que nos dirigimos
Si uno entiende la utilidad de las aplicaciones de negocio, y ayuda a reconducir el rumbo si fuera necesario. Es el
entiende entonces los beneficios de Big Data. Básicamente vigía capaz de optimizar los procesos de una organización
hablamos de una práctica que aspira a añadir valor de forma al estar pendiente y vigilante de los cambios de tendencia.
rápida a una organización, encontrando las oportunidades Algo de lo que somos muy conscientes es que ya pasaron
de nuevas fuentes de ingresos. Cuando le das valor de los días de la cultura del puro producto en una dirección.
negocio a los proyectos de TI, todo el mundo gana. Se Hay que conocer la realidad del cliente. Big Data permite
obtienen ventajas competitivas, se incrementan las ventas, hacer ajustes a los procesos, que no son inamovibles, ya lo
se aumenta la sabiduría corporativa, la inteligencia estamos viendo, y obtener mayores beneficios en el negocio.
colectiva. Eso es siempre bueno.
LA ESTRATEGIA DE ORACLE EN BIG DATA
Sistemas preconstruidos con hardware,
software y comunicaciones integrados
que se puedan conectar directamente.
El Big Data Appliance es el ejemplo más
representativo.
Herramientas de productividad y de
desarrollo alrededor de creaciones
OpenSource como Hadoop o MapReduce.
La conexión con los sistemas tradicionales
es fundamental. Oracle ofrece conectores
que automatizan las transformaciones
necesarias para procesar la información
en origen, dotando de la estructura
necesaria a la parte que se desea integrar
con la informática tradicional.

¿Funciona de manera proactiva-positiva o sólo sirve ¿Qué ofrece Oracle alrededor de Big Data?
para corregir?
Nuestra estrategia se apoya en tres aspectos. El primero
Big Data ofrece la posibilidad de analizar con mayor es ofrecer sistemas preconstruidos con hardware, software
precisión lo que está cambiando. Tiene valor predictivo, y comunicaciones integrados que se puedan conectar
de identificador de tendencias y desviaciones de lo que directamente. El Big Data Appliance es el ejemplo más
se daba por bueno. Va a un nivel intenso y profundo representativo. En segundo lugar, ofrecemos herramientas
de granularidad en el entendimiento de nuestras de productividad y de desarrollo alrededor de creaciones
organizaciones. Es análisis extremo. OpenSource como Hadoop o MapReduce. Muchas de
las empresas Fortune 500 quieren adoptar la tecnología
OpenSource porque es buena, está muy probada, no tiene
“Big Data ofrece la posibilidad de analizar coste y es muy escalable, pero no quieren hacerlo sin un
con mayor precisión lo que está cambiando. soporte de tipo empresarial, sin un gran sponsor detrás.
Tiene valor predictivo, de identificador de Cuando se deciden las arquitecturas corporativas los
tendencias y desviaciones de lo que se daba clientes esperan una lógica de distribución, mecanismos de
por bueno. Va a un nivel intenso y profundo soporte bien establecidos. El elemento de soporte es crítico,
de granularidad en el entendimiento de la integridad de la distribución es básica. En el caso de Big
nuestras organizaciones. Es análisis extremo” Data las mejores herramientas (Hadoop, MapReduce…)
para el manejo masivo de información ya existen en clave
OpenSource y junto a Cloudera, la principal empresa que se
¿Por qué llamamos datos no estructurados a los dedica a soluciones Big Data basadas en Hadoop, vamos a
que provienen de nuevas fuentes y canales si están ofrecer nuestra garantía de continuidad y soporte.
perfectamente estructurados en sí mismos?
En tercer y último lugar, la conexión con los sistemas
No se trata tanto de una cualidad de los propios datos tradicionales es fundamental. Para ello Oracle ofrece
sino del método que usamos para analizarlos. Un dato es conectores que automatizan las transformaciones necesarias
estructurado porque la manera de capturarlo, almacenarlo, para procesar la información en origen, dotando de la
organizarlo y analizarlo cumple unos parámetros estructura necesaria a la parte que se desea integrar con la
estructurados, concretos, alineados con unas prácticas informática tradicional.
contrastadas, validadas y automatizadas. Los datos no
estructurados relacionados con Big Data se denominan así
porque la forma de gestionarlos y obtener valor de ellos no
responde a un patrón tan rígido en términos de estructura,
ordenamiento y seguridad.
Big Data y su impacto en el negocio
Una aproximación al valor que el análisis
extremo de datos aporta a las organizaciones

Mayo 2012 Oracle is committed to developing practices and products that help protect the environment
Autor: Ana García Huerta Copyright © 2012, Oracle and/or its affiliates. All rights reserved. This document is provided for information
Diseño e ilustraciones: Iván Ordás Ayuga purposes only and the contents hereof are subject to change without notice. This document is not warranted
Oracle España to be error-free, nor subject to any other warranties or conditions, whether expressed orally or implied in
C/ José Echegaray 6B law, including implied warranties and conditions of merchantability or fitness for a particular purpose. We
Las Rozas specifically disclaim any liability with respect to this document and no contractual obligations are formed
28230 Madrid either directly or indirectly by this document. This document may not be reproduced or transmitted in any
form or by any means, electronic or mechanical, for any purpose, without our prior written permission.
Telf. 900992922 | 900952900 Oracle is a registered trademark of Oracle Corporation and/or its affiliates. Other names may be trademarks
http://www.oracle.com/bigdata of their respective owners.

S-ar putea să vă placă și