Sunteți pe pagina 1din 30

CONGRESO DE

ESTUDIANTES DE
INGENIERIA
QUIMICA

BIG DATA / DATA


ANALYTICS in Chemical
Engineering
Agenda

Big Data
Data Analytics

Logstica de Entrada

Yvn Garca
2
Big Data & Business Analytics

Yvn Garca
3
TSUNAMI QUE SE NOS VIENE....

N
O
T
I
C
I
A AREA X (Especial para Urgente24) La semana pasada, dos terremotos registrados con menos de 15

S
horas de diferencia se dejaron sentir de manera notable en la comarca de la Baha de Cdiz (sur de
Espaa), aunque sin causar daos personales ni materiales. El sesmo que fue ms perceptible fue el
segundo de la serie, que tuvo lugar a las 14:28 de ayer y que origin ms de 40 llamadas telefnicas al
servicio de Emergencias del 112 por parte de ciudadanos alertados por el movimiento telrico. El terremoto
anterior, que tuvo lugar minutos antes de la medianoche del martes, fue sentido sobre todo en la localidad
de Puerto Real. Yvn Garca
INGENIERA
4 DE LA INFORMACIN EN LA PACFICO
TSUNAMI DE DATOS

Yvn Garca
INGENIERA
5 DE LA INFORMACIN EN LA PACFICO
Valor de la Data
En un reciente Frum econmico mundial se reporto que la data declarada
es un nueva clase activo econmico, como la moneda o los datos son oro,
y como oro debera ser minado en el orden de crear valor.

Johnny Garca
Gerente Central de Tecnologas de la Informacin

"Cada accin que realizamos y cada decisin que tomamos en las


empresas requiere y utiliza informacin. Los futuros ingenieros deben
comprender que los datos es el activo vital de una empresa y se genera
valor a partir de este importante recurso corporativo. Los datos es el
petrleo del futuro
Yvn Garca
6
Profesores de Ingeniera Qumica & Ciencias
de la Computacin usan Big Data para disear
Nano-materiales
Gracias a una subvencin de $ 1,4 MM de 03 aos del
Departamento de Energa de EE.UU., Sanat Kumar,
Profesor y Head of Department de Ingeniera Qumica y
Venkat Venkatasubramanian, Samuel Ruben-Peter G.
Viele profesores de Ingeniera y Michael Collins, Vikram
S. Pandit Profesor de Ciencias de la Computacin, estn
aplicando los conceptos y tcnicas de BIG DATA para
descubrir y disear nuevos nano-materiales
usando una metodologa que podra revolucionar el
diseo de los materiales.
Yvn Garca
7
Comparacin de los Paradigmas convencionales y
Propuestos

Yvn Garca
8
El Big Bang de la Analtica
El Anlisis Predictivo alcanza la masa critica del Big Intercambios en Analtica que
- R versiones 1.0 permitan colaboracin global con
Data y nuevas tecnologas aparecen:
- Estndares de Procesamiento de Analtica Anticipatoria
Lenguaje Natural
- Apache Hadoop

- Analtica en Tiempo Real


- Analtica Prescriptiva Cualquier
+ persona

- Programacin no-lineal
- Resolucin de problemas Expertos en Analtica & Pequeas
heursticos
- Simulacin Basados en Computador Empresas
Montecarlo Acelera Innovacin de
- Modelos de Analtica
Redes 2000-2009 produccin de la
neuronales + versin R lenguaje para software de
Analtica crece de 0 a 1000 MM
- usuarios
Programacin Compras! Compras!,
lineal
Compras!
Estadstica

+ Negocios Medianos 2000-2012 el mercado de software


& de analtica crece de 11 billones a
Desarrollo 35 Billones de US$.
Tecnologa. Posicin de Trabajo mas Sexy
Corporaciones & del Siglo 21
Institutos de Del 2011-2012 se notifican mas
Agencias de Investigacin 15,000%
s

Gobierno
Siglo
19 1930s-40s 1950s-60s 1970s-90s 2000s al Presente Prximamente

Yvn Garca
9
Porque las Organizaciones deberan
cuidar la orientacin de sus datos en la
toma de decisiones?
Prof. Brynjolfsson (MIT) estudi 179
grandes compaas y encontr que estas
adoptaron la toma de decisiones en el
data-driven decision making alcanzando
ganancia de productividad que fue del 56%
mas alto de aquellas compaas que no lo
hicieron.

Yvn Garca
10
Yvn Garca
11
Con una demanda,
de mas 15,000% de
puestos de trabajo
notificados entre
2011-2012 en los
Estados Unidos
las organizaciones no tienen ms excusas;
tienen que empezar a gestionar sus negocios
de una manera diferente, basndonos en sus
datos

Yvn Garca
12
EXPONENCIAL CRECIMIENTO DE LOS DATOS

Data No estructurada y deposito de contenidos

Data Estructurada y replicada

SOURCE: IDC DIGITAL UNIVERSE 2009: WHITE PAPER, SPONSORED BY EMC, 2009

Yvn Garca
13
MUCHOS PERO MUCHOS. DATOS

1.8
BYTES
(1.8 trilln gigabytes) de informacin fue
creada y replicada en el 2011 - creciendo rpidamente
(este crecimiento es dado en un factor de 9 veces los ltimos 5 aos)
Source: IDC-EMC2 -2013
(http://www.emc.com/leadership/programs/digital-universe.htm)
Yvn Garca
14
Menos de un 1/3 de la
informacin en el universo
digital puede decirse que tiene
1/3 al menos un mnimo de
seguridad o de proteccin.

1/2 Solamente la Mitad de


dicha informacin esta
protegida.

Source: IDC-EMC2 -2013 (http://www.emc.com/leadership/programs/digital-universe.htm)

Yvn Garca
INGENIERA
15 DE LA INFORMACIN EN LA PACFICO
LA DECADA DEL

1/6
2011, los costos de CRECIMIENTO DEL
crear, capturar,
gestionar y almacenar UNIVERSO DIGITAL
informacin bajaron a :

de lo que
fue
en el 2005 35 Zetabytes
- Dinero que se gasta para
crear, gestionar, almacenar y
se deriva para los ingresos
de la era digital

Desde 2005 las


inversiones de las
empresas en el Universo
Digital se increment en:
50%
4 Trillones
1.8 Zetabytes

130 Exabytes

2005 2011 2020


Source: IDC-EMC2 -2013
Yvn Garca
INGENIERA
16 DE LA INFORMACIN EN LA PACFICO
PARADOJA DEL UNIVERSO DIGITAL

MUCHOS DATOS
Los Costos de
almacenamiento
estn cayendo
pero las inversiones
van en aumento
por el uso intensivo
de la Tecnologa

Source: IDC-EMC2 -2013 (http://www.emc.com/leadership/programs/digital-universe.htm)

Yvn Garca
INGENIERA
17 DE LA INFORMACIN EN LA PACFICO
DE DONDE ESTAN VINIENDO TODOS LOS DATOS?

Fuente: IBM 2013


Yvn Garca
18
CRECIMIENTO DE LAS REDES SOCIALES

MUCHOS DATOS

Redes Sociales 2500 MM Redes Sociales Chinas 1,100 MM

Yvn Garca
INGENIERA
19 DE LA INFORMACIN EN LA PACFICO
2013 (( ))
i REDES SOCIALES SUMAN + 3 MIL MILLONES

1100 106
0
1000
900 800
800
700
600
500
500
400 362
300
200
200 162
100 25 75
0
Pinterest Flickr & Badoo LinkedIn Google + Twitter YouTube Facebook
& TripAdvisor
FourSquare

Yvn Garca
INGENIERA
20 DE LA INFORMACIN EN LA PACFICO
QUE MS SUCEDI, SUCEDE y SUCEDER

+ +
Data en muchas formas Datos a gran escala Datos en Movimiento

VARIEDAD VOLUMEN VELOCIDAD

2012: QQ y Sina weibo genero mas de 564 millones de usuarios en las redes sociales
chinas. (http://china.globalasia.com/topics-in-china/redes-sociales-en-china/ )
2013: EEUU lidera la adopcin del Big Data (68%), seguidas por Amrica Latina (51%),
Europa (45%) y Asia Pacfico (39%). (www.tcs.com/BigDataStudy)
2015: El 20% de la Organizaciones globales habrn establecido su foco estratgico en
Infraestructura de la Informacin (www.Gartner.com/DisplayDocument?docCode=245580&ref=g_fromdoc/Predicts 2013 Big Data
and Information Infrastructure

Yvn Garca
INGENIERA
21 DE LA INFORMACIN EN LA PACFICO
PORQUE TODO ESTO ES IMPORTANTE?

La informacin es el centro de la nueva


Ola de oportunidades
Las organizaciones necesitan
de una Visin mas Profunda

1 de 3 Lideres del negocio frecuentemente


toman decisiones basadas en informacin.
Velocidad
Variedad 1 de 2 Lideres del negocio dice que no
tiene acceso a la informacin, ellos
Volumen
necesitan hacer su propio trabajo.

El 90% de la data
es No
El 80% de CIOs citan la Inteligencia de
Estructurada negocios y la Analtica como parte de
sus planes visionarios para lograr
ventaja competitiva.
Fuente: IBM 2013
Yvn Garca Fuente: IBM 2013
22
UNA RELACION DESIGUAL DATOS vs. ESPECIALISTA DE LOS DATOS
MUCHOS DATOS
Durante la
siguiente
dcada, el nmero

75x
de los "archivos"
o las carpetas
que encapsulan
la informacin en
el universo digital Veces
.... crecer en un Mientras que el
grupo de
personas
Especialista de
los Datos
disponible a

Ligeramente 1.5x
gestionarlos
slo crecen en Veces

Source: IDC-EMC2 -2013


(http://www.emc.com/leadership/programs/digital-universe.htm)
Yvn Garca
23
GRANDES CORPORACIONES vs ESTRATEGIA DE LOS DATOS

La toma de conciencia de las grande empresas en las


inversiones que se hacen ms all de la Web

El Retail Sears aprovecha la Big Data para la optimizacin de


precios.
Firmas de de servicios financieros, incluyendo JPMC, Morgan
Stanley y BoA, anlisis de conducta de fraude, perfil de riesgo y
muchos ms.
Farmacuticas que incluyen fabricantes como Bristol Myers
Squibb utilizan la Big Data para apoyar el desarrollo de nuevos
frmacos.

Inversiones continan por los pioneros Web y la misma CIA

Solo Google gast $ 1b + en infraestructura en el Q4 -2012.


"Todo lo que hacemos es un problema de Big Data." - Jay Parikh, Vicepresidente
de Ingeniera de Facebook.
CIA : Nuestra misin es "recoger todo la informacin y quedarse con ella por
siempre, Ira Hunt, CTO
Yvn Garca
INGENIERA
24 DE LA INFORMACIN EN LA PACFICO
Caso Estudio: Netflix

Los pedidos en lnea y la entrega de CDs condujo a


la bancarrota a Blockbuster
Pero, el video remplazado por streaming remplazo a
los CDs
Netflixs en una historia de xitos

Cinematch de Netflix (motor de recomendacin)


recopila y analiza el comportamiento del televidente y las
preferencias para obtener informacin sobre el
contenido que va a vender.
Netflix es una "organizacin de aprendizaje continuo"

Yvn Garca
25
Herramientas Data Analytics
Data Mining
Modelamiento
Optimizacin
Correlaciones
Modelamiento Predictivo
Simulaciones
Experimentacin de Negocios

Yvn Garca
26
Analytics (Tom Davenport)

Los procesos de negocio son


algunos de los ltimos puntos
remanentes de diferenciacin...Y los
competidores analticos deben
exprimir hasta la ltima gota de valor
de esos procesos

Yvn Garca
27
Se necesita a un Especialista
en Datos y es gente escasa
capaz de comprender cmo
descubrir respuestas para las
preguntas mas importantes del
negocio, a partir del actual
tsunami de informacin No-
estructurada y presentarla y
explicarla adecuadamente.

Se necesita de un hbrido entre


un hacker de datos, el analista
de negocios, el comunicador, el
asesor, es un consultor en
tierra de nadie. (Davenport & Potil)
Yvn Garca
INGENIERA
28 DE LA INFORMACIN EN LA PACFICO
PREGUNTAS?

Yvn Garca
29
Gracias !!

Yvn Garca
30

S-ar putea să vă placă și