Sunteți pe pagina 1din 22

INSTITUTO UNIVERITARIO DE PUEBLA

ANTONIO ALVAREZ DE LA CRUZ


MAESTRO EN ADMINISTRACIÓN DE TECNOLOGÍA DE LA INFORMACIÓN
INGENIERO EN SISTEMAS COMPUTACIONALES

II FORO DE INGENIRIA 2017


RUMBO A LA INNOVACION TECNOLOGICA
¿En qué océano navega Big Data?

Actualmente, se generan muchos datos y las empresas exigen:

Saber no es sólo lo que sucede en la actualidad, sino también lo


que va a pasar en un futuro,
Requieren niveles de servicio mucho más exigentes que hace
unos años.

Es precisamente en esta tesitura donde se encuentra Big Data hoy día.


¿Qué es Big Data?

Big data es una colección de datos grande, complejos, muy difícil


de procesar a través de herramientas de gestión y procesamiento
de datos tradicionales.

¿Dónde esta la Clave:

La clave esta en “Big”

Porque las exigencias actuales no siempre están basadas en el


volumen, sino que éste es sólo una parte del rompecabezas, siendo
muy diversos los parámetros que se tienen en cuenta en cada
ocasión.

“Big Data” son datos cuyo volumen,


diversidad y complejidad requieren
nueva arquitectura, técnicas, algoritmos
y análisis para gestionar y extraer valor
y conocimiento oculto en ellos .
Las cuatro dimensiones de Big Data

Grandes
volúmenes
Volumen de datos.

Veracidad Big Velocidad


Data

La confianza y la Mover datos


integridad es un rápidamente
desafío y una necesidad
y es importante para Variedad
los grandes datos al
igual que para las BD Estructurados, no
relacionales estructurados,
tradicionales. imágenes, etc.
Crecimiento explosivo
¡¡Zettabyes!!
¿Qué es Big Data?

Big data es cualquier característica


sobre los datos que represente un reto
para las capacidades de un sistema.
¿Por qué es tan importante Big Data?
La importancia de Big Data radica que en que éste impacta tanto en la
industria, como en el negocio e incluso en nuestra sociedad y además
ofrece una ventaja competitiva considerable.
Cuatro fase para implementar una Solución de Big Data

1. Fase inicial - Estudio de viabilidad y propuesta de implementación


de la solución big data

2. Fase de planificación - determinación de los recursos


intervinientes.

3. Fase de diseño de la infraestructura de la solución – arquitectura.

4. Fase de implementación y puesta en marcha


1. Fase inicial - Estudio de viabilidad y propuesta de
implementación de la solución big data.
Hay que determinar que la implementación de una solución big data es
una alternativa realista y factible.

En esta etapa son fundamentales tres acciones:

• Detección de necesidades:
Estas necesidades suelen tener que ver con el volumen de datos a
almacenar, su variedad, la velocidad de recogida, almacenamiento y
procesamiento; y su escalabilidad horizontal.

• Justificación de la inversión:
Hacer posible la evolución y la innovación, en un entorno de más alto
rendimiento que a la vez consigue garantizar el ahorro de costes.

• Evaluación de limitaciones:
También hay que valorar las cuestiones legales, en especial en lo
concerniente a las exigencias en materia de privacidad de datos.
2. Fase de planificación - determinación de los recursos
intervinientes
Cada organización habrá de determinar el presupuesto destinado al
proyecto, que se establecerá en función de su capacidad económica y
necesidades.
Además, en esta fase hay que elaborar una planificación de los recursos que
intervendrán, de una forma u otra, en el proyecto:
• Gestores:
Sponsors, director de proyecto, coordinadores y gestores de calidad.

• Diseñadores y arquitectos de datos:

Perfiles muy técnicos y con una visión clara de los objetivos


del proyecto de implementación.

• Implementadores:
Analistas y desarrolladores, personal cualificado con conocimientos
en tecnología y en el negocio.

• Operadores de datos:
Tanto de entrada, como intermedios y de resultado.
3. Fase de diseño de la infraestructura de la solución - arquitectura
Partiendo del diseño más adecuado para cubrir las necesidades de la
organización, presentes y futuras, se ha de comenzar la construcción de
la arquitectura big data.

Esta fase consta de dos partes:

• Infraestructura:
Es el soporte físico de la solución y consta de elementos como
servidores, redes o equipos.

• Arquitectura:
Es su esqueleto lógico, que se compone de comunicaciones,
procedimientos y protocolos, entre otros.
4. Fase de implementación y puesta en marcha
En esta etapa se lleva a cabo el despliegue y se ponen en marcha la
gestión y gobierno de la solución.

La manera de proceder es la siguiente:


A) Instalación y puesta en marcha de la
infraestructura:
Servidores y sus componentes.

B) Implementación de la arquitectura:
Configurando la infraestructura para su correcto funcionamiento y
capacidad de interacción con los sistemas externos ya existentes en la
empresa (comunicación con orígenes de datos, destinos de datos y
herramientas de reporting).
C) Puesta en marcha operativa:
Ingesta, transformaciones de datos y
explotación de datos.
Recopilación de datos, análisis y agregación de valor

1. Recopilación de datos
La parte más importante de una solución big data son los datos que contiene.
Estos datos se transformarán en información y, mediante las técnicas
adecuadas serán capaces de proporcionar conocimiento.
Es entonces cuando se puede hablar de datos inteligentes.

Pero, para llegar hasta ese punto hay que seguir un proceso que
comienza por tres acciones:
A) Evaluación de datos:
Comienza por el estudio de la utilidad de los datos (valorando
especialmente si conviene incorporar los que no tienen una utilidad
inmediata); continúa con la evaluación de su volumen y frecuencia de
explotación y concluye con la definición de accesos y restricciones,
necesarios para proteger la información sensible.

B) Ingestión de datos para su explotación:


El núcleo de esta acción es la preparación y estandarización de los datos.

C) Gestión de datos:
En lo relativo a su visibilidad, disponibilidad, mantenimiento y seguridad.
2. Análisis
La analítica es la parte nuclear de una solución big data. Para llevarla a
cabo correctamente son necesarias dos acciones:
• Generar los cálculos que se esperan de la solución: diseñando los
algoritmos que se precisen.

• Detectar datos y correlaciones de interés: mediante la intervención


de especialistas que puedan descubrir tendencias, patrones,
oportunidades y/o amenazas tras los datos.
3. Agregación de valor
Partiendo del trabajo de los analistas en su investigación se pueden
elaborar conclusiones que permitan identificar nuevas vías de avance
para el negocio, fuente de innovación.
Además, el valor que encierran los datos se puede explotar también:
• Incorporando nuevos datos:
Autogenerados, ajenos a la solución o incluso provenientes del
exterior de la organización.
• Diseñando nuevos proyectos:
Para áreas distintas de la empresa o enfocados a clientes.
Estas iniciativas pueden resultar en el reemplazo de antiguas
tecnologías o en el acceso a resultados a distinto nivel, lo que
permitirían técnicas como el scoring de riesgos (especialmente
indicadas para los sectores de banca y seguros), el análisis de logs
(que hace posible un mejor control, optimización de la seguridad y
accesos o de el aumento de efectividad en la gestión de errores) o el
marketing personalizado (muy indicado para empresas del sector
retail).
• Explotando los resultados obtenidos
Enfocados a nuevas campañas de marketing.
Componentes que no pueden faltar en una solución big data
Para lograr experimentar todas estas ventajas es necesario que la solución big
data diseñada cuente, al menos, con los siguientes elementos:

1. Fuentes de big data:


Las fuentes más habituales son los registros históricos de la empresa, los
sistemas de gestión de datos, los almacenes de datos, dispositivos
inteligentes, internet y el internet de las cosas.

2. Capa de almacenamiento:
Se ocupa de la recogida y transformación de datos, pero ha de observar la
normativa aplicable al almacenamiento de los distintos tipos de datos.
3. Capa de análisis:
Se ocupa de leer los datos almacenados pero entre sus funciones puede
encontrarse el asumir la interacción directa con las fuentes origen de
datos.
4. Capa de consumo:
Procesos de negocio o usuarios finales se benefician del conocimiento
extraído del paso de los datos a través de la solución big data y derivado
de las aplicaciones de análisis.
https://www.youtube.com/watch?v=lRNTXWlNu4E
https://www.youtube.com/watch?v=j-0cUmUyb-Y
https://www.youtube.com/watch?v=mqMFMgVnRO8