Sunteți pe pagina 1din 14

Curso prctico

Big Data y
Data Analytics
QUE ES BIG DATA?
En la actual era digital, hay una explosin de datos por todas partes. Google
procesa ms de 24 PetaBytes de datos por da, casi 300 billones de emails y una
cantidad similar de tweets se envan diariamente. Trillones de sensores se
comunican cada da alimentando el Internet de las Cosas (IoT) con datos en
tiempo real. Cmo se estn utilizando estos datos? Big Data ha llegado como el
siguiente boom tecnolgico y es considerado el mayor desarrollo desde el
advenimiento de Internet, con la promesa de revolucionar el mundo de las
Tecnologas de la Informacin y nuestro diario vivir.

Big Data es un trmino que describe un gran volumen de datos - tanto


estructurados como no estructurados - que inundan diariamente un negocio.
Pero no es la cantidad de datos lo que es importante. Es lo que hacen las
organizaciones con los datos lo que importa. Grandes volmenes de datos
pueden ser analizados para obtener resultados que conducen a mejores
decisiones y movimientos estratgicos de negocio.

Entender el concepto y saber cmo almacenar, procesar,


analizar y visualizar grandes cantidades de datos, es clave como
primer paso hacia la evolucin de ciudades inteligentes. El
objetivo de este curso es proveer una visin global de Big Data y
las herramientas que permitirn a profesionales y a las
empresas, dar sus primeros pasos hacia la adopcin y el
desarrollo de las tecnologas y las aplicaciones del futuro.

Objetivo del curso


El curso tiene como objetivo introducir a los participantes a los
conceptos y fundamentos de Big Data mediante el uso de
herramientas y tcnicas para almacenar, procesar, analizar y
finalmente visualizar grandes volmenes de datos.
2
Objetivos especficos
Entender los conceptos y fundamentos de Big Data
mediante un anlisis global de las motivaciones,
procedimientos, problemticas y soluciones tecnolgicas
aplicables a casos de uso reales en todo su ciclo de vida.

Adquirir un conocimiento y manejo general de


herramientas para el anlisis y procesamiento de
datos de manera sencilla, por medio de lenguajes
de programacin comnmente utilizados en
Ciencias de Datos como Python, R, C++ y
herramientas de procesamiento distribuido como
Apache Hadoop y Elasticsearch.

Explorar y utilizar herramientas para el almacenamiento,


procesamiento, anlisis y visualizacin de grandes volmenes de
datos a travs de talleres prcticos, discusiones, tutoriales y
showcases (demostraciones en vivo) con casos de uso y ejemplos de
la vida real.
Tener una visin global de las tcnicas de optimizacin de algoritmos tpicamente
utilizados como parte de una solucin de Big Data, por medio de ejemplos y ejercicios
prcticos que demuestran su usabilidad.

Desarrollar un proyecto (caso de uso real) en el que pondr en prctica los


conocimientos adquiridos en el curso, mediante la construccin de una solucin
de BigData aplicada a una problemtica propuesta por el participante.

3
Requerimientos del participante
Certificacin:
Conceptos bsicos de programacin
Este curso servir como Conceptos bsicos de Bases de Datos
preparacin para la Actitud para aprender a utilizar nuevas
Certificacin como Big herramientas tecnolgicas y usar herramientas
Data Professional o Big de vanguardia.
Data Science
Professional a travs
del Big Data Science
School.
Pblico objetivo
Estudiantes y Profesionales de las siguientes
reas:
- Tecnologas de la Informacin y Comunicacin
- Ing. De Sistemas
- Ing. Civil
- Ing. Elctrica y Electrnica
- Ing. en Telecomunicaciones
- Ing. Comercial y Negocios
www.bigdatascienceschool.com - Cientficos de Datos
- Matemticos y/o Estadsticos
- Periodismo
- Inteligencia de Negocios

Empresas Privadas o Pblicas.


Personas desarrollando proyectos de tipo
Startups

4
Contenido
1. PARTE I: Introduccin

En esta parte, hablaremos sobre generalidades y la importancia


de Big Data en las organizaciones y en las Tecnologas de
Informacin en la Actualidad.

2. PARTE II: Los Fundamentos de Big Data.

CAPITULO 1: Entendiendo Big Data

Proporciona una idea de los conceptos clave y la terminologa


que definen la esencia misma de grandes volmenes de datos
y la promesa que tiene para ofrecer ideas de negocios
sofisticados.

Se abordarn los siguientes temas:

- Conceptos y terminologa
- Datasets (conjunto de datos)
- Anlisis y Analtica de datos
- Inteligencia de negocios (BI)
- Caractersticas de Big Data
- Las 5 Vs de Big Data: Volumen, Velocidad,
Variedad, Veracidad y Valor.
- Diferentes tipos de datos

58
CAPITULO 2: Motivacin para el uso de Big Data

Trata de responder a la pregunta de por qu las empresas deben estar motivadas a adoptar
Big Data como consecuencia a los cambios que subyacen en el mundo del mercado y de
negocios.

Se abordarn los siguientes temas:

- Data Analytics y Data Science


- Redes sociales
- Comunidades y dispositivos Hyper-conectados
- Computacin en la nube
- Internet de las cosas (IoT)

CAPITULO 3: Consideraciones para la adopcin y planificacin


de Big Data

Muestra que la decisin de adoptar Big Data, debe tener en cuenta


muchas consideraciones tecnolgicas y de negocio. Del mismo modo, el
anlisis de ciclo de vida de grandes volmenes de datos impone
requisitos de procesamiento distintas.

Se abordarn los siguientes temas:

- Prerrequisitos de organizacin
- Captura de datos
- Privacidad y Seguridad
- Asistencia en tiempo real
- Distintos retos en performance
- Nubes
- El Ciclo de vida de Big Data

6
CAPITULO 4: Tecnologas de la Empresa y Big Data
Business Intelligence

Examina los enfoques actuales de almacenamiento de datos


empresariales e inteligencia de negocios. A continuacin, se ampla
esta nocin para demostrar que los recursos de almacenamiento y
anlisis de Big Data se pueden utilizar en combinacin con
herramientas de supervisin del rendimiento corporativo para
ampliar las capacidades analticas de la empresa y profundizar los
conocimientos entregados por la inteligencia de negocios.

3. PARTE III: Almacenando y Analizando Big Data

En esta parte se analizarn conceptos fundamentales y aspectos que


deben tomarse en cuenta para el almacenaje, procesamiento, anlisis
y uso de herramientas tecnolgicas que nos ayudarn a trabajar con
Big Data. Se realizarn demostraciones prcticas y se revisarn casos
de uso de ejemplo para entender cada uno de los siguientes temas:

CAPITULO 5 y 7: Conceptos y Tecnologas de Almacenaje

El captulo 5 aborda los fundamentos tcnicos y metodologas para almacenar grandes


volmenes de datos. En esta parte el estudiante llevar a cabo prcticas en las que ser capaz
de empezar a trabajar con herramientas noSQL (Not only SQL), tpicas de ambientes y
soluciones de Big Data.

CAPITULO 6: Conceptos de Procesamiento

En esta parte el estudiante podr comprender las tcnicas y conceptos bsicos que deben se
reconsiderados cuando se empieza a procesar grandes cantidades de Datos. Esto tpicamente
se resuelve a travs de un procesamiento de tipo distribuido. En la prctica el estudiante
explorar algunos algoritmos y frameworks de programacin como MapReduce, as como
tambin ejecutar talleres prcticos utilizando herramientas muy conocidas en el rea de Data
Analytics como Apache Hadoop.

7
CAPITULO 8: Tcnicas de Anlisis y Visualizacin

El estudiante en este punto adquirir destreza en el manejo de herramientas como


ElasticSearch y Kibana, mismas que sirven de apoyo en el anlisis de datos en sistemas
distribuidos, de igual manera se exploran algunas tcnicas de anlisis de texto utilizando
algoritmos de Machine Learning, anlisis cualitativo y cuantitativo y muchos ms.

4. PARTE IV: Aspectos de Optimizacin

En esta parte del curso nos enfocaremos en analizar aspectos de


optimizacin, que son muy importantes al momento de procesar grandes
datasets. Se pueden aprovechar las capacidades computacionales de los
computadores (o supercomutadores) para procesar y analizar grandes
volmenes de datos en tiempos ptimos, a travs de la paralelizacin de
nuestros algortimos generalmente en ambientes distribuidos configurados
en la Nube.

8
CAPITULO 9: Computacin Paralela y Computacin
de Alto rendimiento (HPC)

El captulo 9 trata acerca de dos temas fundamentales en


el desarrollo de aplicaciones cientficas. Muchas de ellas
relacionadas con las Ciencias de la Vida (Molecular
Dynamics, Drug Docking, Image Processing, etc). Se
abordan aspectos de optimizacin que permitirn que
nuestros algoritmos de anlisis y procesamiento puedan
ejecutarse en tiempos ms cortos aprovechando al
mximo nuestros recursos computacionales a travs de la
computacin Paralela y la computacin de Alto
rendimiento.

CAPITULO 10: Computacin en la Nube

En este captulo el estudiante ser capaz de introducirse en el mundo de


la Computacin en la Nube. Se analizan los distintos modelos de Nubes
que se ofrecen y se exploran las alternativas Comerciales que
actualmente son ms utilizadas como: Microsoft Azure, Google Cloud,
Amazon y NeCTAR.

9
5. PARTE V: Mejores Prcticas y Open Data (Datos Abiertos)

La parte final, trata acerca de las mejores prcticas para Big Data. Se analizan los factores que
influyen en el fracaso y el xito en la implementacin de proyectos que a su vez involucran un
cambio de mentalidad con miras hacia el procesamiento y anlisis de grandes volmenes de
datos. Adems se aborda un tema trascendental que es el habilitador de este tipo de proyectos,
esto es Datos Abiertos (Open Data). Analizaremos la importancia que tiene poner datos a
disposicin del pblico libremente, con un beneficio a nivel organizacional, gubernamental y social.

Metodologa

La parte terica del curso est enfocada mayormente en la preparacin


para los exmenes de Certificacin avalados por Pearson Vue, de la
academia Big Data Science School. Actualmente este curso es el nico
dictado y preparado en espaol en el pas y a nivel de Latinoamrica, sin
embargo el participante deber repasar el contenido en ingls, para que
posteriormente pueda acceder a los exmenes en este mismo idioma.

Adicionalmente, durante el curso el participante ser capaz de poner en


prctica sus conocimientos a travs de talleres grupales en donde
analizarn casos de uso generalmente aplicados a la realidad de su
ambiente profesional y laboral. Conforme se avanza en los captulos, se
realizarn talleres prcticos de lenguajes de programacin cientficos
como: Python, R y C++, que servirn como herramientas para analizar y
procesar Big Data ms adelante. Finalmente, los estudiantes propondrn
un tema de proyecto grupal en el que aplicarn todo el ciclo de vida de
Big Data y en el que sern capaces de abordar y solucionar las
problemticas implicadas en la adopcin e implementacin de una
solucin de Big Data y Data Analytics.

10
Material para los participantes
Mquina virtual (Ubuntu 14.04) con todas las
herramientas configuradas y ejemplos listos para ser
probados.
Presentaciones en PDF
Material audiovisual (videos, entrevistas, etc.)
Libro en PDF (Traduccin de Libro Big Data
Fundamentals y material recopilado de diversas
fuentes)
Tutoriales en PDF (Parte prctica del curso)
Scripts, programas e instaladores correspondientes
a la parte prctica del curso.
Datasets y archivos de texto a ser analizados. (Parte
prctica)
Acceso a publicaciones e informacin adicional de
diversas fuentes.

Detalles del curso


Duracin: 70hrs.

Modalidades:
1. Lunes a Viernes (7 semanas), desde el 25 de Abril (7:00 a 9:00)
2. Sbados (12 sesiones), desde el 23 de Abril (8:00 a 14:00)

Evaluacin:
Se evaluarn casos de uso en clase y la ejecucin de un proyecto final que se realizar
en la parte final del curso, bajo la supervisin de los Instructores.

Aprobacin del Curso: Asistencia mnima: 80% y proyecto final: 80%


Lugar: Facultad de Sistemas - EPN 11
Inversin
La inversin en el curso es de $450 (incluido impuestos).

Instructores

Ing. Diego Montfar, MiT

Co-fundador y Director Ejecutivo de Handytec S.A, Ing. de Sistemas graduado


en la Universidad de Cuenca quin luego obtuvo el grado de Master of
Information Technology en la Universidad de Melbourne, Australia. Experto en
computacin de alto rendimiento (HPC), computacin distribuida y en la Nube.
Posee experiencia en el desarrollo de aplicaciones mviles multiplataforma y la
implementacin de arquitecturas en Sistemas distribuidos. Su principal objetivo
es liderar los proyectos de innovacin a nivel Nacional e Internacional, as mismo
introducir y fomentar el uso de nuevas tecnologas dentro y fuera del pas.

Ing. Juan Pablo Zaldumbide, MsC

Ing. de Sistemas, con Maestra en Gerencia de Sistemas de la


Informacin, con amplia exeriencia laboral en empresas privadas y
pblicas dentro del Pas. Obtuvo el grado de Master of Science en
la Universidad de Melbourne, Australia. Experto en anlisis y
procesamiento de BigData, Ciencia de Datos, Anlisis de Big Data,
Aplicaciones para E-health y Computacin en la Nube.

Inscripciones
Las inscripciones se realizan a traves de este Formulario

12
Certificacin

Al final del curso el Participante recibir un certificado


de aprobacin, avalado por la Escuela Politcnica
Nacional, en conjunto con la empresa pblica EPN
TECH EP, la Facultad de Sistemas (FIS-EPN) y
Handytec S.A.

Formas de pago
La forma de pago es a travs de depsito o
transferencia bancaria.

Por favor, realice la transaccin a la cuenta:

1.- Empresa pblica EPN-TECH EP.


Ruc. 1768179760001
Cuenta corriente. N. 7624034
Banco Pacifico
Sublinea: 130108

2.- Para Instituciones Pblicas


Cuenta corriente N. 1127558
Banco Central del Ecuador

Polticas de inscripciones y cancelaciones


*Una vez realizado el pago, solicitamos nos enven una copia de la transaccin al correo nmena@tech.epn.edu.ec para formalizar el
trmite de inscripcin.
** En caso de que el participante deponga su participacin luego de iniciado el curso, no existir devolucin del valor cancelado.
*** En caso de que el participante deponga de su participacin antes del inicio del curso, se realizar la devolucin con un cargo del 10%
por gastos administrativos.
**** El cupo mnimo para cada modalidad del curso son 18 participantes, en caso de que no se llenen los cupos, las fechas estarn
sujetas a un cambio de acuerdo a lo que resuelva la parte de la organizacin del curso, misma que ser notificada a los participantes con
anticipacin. 13
Contacto
Lic. Carla Cisneros
Gerente Comercial, Handytecmobi S.A
Email: carla.cisneros@handytec.mobi
Cel. 0995168566

Ing. Diego Montfar, MiT


Director Ejecutivo, Handytecmobi S.A
Email: diego.montufar@handytec.mobi
Cel. 0995030269

Handytecmobi S.A
www.handytec.mobi
contact@handytec.mobi

Inscripciones y pagos
Nadia Mena
Jefe Financiero, EPN Tech EP
Email: nmena@tech.epn.edu.ec
Telf. 2976300, ext. 6101

Organizan

14

S-ar putea să vă placă și