Integracion de Datos PDF

Încărcat de

eder edison flores velasquez

0% au considerat acest document util (0 voturi)

65 vizualizări3 pagini

Titlu original

2. Integracion de Datos.pdf

Drepturi de autor

Formate disponibile

PDF, TXT sau citiți online pe Scribd

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Raportați acest document

Drepturi de autor:

Formate disponibile

Descărcați ca PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

0% au considerat acest document util (0 voturi)

65 vizualizări3 pagini

Integracion de Datos PDF

Încărcat de

eder edison flores velasquez

Drepturi de autor:

Formate disponibile

Descărcați ca PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

Salt la pagina

Sunteți pe pagina 1din 3

Căutați în document

Ejercicio 1: ingesta y consulta de

datos relacionales
En este escenario, la pregunta comercial de Dualcore es: ¿Qué productos les gusta
comprar a nuestros clientes? Para responder a esta pregunta, el primer pensamiento
podría ser mirar los datos de la transacción, que deberían indicar lo que los clientes
realmente compran y les gusta comprar, ¿verdad?
Esto es probablemente algo que puede hacer en su entorno RDBMS habitual, pero un
beneficio de Apache Hadoop es que puede hacerlo a mayor escala a un costo menor,
en el mismo sistema que también puede usar para muchos otros tipos de análisis.
Lo que demuestra este ejercicio es cómo hacer exactamente lo mismo que ya sabe
hacer, pero en CDH. La integración perfecta es importante al evaluar cualquier
infraestructura nueva. Por lo tanto, es importante poder hacer lo que normalmente
hace, y no interrumpir los informes de BI o las cargas de trabajo regulares sobre el
conjunto de datos que planea migrar.
Para analizar los datos de la transacción en la nueva plataforma, necesitamos
incorporarlos al Sistema de archivos distribuidos de Hadoop (HDFS). Necesitamos
encontrar una herramienta que transfiera fácilmente los datos estructurados de un
RDBMS a HDFS, mientras conserva la estructura. Eso nos permite consultar los datos,
pero no interferir o interrumpir ninguna carga de trabajo regular en ellos.
Apache Sqoop, que forma parte de CDH, es esa herramienta. Lo bueno de Sqoop es
que podemos cargar automáticamente nuestros datos relacionales de MySQL en HDFS,
al tiempo que conservamos la estructura. Con algunos parámetros de configuración
adicionales, podemos dar un paso más y cargar estos datos relacionales directamente
en un formulario listo para ser consultado por Apache Impala, la base de datos
analítica MPP incluida con CDH y otras cargas de trabajo.
Referencia del modelo de datos

Para su comodidad, esta sección de referencia representa la estructura de las tablas

que usará en los ejercicios al final de este manual de ejercicios.

Primero exploraremos la base de datos

En una ventana de terminal, inicie sesión en MySQL y seleccione la base de datos
retail_db:
$ mysql --user=retail_dba --password=cloudera retail_db

A continuación, enumere las tablas disponibles en la base de datos dualcore (mysql>

representa la solicitud del cliente MySQL y no forma parte del comando):
mysql> SHOW TABLES;

Revise la estructura de la tabla de empleados y examine algunos de sus registros:

mysql> DESCRIBE customers;
mysql> SELECT emp_id, fname, lname, state, salary FROM
employees LIMIT 10;

Salga de MySQL escribiendo quit y presione la tecla Enter

mysql> quit
Primero debe iniciar sesión en el nodo maestro de su clúster a través de un
terminal. Luego, inicie el trabajo Sqoop:
$ sqoop import-all-tables \
-m {{cluster_data.worker_node_hostname.length}} \
--connect jdbc:
mysql://{{cluster_data.manager_node_hostname}}:3306/retail_
db \
--username = retail_dba \
--password = cloudera \
--compression-codec = snappy \
--como archivo de parquet \
--warehouse-dir = /user/hive/warehouse \
--hive-import

Ejecute el siguiente comando, que importa la tabla de empleados en el directorio

/dualcore en HDFS, utilizando caracteres de tabulación para separar cada campo
$ sqoop import \
--connect jdbc:mysql://localhost:3306/retail_db \
--username=retail_dba \
--password=cloudera \
--fields-terminated-by '\t' \
--warehouse-dir=/dualcore \
--table products

sqoop import-all-tables \
--connect jdbc:mysql://localhost:3306/retail_db \
--username=retail_dba \
--password=cloudera \
--compression-codec=snappy \
--as-parquetfile \
--warehouse-dir=/user/hive/warehouse \
--hive-import

S-ar putea să vă placă și

Conexión SQL SERVER & C# (Manual para principiantes)
De la Everand
Conexión SQL SERVER & C# (Manual para principiantes)
Raúl Antonio Zavala López
Evaluare: 1 din 5 stele
1/5 (1)
Taller Formativo Evaluación Sqoop
Document18 pagini
Taller Formativo Evaluación Sqoop
Emilo LOPEz
Încă nu există evaluări
Manual de Supervivencia del Administrador de Bases de Datos
De la Everand
Manual de Supervivencia del Administrador de Bases de Datos
Miguel Ángel Benítez
Încă nu există evaluări
BigData Tools
Document10 pagini
BigData Tools
Camilo Alexander Calderón
Încă nu există evaluări
DAX Lenguaje para el análisis de datos
De la Everand
DAX Lenguaje para el análisis de datos
Antonio Menchén
Încă nu există evaluări
BigData Tools
Document4 pagini
BigData Tools
Camilo Alexander Calderón
Încă nu există evaluări
Instalación y configuración del software de servidor web. IFCT0509
De la Everand
Instalación y configuración del software de servidor web. IFCT0509
José Luis Villada Romero
Încă nu există evaluări
Sqoop
Document9 pagini
Sqoop
Manuel Correa
Încă nu există evaluări
Sgbd e instalación. IFCT0310
De la Everand
Sgbd e instalación. IFCT0310
Rafael Ángel Prieto de Lope
Încă nu există evaluări
Programacion Web Avanzada
Document79 pagini
Programacion Web Avanzada
Ricardo Vazquez Pavon
Încă nu există evaluări
Guia de Laboratorio de PHP y Mysql
Document11 pagini
Guia de Laboratorio de PHP y Mysql
Enrique Carrasco
Încă nu există evaluări
Importar y Exportar Datos en Mysql
Document5 pagini
Importar y Exportar Datos en Mysql
zzzuzzzy
Încă nu există evaluări
Uso Del Cliente Mysql
Document36 pagini
Uso Del Cliente Mysql
Giovanny Gomez
Încă nu există evaluări
Manual de Programación de Drupal 7
Document22 pagini
Manual de Programación de Drupal 7
Elastic Formación
Încă nu există evaluări
File Group
Document35 pagini
File Group
Jenni Lopez
Încă nu există evaluări
Interaccion Base de Datos
Document8 pagini
Interaccion Base de Datos
Eduardo Saavedra Lopez
0% (1)
G1 Avila Arce Jorge baseDeDatos
Document15 pagini
G1 Avila Arce Jorge baseDeDatos
jorgeleo22
Încă nu există evaluări
Beginning Oracle Database 11g Administration - From Novice To Professional-8.en - Es
Document20 pagini
Beginning Oracle Database 11g Administration - From Novice To Professional-8.en - Es
Joaris Angulo Quiroz
Încă nu există evaluări
Unidad BASE DE DATOS
Document43 pagini
Unidad BASE DE DATOS
fscuzzalopez
Încă nu există evaluări
2da Unidad Herramientas Bases de Datos Jesús Alarcón t2t3 Secc15
Document9 pagini
2da Unidad Herramientas Bases de Datos Jesús Alarcón t2t3 Secc15
Marcos David Alvarez Marte
Încă nu există evaluări
1.3. Desarrollo Físico de La BD Partiendo de Un Esquema Lógico PDF
Document13 pagini
1.3. Desarrollo Físico de La BD Partiendo de Un Esquema Lógico PDF
Jair Antonio
Încă nu există evaluări
Framework para VFP Conexion Con SQLServer MySQL PostgreSQL y Oracle III
Document8 pagini
Framework para VFP Conexion Con SQLServer MySQL PostgreSQL y Oracle III
Sheilla Lin Morales Mercado
Încă nu există evaluări
Actividad 2.2
Document15 pagini
Actividad 2.2
Jordan Gonzalez
Încă nu există evaluări
Nuevas Funcionalidades de 12c
Document9 pagini
Nuevas Funcionalidades de 12c
kamunias
Încă nu există evaluări
BD Con JSP
Document16 pagini
BD Con JSP
Cristhian Jairo Olaya Zarate
Încă nu există evaluări
1º Clase - Mantenedor de Datos en PHP - Conexion y Agregar
Document6 pagini
1º Clase - Mantenedor de Datos en PHP - Conexion y Agregar
Jose Rios
Încă nu există evaluări
Nise
Document58 pagini
Nise
carlos
Încă nu există evaluări
1013 PSG
Document124 pagini
1013 PSG
Javier Fernandez
Încă nu există evaluări
Manual CMS by Ramon
Document11 pagini
Manual CMS by Ramon
Julio Cesar Herrera
Încă nu există evaluări
Cómo Importar y Exportar Bases de Datos MySQL o MariaDB
Document3 pagini
Cómo Importar y Exportar Bases de Datos MySQL o MariaDB
Jhanet Granados Santos
Încă nu există evaluări
Manual de Adodb
Document60 pagini
Manual de Adodb
jorgeluisnt
Încă nu există evaluări
Manual Servidor Radius Linux Ubuntu
Document54 pagini
Manual Servidor Radius Linux Ubuntu
gotita55
80% (5)
Migrar Datos MSSQL A MySQL
Document8 pagini
Migrar Datos MSSQL A MySQL
alejandro218
Încă nu există evaluări
Cliente Ldap
Document10 pagini
Cliente Ldap
TheMetalGold
Încă nu există evaluări
CRUD de Usuario en Laravel 8
Document23 pagini
CRUD de Usuario en Laravel 8
ALEJA MAY
Încă nu există evaluări
Introducción A MySQL
Document4 pagini
Introducción A MySQL
rous
Încă nu există evaluări
Sena
Document23 pagini
Sena
Mario Enrique Alario
Încă nu există evaluări
Adjuntando Bases de Datos de SQL
Document14 pagini
Adjuntando Bases de Datos de SQL
abel
Încă nu există evaluări
Listado de Productos Con PHP
Document13 pagini
Listado de Productos Con PHP
ClauudiiaValencia
Încă nu există evaluări
7 Guía - Fundamentos de Base de Datos
Document25 pagini
7 Guía - Fundamentos de Base de Datos
JESUS Colonia
Încă nu există evaluări
Servicio de Nombres o Directorios
Document24 pagini
Servicio de Nombres o Directorios
Grillitos2
50% (2)
Manual-Libro Sobre SSIS PDF
Document8 pagini
Manual-Libro Sobre SSIS PDF
Gustavo A. Conde
Încă nu există evaluări
Manual SO Red Jesus Uriel Melendez Ramirez
Document16 pagini
Manual SO Red Jesus Uriel Melendez Ramirez
jesus uriel melendez ramirez
Încă nu există evaluări
Refactoring de Consultas de SQL Embebidas A Procedimientos Almacenados
Document26 pagini
Refactoring de Consultas de SQL Embebidas A Procedimientos Almacenados
Juan Carlos Olivares Rojas
Încă nu există evaluări
Dokumen - Tips - Framework para VFP Conexion Con Sqlserver Mysql Postgresql y Oracle III
Document16 pagini
Dokumen - Tips - Framework para VFP Conexion Con Sqlserver Mysql Postgresql y Oracle III
Cesar
Încă nu există evaluări
LDAP
Document21 pagini
LDAP
harvicalle
Încă nu există evaluări
Guia 1 Mysql
Document5 pagini
Guia 1 Mysql
Actualidad Magisterial Choluteca
Încă nu există evaluări
Pear
Document6 pagini
Pear
cuestionesmil
Încă nu există evaluări
Arduino
Document40 pagini
Arduino
Felix Pluas Navarrete
Încă nu există evaluări
Crud C#
Document66 pagini
Crud C#
Jose Oyarzo
Încă nu există evaluări
Mi Primer Script Mysql
Document15 pagini
Mi Primer Script Mysql
Rodolfo Enrique Codoceo Veas
Încă nu există evaluări
Tutorial MySQL 1
Document27 pagini
Tutorial MySQL 1
Ramiro Marcelo Rivera
Încă nu există evaluări
389 Directory Server - Servicio de Directorio
Document9 pagini
389 Directory Server - Servicio de Directorio
Felipe Londoño Muñoz
Încă nu există evaluări
Programas Paso A Paso - Programa Facil
Document89 pagini
Programas Paso A Paso - Programa Facil
salvanartex
Încă nu există evaluări
Crear PDF Desde PHP Haciendo Una Consulta A MySQL
Document6 pagini
Crear PDF Desde PHP Haciendo Una Consulta A MySQL
yerespinoza
Încă nu există evaluări
Guia de Desarrollo APACHE + Mysql + PHP y DAO 2012
Document43 pagini
Guia de Desarrollo APACHE + Mysql + PHP y DAO 2012
Duban Diaz Julio
Încă nu există evaluări
Install HSQLDB PDF
Document3 pagini
Install HSQLDB PDF
sebas tyn
Încă nu există evaluări
ADODBl
Document117 pagini
ADODBl
Julian Joya
Încă nu există evaluări
SQL Map
Document10 pagini
SQL Map
Anonymous c1AdV4
Încă nu există evaluări
Instalacion Hadoop
Document10 pagini
Instalacion Hadoop
Javier Pérez
Încă nu există evaluări
Compuertas Lógicas
Document8 pagini
Compuertas Lógicas
Eduardo Romero
Încă nu există evaluări
Mitsubishi 7 Segment
Document6 pagini
Mitsubishi 7 Segment
Shafait
100% (1)
Ejercicios CC
Document8 pagini
Ejercicios CC
joffre azogue
Încă nu există evaluări
Diseño de Losas Con Vigueta y Bovedilla
Document6 pagini
Diseño de Losas Con Vigueta y Bovedilla
Mariano Diaz
Încă nu există evaluări
Estructuras Simples y Dobles Conceptos Basicos
Document16 pagini
Estructuras Simples y Dobles Conceptos Basicos
Samuel Alemán
Încă nu există evaluări
Integrador Compensado
Document3 pagini
Integrador Compensado
santiago
Încă nu există evaluări
Investigacion2 SSH SNMP NTP
Document2 pagini
Investigacion2 SSH SNMP NTP
Oscar León
Încă nu există evaluări
0.1.manual de Procedimientos Actualizado
Document56 pagini
0.1.manual de Procedimientos Actualizado
Edvin Neil Huamanguillas Paravecino
Încă nu există evaluări
Informe Pcs Incorporar
Document3 pagini
Informe Pcs Incorporar
cristian urriolagoitia suyo
Încă nu există evaluări
Modelos de Tableros de La Marca Siemens y Schneider Electric (Square D)
Document24 pagini
Modelos de Tableros de La Marca Siemens y Schneider Electric (Square D)
FernandoTato
Încă nu există evaluări
Os Elementos de La Sección Transversal de Una Carretera Influyen Sobre Sus Características Operativas
Document34 pagini
Os Elementos de La Sección Transversal de Una Carretera Influyen Sobre Sus Características Operativas
Mariana Villasante Vargas
Încă nu există evaluări
Examen Final Redes II - Revisión Del Intento
Document16 pagini
Examen Final Redes II - Revisión Del Intento
jose merlano
Încă nu există evaluări
Ricketts
Document1 pagină
Ricketts
Tomodent Centro de Diagnostico
Încă nu există evaluări
Produccion Grafica 1 Parte 2019
Document305 pagini
Produccion Grafica 1 Parte 2019
William Prado Montecinos
Încă nu există evaluări
Administracion de Cadena de Suministro
Document2 pagini
Administracion de Cadena de Suministro
Alexis emmanuel Arias velazquez
Încă nu există evaluări
Algoritmos
Document22 pagini
Algoritmos
CARMELO HILARIO VILCAPOMA
Încă nu există evaluări
S5 Product-Sheet S-5-MX SP
Document2 pagini
S5 Product-Sheet S-5-MX SP
javier garcia
Încă nu există evaluări
Manual MENTOR UT - Español - 2020
Document130 pagini
Manual MENTOR UT - Español - 2020
Alexander Sueco Leyan Castillo
100% (1)
Biografia Steven Jobs
Document2 pagini
Biografia Steven Jobs
Adriana Navarro
Încă nu există evaluări
Como Ver El Aura
Document21 pagini
Como Ver El Aura
Pia Dominguez Alzaga
Încă nu există evaluări
Clase 5 MEDIDAS DE POSICION PDF
Document24 pagini
Clase 5 MEDIDAS DE POSICION PDF
DENNIS PABEL RAMIRO MAMANI SIMEON
Încă nu există evaluări
Politicas Normas y Procedimientos RRHH
Document8 pagini
Politicas Normas y Procedimientos RRHH
Jose Luis Romero
100% (3)
HHHHHH
Document24 pagini
HHHHHH
yerson basquez
Încă nu există evaluări
Siemens (2008) Una Breve Historia Del Aprendizaje en Red
Document9 pagini
Siemens (2008) Una Breve Historia Del Aprendizaje en Red
Diego Leal
100% (1)
Tarea UNIDAD1
Document3 pagini
Tarea UNIDAD1
Karen Moon
Încă nu există evaluări
Samsung Galaxy S20 FE 5G - Manual Usuario PDF
Document155 pagini
Samsung Galaxy S20 FE 5G - Manual Usuario PDF
mayoralete
Încă nu există evaluări
Capítulo 7 Análisis de Regresión Múltiple
Document9 pagini
Capítulo 7 Análisis de Regresión Múltiple
Loyda Alejandro
Încă nu există evaluări
BIIN U2 Contenido
Document65 pagini
BIIN U2 Contenido
Pablo Pasillas
Încă nu există evaluări
Laboratorio Sensor de Iluminación
Document17 pagini
Laboratorio Sensor de Iluminación
JULIET MUNOZ GARCIA
Încă nu există evaluări
Enhancement
Document13 pagini
Enhancement
Fany Gutierrez
Încă nu există evaluări