Bine ați venit la Scribd!

Sqoop

Încărcat de

0% au considerat acest document util (0 voturi)

65 vizualizări15 pagini

Sqoop allows importing and exporting data between relational databases and Hadoop. It uses MapReduce to import data from a relational database into HDFS, HBase, or Hive. For import, Sqoop first connects to the database and retrieves metadata, then executes a MapReduce job to import the data. It supports importing a full table, selected columns/rows, and incremental imports. Sqoop export works similarly but in reverse, using MapReduce to export data from HDFS, HBase, or Hive to a relational database in bulk.

Descriere originală:

Titlu original

Sqoop.pptx

Drepturi de autor

Formate disponibile

PPTX, PDF, TXT sau citiți online pe Scribd

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Raportați acest document

Drepturi de autor:

Formate disponibile

Descărcați ca PPTX, PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

0% au considerat acest document util (0 voturi)

65 vizualizări15 pagini

Sqoop

Încărcat de

shobhit

Drepturi de autor:

Formate disponibile

Descărcați ca PPTX, PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

Salt la pagina

Sunteți pe pagina 1din 15

Căutați în document

Sqoop

Sqoop Import

Traditional RDBMS data into Hadoop, Hbase and HIVE.

Prerequisites:-
RDBMS
Hadoop Cluster up in running
Set HADOOP_HOME environment variable
Basic command

bin/sqoop import connect jdbc:mysql://url username name password pwd

table name target-dir path/for/storing/db
How import works?

First connection is set up to the Database server to pull desired metadata info
from the input table we are using.
Then it executes a Mapreduce job on Hadoop cluster. Sqoop will use
metadata to perform actual import.
Modify Delimiters

--fields-terminated-by ,
--lines-terminated-by ,
--escaped-by \\
--enclosed-by \
Different file formats

--as-sequencefile Store data in sequential file format

--as-avrodatafile Store data in Avro file
--as-textfile Store data in Text file

--direct Direct Access Mode for non jdbc based access

Different table access

--columns field1, field2 Import selected columns

--where condition Import selected rows
--columns fields where cond. Selected rows of selected columns
--query any query For any SQL query
import-all-tables For importing all tables

-m no. No. of map tasks

--split-by column_name For dividing mapped tasks
Incremental import

For importing new version/latest record

For appending new recods
--incremental append last-value value check-column column_name
For appending and updating records
--incremental lastmodified last-value value(timestamp) check-column
column_name
(Will need to maintain timestamp, so an extra column)
Job info

--create job_name
--delete job_name
--exec job_name
--show job_name Show parameters
--list List of all saved jobs
Importing data in Hbase

Prerequisites:-
Hbase cluster up in running
HBASE_HOME environment variable is set
For importing a Primary key table
bin/sqoop import connect jdbc:mysql://url username name password pwd
table name hbase-table hbase_name column-family hbase_table_col1
hbase-create-table
For importing a non-primary key table
bin/sqoop import connect jdbc:mysql://url username name password pwd
table name hbase-table hbase_name column-family hbase_table_col1
hbase-row-key col_name hbase-create-table
Importing database in HIVE

Prerequisites:-
HIVE installed
HIVE_HOME environment variable is set
Importing primary key table
bin/sqoop import connect jdbc:mysql://url username name password pwd
table name hive-table name create-hive-table hive-import hive-home
path/to/hive/home
Importing non-primary key table
bin/sqoop import connect jdbc:mysql://url username name password pwd
table name hive-table name create-hive-table hive-import hive-home
path/to/hive/home split-by col_name
Getting HDFS data into HIVE

Hive> CREATE EXTERNAL TABLE student(id int, name string)

ROW FORMAT DELIMITED FIELDS TERMINATED BY ',
LINES TERMINATED BY '\n
STORED AS TEXTFILE
LOCATION '/user/username/student';
Sqoop export

Basic command:
Bin/sqoop export connect location table name username name password
pwd export-dir /location
--input-fields-terminated-by,
--input-lines-terminated-by,
How export works

Validate metadata of output RDBMS table

Execute the Mapreduce job to perform actual transfer

Use staging-table argument to move staged data in single transaction

Export from HIVE

Create an invoice table as

CREATE TABLE invoice(
id INT NOT NULL PRIMARY KEY
from VARCHAR(32), to VARCHAR(32));
Use command:-
bin/sqoop export connect jdbc:Location table invoice export-dir
Location/invoice username name password pwd m no. input-fields-
terminated-by\001(Octal of ^A)

S-ar putea să vă placă și

Cloudera A Complete Guide - 2019 Edition
De la Everand
Cloudera A Complete Guide - 2019 Edition
Gerardus Blokdyk
Încă nu există evaluări
Seminar Report DSP
Document34 pagini
Seminar Report DSP
wmallan
Încă nu există evaluări
Google Bigtable
Document21 pagini
Google Bigtable
Abhijeet Ingle Patil
Încă nu există evaluări
Distributed Operating Systems
Document54 pagini
Distributed Operating Systems
beti_1531
Încă nu există evaluări
Apache Pig Tutorial
Document207 pagini
Apache Pig Tutorial
Adarsh Bhardwaj
Încă nu există evaluări
SoumyadipKhan Resume
Document1 pagină
SoumyadipKhan Resume
Soumyadip Khan
Încă nu există evaluări
Java 3 Years Experience Resume
Document3 pagini
Java 3 Years Experience Resume
Kishore Mutcharla
Încă nu există evaluări
Bhanu Busi: E-Mail: Contact No: +91 8897834104
Document6 pagini
Bhanu Busi: E-Mail: Contact No: +91 8897834104
Chandana
Încă nu există evaluări
CV Update
Document13 pagini
CV Update
Ifeanyi Oparaeke
Încă nu există evaluări
Java 3.5 Years Resume
Document4 pagini
Java 3.5 Years Resume
Kishore Mutcharla
Încă nu există evaluări
Hadoop Hive Cheat Sheet - Developer Guide For SQL To HiveQL - Qubole
Document19 pagini
Hadoop Hive Cheat Sheet - Developer Guide For SQL To HiveQL - Qubole
gowri1111
Încă nu există evaluări
Keshav Balivada: Email: Contact No.: +91-8500360567 Work Experience: 4 Years
Document3 pagini
Keshav Balivada: Email: Contact No.: +91-8500360567 Work Experience: 4 Years
Joel Cerqueira Ponte
Încă nu există evaluări
Google Bigtable: Describe The Data Model of Bigtable
Document6 pagini
Google Bigtable: Describe The Data Model of Bigtable
Đorđe Klisura
Încă nu există evaluări
Real Time System
Document1 pagină
Real Time System
Deepak Verma
Încă nu există evaluări
Sqoop Demo
Document7 pagini
Sqoop Demo
Jyotirmay Sahu
Încă nu există evaluări
NS Lab1
Document5 pagini
NS Lab1
Ali Ahmad
Încă nu există evaluări
Cloud Computing: An Overview: Charandeep Singh Bedi, Rajan Sachdeva
Document10 pagini
Cloud Computing: An Overview: Charandeep Singh Bedi, Rajan Sachdeva
Charndeep Bedi
Încă nu există evaluări
Step by Step Instructions On How To ThinApp Microsoft Office 2007
Document13 pagini
Step by Step Instructions On How To ThinApp Microsoft Office 2007
roni_wiharyanto
Încă nu există evaluări
Project Report On HCL Mileap Laptops
Document69 pagini
Project Report On HCL Mileap Laptops
JaiHanumanki
Încă nu există evaluări
Unit 1
Document95 pagini
Unit 1
qra7yb1
Încă nu există evaluări
Vishal Resume
Document6 pagini
Vishal Resume
Meenakshi Gupta
Încă nu există evaluări
Main Project Mass Customization
Document74 pagini
Main Project Mass Customization
vj_vinay
Încă nu există evaluări
Hive Is A Data Warehouse Infrastructure Tool To Process Structured Data in Hadoop
Document30 pagini
Hive Is A Data Warehouse Infrastructure Tool To Process Structured Data in Hadoop
aravind
Încă nu există evaluări
Nakul Bhati: Education Skills
Document1 pagină
Nakul Bhati: Education Skills
pankaj
Încă nu există evaluări
Azure Cloud Intro
Document34 pagini
Azure Cloud Intro
Shivaraj K
Încă nu există evaluări
ASP.NET
Document4 pagini
ASP.NET
Rizwan Ahmed
100% (1)
Mukularanyam English School: A Project Report ON Travel Agency Management System
Document71 pagini
Mukularanyam English School: A Project Report ON Travel Agency Management System
india cybercafe
Încă nu există evaluări
BDA Experiment 14 PDF
Document77 pagini
BDA Experiment 14 PDF
Nikita Ichale
Încă nu există evaluări
Course File Compiler Design
Document41 pagini
Course File Compiler Design
Kuldeep Pal
Încă nu există evaluări
Mahima Singh
Document88 pagini
Mahima Singh
india cybercafe
Încă nu există evaluări
DBMS Vs RDBMS PDF
Document7 pagini
DBMS Vs RDBMS PDF
vikas
Încă nu există evaluări
Bigdata PPT Slides (E)
Document10 pagini
Bigdata PPT Slides (E)
sai project
Încă nu există evaluări
04 - Introduction To The Big Data Ecosystem
Document25 pagini
04 - Introduction To The Big Data Ecosystem
Jose Evanan
Încă nu există evaluări
Unit-5 Spark
Document20 pagini
Unit-5 Spark
Siva
Încă nu există evaluări
Curriculum OF Botany: BS (4-YEAR)
Document91 pagini
Curriculum OF Botany: BS (4-YEAR)
Abas92
Încă nu există evaluări
Project Report On Gym Management
Document30 pagini
Project Report On Gym Management
uhate52
Încă nu există evaluări
Bda Module 4 PPT (KM)
Document76 pagini
Bda Module 4 PPT (KM)
Ajay Bhuj
Încă nu există evaluări
Pentaho Training Course Catalog
Document13 pagini
Pentaho Training Course Catalog
Abdel Adime
Încă nu există evaluări
Hive Commands Simplin
Document5 pagini
Hive Commands Simplin
marina dutta
Încă nu există evaluări
Stock Portfolio Formation: BRK-B, CSCO & BA
Document18 pagini
Stock Portfolio Formation: BRK-B, CSCO & BA
sandeep shrestha
Încă nu există evaluări
Hadoop Interviews Q
Document9 pagini
Hadoop Interviews Q
S K
Încă nu există evaluări
Data Flow Diagram: Starting The Module
Document5 pagini
Data Flow Diagram: Starting The Module
hamed raza
Încă nu există evaluări
Number - 0 1 - Varchar2 10 - Varchar2 10
Document4 pagini
Number - 0 1 - Varchar2 10 - Varchar2 10
Aman Bekinal
Încă nu există evaluări
Kushal Hadoop Resume
Document3 pagini
Kushal Hadoop Resume
Blake Morris
Încă nu există evaluări
"Quiz & Fun": For AISSCE Term-II (2021-22) Examination
Document35 pagini
"Quiz & Fun": For AISSCE Term-II (2021-22) Examination
Suranjana Debnath
Încă nu există evaluări
A Study On Cloud Computing Services IJERTCONV4IS34014
Document6 pagini
A Study On Cloud Computing Services IJERTCONV4IS34014
vikas
Încă nu există evaluări
HDFC Project
Document111 pagini
HDFC Project
sau9885
0% (1)
Ankit Rathi Ankit Rathi: Lead Data Architect
Document4 pagini
Ankit Rathi Ankit Rathi: Lead Data Architect
Abhishek Vijayvargiya
Încă nu există evaluări
Project Report
Document58 pagini
Project Report
shivpbt
Încă nu există evaluări
Capital Budgeting (Or Investment Appraisal) Is The Planning Process Used To Determine Whether A Firm's
Document4 pagini
Capital Budgeting (Or Investment Appraisal) Is The Planning Process Used To Determine Whether A Firm's
pavanbhat
Încă nu există evaluări
Real Time Operating Systems
Document12 pagini
Real Time Operating Systems
Subrahmanyam Padala
Încă nu există evaluări
Hadoop Final Docment
Document79 pagini
Hadoop Final Docment
Naufil Ajju
100% (1)
Syed Althaf: Contact: +91 9849639797 E-Mail: Objective
Document4 pagini
Syed Althaf: Contact: +91 9849639797 E-Mail: Objective
Bharath Reddy Kristipati
Încă nu există evaluări
Deepak Professional Summary
Document3 pagini
Deepak Professional Summary
aras4mavis1932
Încă nu există evaluări
Project Report Guidelines-BBA (Gen) and BBA (BI) - VIth SEM-2008-11 Batch
Document20 pagini
Project Report Guidelines-BBA (Gen) and BBA (BI) - VIth SEM-2008-11 Batch
Darpan Bahl
Încă nu există evaluări
Sreeja.T: SR Hadoop Developer
Document7 pagini
Sreeja.T: SR Hadoop Developer
Anonymous Kf8Nw5TmzG
Încă nu există evaluări
CS8091-Big Data Analytics
Document12 pagini
CS8091-Big Data Analytics
vanitha
Încă nu există evaluări
Tech Seminar Report
Document5 pagini
Tech Seminar Report
Saikumar Thurai
Încă nu există evaluări
Knowledge About Apache Sqoop and Its All Basic Commands To Import and Export The Data
Document7 pagini
Knowledge About Apache Sqoop and Its All Basic Commands To Import and Export The Data
Syed Azam Shah
Încă nu există evaluări
Fundamentals of Apache Sqoop Notes
Document66 pagini
Fundamentals of Apache Sqoop Notes
paramreddy2000
Încă nu există evaluări
Video Camera
Document1 pagină
Video Camera
shobhit
Încă nu există evaluări
Machine Learning
Document33 pagini
Machine Learning
shobhit
Încă nu există evaluări
Histogram of Shell - 8
Document5 pagini
Histogram of Shell - 8
shobhit
Încă nu există evaluări
Flume
Document15 pagini
Flume
shobhit
Încă nu există evaluări
Camera System Selection Attributes
Document2 pagini
Camera System Selection Attributes
shobhit
Încă nu există evaluări
Video Camera
Document1 pagină
Video Camera
shobhit
Încă nu există evaluări
Project Report Summer Training
Document3 pagini
Project Report Summer Training
shobhit
Încă nu există evaluări
List of Institute
Document23 pagini
List of Institute
shobhit
Încă nu există evaluări
Readme
Document1 pagină
Readme
Akeem Dwayne Ralph Noel
Încă nu există evaluări
Manual 745
Document63 pagini
Manual 745
Mahmoud Jamal Ankeer
Încă nu există evaluări
Unit1 - Mips Alp - Hp4e Slides
Document49 pagini
Unit1 - Mips Alp - Hp4e Slides
shobhit
Încă nu există evaluări
Distributed Systems: Mutual Exclusion
Document24 pagini
Distributed Systems: Mutual Exclusion
nestyibnruzhdi
Încă nu există evaluări
RTFM Red Team Field Manual
Document103 pagini
RTFM Red Team Field Manual
Garv Sanwariya
Încă nu există evaluări
Install and Configure Snort IDS On Windows 7
Document11 pagini
Install and Configure Snort IDS On Windows 7
Er Ankur Saxena
Încă nu există evaluări
HP Pavilion dv6000 6700 Quanta At3 Rev 1a SCH PDF
Document48 pagini
HP Pavilion dv6000 6700 Quanta At3 Rev 1a SCH PDF
Konstantinos Goniadis
100% (1)
Quick Installation Guide For FI9826P (V2) V1.7 PDF
Document2 pagini
Quick Installation Guide For FI9826P (V2) V1.7 PDF
vsalap
Încă nu există evaluări
Assignment W12
Document8 pagini
Assignment W12
Pathi Narasimha sai
Încă nu există evaluări
WBEM For Hpux Admin
Document63 pagini
WBEM For Hpux Admin
brainzat
Încă nu există evaluări
Asymmetrical Digital Subscriber Line - Adsl
Document44 pagini
Asymmetrical Digital Subscriber Line - Adsl
v2brother
Încă nu există evaluări
3500 Galvanic Isolator Interface: Manual
Document36 pagini
3500 Galvanic Isolator Interface: Manual
Theerayoot
Încă nu există evaluări
Nokia SRC Scalable IP Self-Study Guide Document en
Document1 pagină
Nokia SRC Scalable IP Self-Study Guide Document en
parthieee
Încă nu există evaluări
PC Worx Function Blocks v52
Document72 pagini
PC Worx Function Blocks v52
Gonzalo Araya
Încă nu există evaluări
AU680 - AU480 Online LAN Specification - Ver.1
Document94 pagini
AU680 - AU480 Online LAN Specification - Ver.1
gustavodlr
Încă nu există evaluări
4500-LSS Combined Handbook 2.2
Document76 pagini
4500-LSS Combined Handbook 2.2
Nguyễn Văn Trung
Încă nu există evaluări
Book 1 PW Ipt Ic Level 1
Document240 pagini
Book 1 PW Ipt Ic Level 1
Daniel Alarico Iglesias
Încă nu există evaluări
23 ACI T-Shoot Commands - LEARN WORK IT
Document7 pagini
23 ACI T-Shoot Commands - LEARN WORK IT
ravi kant
Încă nu există evaluări
PaloAltoNetworks Pcnsa v2022!05!30 q68
Document25 pagini
PaloAltoNetworks Pcnsa v2022!05!30 q68
Mecachis Piachis
Încă nu există evaluări
User Manual Ge Atlas Gentech Tss308ge A NZ e
Document13 pagini
User Manual Ge Atlas Gentech Tss308ge A NZ e
Andi Roșu
Încă nu există evaluări
Data Gathering Instrument For Trainee
Document5 pagini
Data Gathering Instrument For Trainee
Arvincent Geronimo Olatan
Încă nu există evaluări
REDIM Installation Guide 5.5.2.1
Document276 pagini
REDIM Installation Guide 5.5.2.1
balamurali_a
Încă nu există evaluări
0429Q en
Document2 pagini
0429Q en
Kannan Ice
Încă nu există evaluări
Iperius Backup
Document2 pagini
Iperius Backup
Sugumaran Ramalingam
100% (1)
Alpine 3800 Fm24mfi
Document66 pagini
Alpine 3800 Fm24mfi
Gabriel Gonzalez
Încă nu există evaluări
Huawei GPON Basic Knowledge Training Data PDF
Document53 pagini
Huawei GPON Basic Knowledge Training Data PDF
Chainmer Chain
Încă nu există evaluări
Refill Schemes - Social Media Guide PDF
Document37 pagini
Refill Schemes - Social Media Guide PDF
Catalin Mihailescu
Încă nu există evaluări
Online Chat
Document4 pagini
Online Chat
Krishnendu Kizhakedathu Sudhakaran
Încă nu există evaluări
A Paper On Ethernet
Document4 pagini
A Paper On Ethernet
aayushahuja1991
Încă nu există evaluări
Lesson 3: Internet Addiction and Isolation Assessment
Document3 pagini
Lesson 3: Internet Addiction and Isolation Assessment
Mariel Bombita
100% (2)
WiFi Manual Whirlpool
Document108 pagini
WiFi Manual Whirlpool
bfsreis
100% (1)
Bellary Telecom District
Document3 pagini
Bellary Telecom District
Arun Kumar
Încă nu există evaluări
Lab Report
Document6 pagini
Lab Report
towhidul
Încă nu există evaluări