Bine ați venit la Scribd!

Săriți peste schemele de tip carusel

Cloudera Spark Training

Încărcat de

kudaravalligopi

0% au considerat acest document util (0 voturi)

257 vizualizări2 pagini

spark

Drepturi de autor

Formate disponibile

PDF, TXT sau citiți online pe Scribd

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Raportați acest document

spark

Drepturi de autor:

Formate disponibile

Descărcați ca PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

0% au considerat acest document util (0 voturi)

257 vizualizări2 pagini

Cloudera Spark Training

Încărcat de

kudaravalligopi

spark

Drepturi de autor:

Formate disponibile

Descărcați ca PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

Salt la pagina

Sunteți pe pagina 1din 2

Căutați în document

TRAINING SHEET

Cloudera University was by

far the most well-executed
technical training I have
attended. I feel confident that
I can build my own big data
application with an enterprise
data hub, and I look forward to
using the tools I learned in the
classroom.
Price Waterhouse Coop

Cloudera Developer Training for Apache Spark

Take your knowledge to the next level and solve
real-world problems with training for Hadoop and the
Enterprise Data Hub
Cloudera Universitys three-day training course for Apache Spark enables participants to
build complete, unified big data applications combining batch, streaming, and interactive
analytics on all their data. With Spark, developers can write sophisticated parallel applications
to execute faster decisions, better decisions, and real-time actions, applied to a wide variety
of use cases, architectures, and industries.

Advance Your Ecosystem Expertise

Apache Spark is the next-generation successor to MapReduce. Spark is a powerful, opensource processing engine for data in the Hadoop cluster, optimized for speed, ease of use,
and sophisticated analytics. The Spark framework supports streaming data processing and
complex, iterative algorithms, enabling applications to run up to 100x faster than traditional
Hadoop MapReduce programs.

Hands-On Hadoop
Through instructor-led discussion and interactive, hands-on exercises, participants will
navigate the Hadoop ecosystem, learning topics such as:
Using the Spark shell for interactive data analysis
The features of Sparks Resilient Distributed Datasets
How Spark runs on a cluster
Parallel programming with Spark
Writing Spark applications

Processing streaming data with Spark

Audience & Prerequisites

This course is best suited to developers and engineers. Course examples and exercises are
presented in Python and Scala, so knowledge of one of these programming languages is
required. Basic knowledge of Linux is assumed. Prior knowledge of Hadoop is not required.

TRAINING SHEET

Course Outline: Cloudera Developer Training for Apache Spark

Introduction

Parallel Programming with Spark

Why Spark?
Problems with Traditional Large-Scale
Systems
Introducing Spark

RDD Partitions and HDFS Data Locality

Spark Streaming Overview

Working With Partitions

Example: Streaming Word Count

Executing Parallel Operations

Other Streaming Operations

Caching and Persistence

Spark Basics

RDD Lineage

What is Apache Spark?

Caching Overview

Using the Spark Shell

Distributed Persistence

Resilient Distributed Datasets (RDDs)

Functional Programming with Spark

Writing Spark Applications

Spark Applications vs. Spark Shell

Working with RDDs

Spark Streaming

Creating the SparkContext

Sliding Window Operations

Developing Spark Streaming Applications

Common Spark Algorithms

Iterative Algorithms
Graph Analysis
Machine Learning

Improving Spark Performance

RDD Operations

Configuring Spark Properties

Shared Variables: Broadcast Variables

Key-Value Pair RDDs

Building and Running a Spark Application

Shared Variables: Accumulators

MapReduce and Pair RDD Operations

Logging

Common Performance Issues

The Hadoop Distributed File System

Why HDFS?

Spark, Hadoop, and the Enterprise

Data Center

HDFS Architecture

Overview

Using HDFS

Spark and the Hadoop Ecosystem

Running Spark on a Cluster

Conclusion

Spark and MapReduce

Overview
A Spark Standalone Cluster
The Spark Standalone Web UI

cloudera.com
1-888-789-1488 or 1-650-362-0488
Cloudera, Inc., 1001 Page Mill Road, Palo Alto, CA 94304, USA

2015 Cloudera, Inc. All rights reserved. Cloudera and the Cloudera logo are trademarks or registered trademarks of Cloudera Inc. in the USA
and other countries. All other trademarks are the property of their respective companies. Information is subject to change without notice.
cloudera-training-sheet-spark-103

S-ar putea să vă placă și

Big Data Analytics
De la Everand
Big Data Analytics
Venkat Ankam
Încă nu există evaluări
Learning Apache Spark 2
De la Everand
Learning Apache Spark 2
Muhammad Asif Abbasi
Încă nu există evaluări
Cloudera Developer Training For Apache Spark
Document3 pagini
Cloudera Developer Training For Apache Spark
kesh
Încă nu există evaluări
Cloudera Developer Training For Spark and Hadoop
Document4 pagini
Cloudera Developer Training For Spark and Hadoop
Cristina Aciubotaritei
Încă nu există evaluări
Cloudera Spark Training
Document2 pagini
Cloudera Spark Training
sethurammsc
Încă nu există evaluări
Big Data Hadoop Architect - V4
Document20 pagini
Big Data Hadoop Architect - V4
Ali Akbar
Încă nu există evaluări
Big Data Hadoop Architect
Document19 pagini
Big Data Hadoop Architect
Anonymous nQ9mMy
Încă nu există evaluări
Sampath Polishetty BigData Consultant
Document7 pagini
Sampath Polishetty BigData Consultant
Sampath Polishetty
Încă nu există evaluări
Satyanarayana Gupta Kunda
Document9 pagini
Satyanarayana Gupta Kunda
Vamsi Ramu
Încă nu există evaluări
PR Ofessional Summary: Data Frames and RDD's
Document6 pagini
PR Ofessional Summary: Data Frames and RDD's
Recruitment
Încă nu există evaluări
Apache Spark
Document14 pagini
Apache Spark
wassimoss00
Încă nu există evaluări
Top Answers To Spark Interview Questions
Document32 pagini
Top Answers To Spark Interview Questions
srinivas75k
Încă nu există evaluări
Apache Spark Features
Document2 pagini
Apache Spark Features
nitinlucky
Încă nu există evaluări
Introduction To Spark
Document23 pagini
Introduction To Spark
Trần Nguyên Thái Bảo
Încă nu există evaluări
Iswarya - SR - Bigdata Hadoop Developer
Document8 pagini
Iswarya - SR - Bigdata Hadoop Developer
Vrahta
Încă nu există evaluări
Manoj Kumar
Document3 pagini
Manoj Kumar
Mandeep Bakshi
Încă nu există evaluări
Deepak (Sr. Data Engineer)
Document10 pagini
Deepak (Sr. Data Engineer)
ankul
Încă nu există evaluări
Jayasree Yedlapally: Data Architecture Engineering - Senior
Document5 pagini
Jayasree Yedlapally: Data Architecture Engineering - Senior
Shantha Gopaal
Încă nu există evaluări
Solution Methodology
Document3 pagini
Solution Methodology
Arnab Dey
Încă nu există evaluări
Apache Spark PDF
Document34 pagini
Apache Spark PDF
sowjanya kandukuri
Încă nu există evaluări
Bigdata - Cloud - Devops
Document5 pagini
Bigdata - Cloud - Devops
Vrahta
Încă nu există evaluări
Akhil Data+Engineer1
Document5 pagini
Akhil Data+Engineer1
Vivek Sagar
Încă nu există evaluări
Spark: Prepared by Dulari Bhatt
Document19 pagini
Spark: Prepared by Dulari Bhatt
Dulari Bosamiya Bhatt
Încă nu există evaluări
Dice Resume CV Likitha Pailla
Document5 pagini
Dice Resume CV Likitha Pailla
HARSHA
Încă nu există evaluări
Rama
Document7 pagini
Rama
Prabhakar Reddy Bokka
Încă nu există evaluări
Professional Summary
Document7 pagini
Professional Summary
Prabhakar Reddy Bokka
Încă nu există evaluări
Dice Resume CV Saumya S
Document7 pagini
Dice Resume CV Saumya S
HARSHA
Încă nu există evaluări
Cloudera Developer Training For Spark & Hadoop: ID DSH Price 2,695.
Document4 pagini
Cloudera Developer Training For Spark & Hadoop: ID DSH Price 2,695.
Aiswarya Nimmagadda
Încă nu există evaluări
Apache Spark Engine
Document82 pagini
Apache Spark Engine
AMAL NEJJARI
100% (1)
B. NoSQL, Big Data, and Spark Foundations - Coursera
Document7 pagini
B. NoSQL, Big Data, and Spark Foundations - Coursera
Hafiszan
Încă nu există evaluări
Dice Resume CV Kumar Hari
Document6 pagini
Dice Resume CV Kumar Hari
Naman Bhardwaj
Încă nu există evaluări
DE Sample Resume
Document6 pagini
DE Sample Resume
Sri Guru
Încă nu există evaluări
Apache Spark Primer 170303
Document8 pagini
Apache Spark Primer 170303
selives
Încă nu există evaluări
Apache Spark Is A Distributed Computing System For Big Data Processing Based On The MapReduce Model
Document1 pagină
Apache Spark Is A Distributed Computing System For Big Data Processing Based On The MapReduce Model
PHANTOME FF
Încă nu există evaluări
Sharath Res
Document7 pagini
Sharath Res
Srilakshmi M
Încă nu există evaluări
Dice Resume CV Karthik S
Document4 pagini
Dice Resume CV Karthik S
RAJU P
Încă nu există evaluări
Donald Ngandeu 1
Document6 pagini
Donald Ngandeu 1
Noor Ayesha Iqbal
Încă nu există evaluări
Dice Resume CV SN
Document5 pagini
Dice Resume CV SN
Shivam Pandey
Încă nu există evaluări
Chaitanya - Sr. Data Engineer
Document7 pagini
Chaitanya - Sr. Data Engineer
abhay.rajauriya1
Încă nu există evaluări
Cloudera University Training Overview
Document2 pagini
Cloudera University Training Overview
Gyan Swaroop Tripathi
Încă nu există evaluări
Apache Spark
Document13 pagini
Apache Spark
wassimoss00
Încă nu există evaluări
Anusha K Phone No: (929) 456-3121 Senior Data Engineer: Summary
Document7 pagini
Anusha K Phone No: (929) 456-3121 Senior Data Engineer: Summary
harsh
Încă nu există evaluări
Manideep Lenkalapally
Document7 pagini
Manideep Lenkalapally
Noor Ayesha Iqbal
Încă nu există evaluări
List of Vendors
Document5 pagini
List of Vendors
aalexa
Încă nu există evaluări
Jyostna DataEngineer GCEAD
Document5 pagini
Jyostna DataEngineer GCEAD
Nishant Kumar
Încă nu există evaluări
Apache Spark Tutorial
Document6 pagini
Apache Spark Tutorial
abhimanyu thakur
100% (1)
Big Data
Document7 pagini
Big Data
sukhpreet singh
Încă nu există evaluări
Toronto Hadoop User Group Spark
Document16 pagini
Toronto Hadoop User Group Spark
Smarty Juice
Încă nu există evaluări
1
Document2 pagini
1
Anuj Garg
Încă nu există evaluări
Ajay Kadiyala Resume 2023 PDF
Document6 pagini
Ajay Kadiyala Resume 2023 PDF
viki awsac
Încă nu există evaluări
Apache Spark Interview Questions
Document12 pagini
Apache Spark Interview Questions
varun3dec1
Încă nu există evaluări
Big Data Processing With Apache Spark
Document17 pagini
Big Data Processing With Apache Spark
abhijitch
Încă nu există evaluări
Big Data Processing With Apache Spark - Infoqdotcom
Document16 pagini
Big Data Processing With Apache Spark - Infoqdotcom
abhijitch
Încă nu există evaluări
Module 3
Document51 pagini
Module 3
sagarhn sagarhn
Încă nu există evaluări
Naveen Kumar Nemani Sr. Big Data Engineer: Summary
Document6 pagini
Naveen Kumar Nemani Sr. Big Data Engineer: Summary
Vrahta
Încă nu există evaluări
Introduction To Big Data Technologies
Document10 pagini
Introduction To Big Data Technologies
indolent56
Încă nu există evaluări
Nagaraju Bachu
Document6 pagini
Nagaraju Bachu
Vamsi Ramu
Încă nu există evaluări
Apache Spark Interview Questions and Answers PDF
Document31 pagini
Apache Spark Interview Questions and Answers PDF
Zyad Ahmed
Încă nu există evaluări
Cloudera Developer Training For Apache Hadoop v2
Document3 pagini
Cloudera Developer Training For Apache Hadoop v2
kavi21186
Încă nu există evaluări
Resume Sample For US STAFFING
Document6 pagini
Resume Sample For US STAFFING
ashh3417
Încă nu există evaluări
Doctrine Orm
Document322 pagini
Doctrine Orm
irodiwan
Încă nu există evaluări
SELECT Last - Name, Job - Id, Salary AS Sal From Employees True/False
Document3 pagini
SELECT Last - Name, Job - Id, Salary AS Sal From Employees True/False
Zara suto
Încă nu există evaluări
SAP CS Tcodes (Transaction Codes)
Document4 pagini
SAP CS Tcodes (Transaction Codes)
Murali Reddy
Încă nu există evaluări
GIS and It's Component
Document16 pagini
GIS and It's Component
Vijay Kumar Kajle
Încă nu există evaluări
AgileOps EventKPI
Document4 pagini
AgileOps EventKPI
JRaulk Palomares
Încă nu există evaluări
Linux Commands
Document10 pagini
Linux Commands
kimon
Încă nu există evaluări
Python Database Programming Study Material PDF
Document17 pagini
Python Database Programming Study Material PDF
Santosh Santu
100% (1)
Dbms Vtu Notes
Document104 pagini
Dbms Vtu Notes
satya
Încă nu există evaluări
1Z0-062 Practice Test
Document10 pagini
1Z0-062 Practice Test
Udayan
Încă nu există evaluări
Davy Bansal: Lab Report
Document16 pagini
Davy Bansal: Lab Report
Naman Bansal
Încă nu există evaluări
VMware VSphere Data Protection
Document53 pagini
VMware VSphere Data Protection
Hai
Încă nu există evaluări
Attunity Replicate User Guide PDF
Document831 pagini
Attunity Replicate User Guide PDF
gudicm
Încă nu există evaluări
R3trans Help
Document1 pagină
R3trans Help
Siddesh Raul
Încă nu există evaluări
OmmKrishanParida - CV - 21312 - Omm Krishan Parida
Document2 pagini
OmmKrishanParida - CV - 21312 - Omm Krishan Parida
ommkrishan
Încă nu există evaluări
17 Filemaker Scripts Every Beginner Should Learn First: by Sunny Chu
Document5 pagini
17 Filemaker Scripts Every Beginner Should Learn First: by Sunny Chu
Luis Contreras
Încă nu există evaluări
Metalogix New Server
Document2 pagini
Metalogix New Server
Josh
Încă nu există evaluări
Views in SQL
Document5 pagini
Views in SQL
nandhuln
Încă nu există evaluări
C Tadm70 74
Document2 pagini
C Tadm70 74
karamanan
0% (2)
Ecc To Hana by Bods
Document52 pagini
Ecc To Hana by Bods
Adaikalam Alexander Rayappa
Încă nu există evaluări
DataFlex Reports 2014 User Guide
Document189 pagini
DataFlex Reports 2014 User Guide
stp.vendas2
Încă nu există evaluări
Installation Manual For EFT Integration For AUH Region
Document3 pagini
Installation Manual For EFT Integration For AUH Region
Nejam Raja
Încă nu există evaluări
Optional Logic, If Any Subject Is Below 35 Marks Should Be Failed and Grade Should Be F and 35 and Above Should Be Passed
Document2 pagini
Optional Logic, If Any Subject Is Below 35 Marks Should Be Failed and Grade Should Be F and 35 and Above Should Be Passed
mohan
Încă nu există evaluări
Netbackup For Hyper-V Guide
Document60 pagini
Netbackup For Hyper-V Guide
Zakaria Doumbia
Încă nu există evaluări
SQL Test 1
Document8 pagini
SQL Test 1
Md Shadab Ashraf
Încă nu există evaluări
Siemens Written Test Questions
Document4 pagini
Siemens Written Test Questions
Ponnuru Chakri
Încă nu există evaluări
Oracle GoldenGate Best Practices - Heartbeat Table For Monitoring Lag Times v11.3 ID1299679.1
Document26 pagini
Oracle GoldenGate Best Practices - Heartbeat Table For Monitoring Lag Times v11.3 ID1299679.1
chetansharma88
Încă nu există evaluări
Decision Support System For Online Scholarship Application Through
Document35 pagini
Decision Support System For Online Scholarship Application Through
RONALD RIVERA
Încă nu există evaluări
h2 Database Tutorial
Document58 pagini
h2 Database Tutorial
Jibaeja
Încă nu există evaluări
Excel Basics 4: Create Summary Reports With Pivottables and Sumifs Function (Intro Excel #4)
Document19 pagini
Excel Basics 4: Create Summary Reports With Pivottables and Sumifs Function (Intro Excel #4)
Ashutosh Kumar
Încă nu există evaluări
1.1 A To Z Access Glossary PDF Download PDF
Document4 pagini
1.1 A To Z Access Glossary PDF Download PDF
Md. Rifat Ul Alom Roni 2012809630
Încă nu există evaluări