Sunteți pe pagina 1din 41

https://digitaloptima.

id

@digitaloptima_id

https://bit.ly/digitaloptima_id

https://bit.ly/digitaloptima_ina
Yusuf Ricky Carell
Career
✓Founder & CEO DOIT (PT.Digital Optima Integra)
✓Executive Director IOS Consultant (PT.Inspirasi Optima Selaras)
✓Founder Young Enterpreneur Partner Academy
✓IT Manager Corporate STU

Experience
✓15 Years as IT Profesional Consultant Web and Mobile Application Development For
Industrial Manufacure ,Trade & Services Company For More than 100 Company
✓6 Years Profesional Trainer For Industrial Management
✓Part Time Lecture Prodi Business Logistic Fisip Adbis Unpad

Education & Certification


✓Post Graduate Diploma In Digital Busines Executive Education Columbia Business
School
✓Diploma In Digital Transformation Executive Education UC Berkeley
✓National Certified Trainer BNSP
✓Certified Data Scientist Universitas Multimedia Nusantara
✓Certified As Lead Auditor For Management System British Standard Institute
✓Oracle Workforce Developer

+6282134971500

@yjust_doit
Agenda
00 Insight
01 Big Data
Mengenal Big Data.

02 Arsitektur Big Data


Memahami Arsitektur Big Data

03 Konsep & Terminologi


Memahami Konsep & Terminologi , Karatkterisik & Type Data

04 Big Data Analyctics Life Cycle


Memahami Siklus Hidup Big Data.

05 Penerapan Big Data


Penerapan Big Data Dalam Bisnis.
APA YANG TERJADI DI
INTERNET SELAMA TAHUN 2019
2 JUTA LAGU DIPUTAR
4.5 JUTA VIDEO DIPUTAR SECARA ONLINE DI
DI YOUTUBE SETIAP SATU SPOTIFY SETIAP SATU
MENIT MENIT

3,8 JUTA PENCARIAN DI


GOOGLE SETIAP SATU
MENIT.
347 RIBU ORANG TWEETS
VIA TWITTER SETIAP SATU
MENIT.

348 RIBU ORANG SCROL


INSTAGRAM SETIAP SATU
MENIT
101001101001000010101

B
0011110111011011011010
101000011100101011001

I G DATA
010100111010100010101
0001011010110110110100
010101110001010100010
1000101110101100010011
010011010010000101010

APA ITU ???


0111101110110110110101
010000111001010110010
101001110101000101010
Big data adalah istilah yang menggambarkan 0010110101101101101001
volume besar data baik terstruktur maupun
tidak terstruktur.

BIG DATA
• BUKAN TEKNOLOGI
• BUKAN FRAMEWORK
• BUKAN PROGRAM
ARSITEKTUR BIG DATA
DATA
SOURCE
10 TB



APLIKASI
Apache Hive is an open source data warehouse
system used for querying and analyzing large
datasets stored in Hadoop files. It process
structured and semi-structured data in Hadoop. HDFS. PigLatin is a language used
Hadoop YARN provides the Hive also support analysis of large datasets
resource management. It is the stored in HDFS and also in Amazon S3 filesystem
in pig which is very similar to SQL.
operating system of Hadoop. So, is supported by Hive. Hive uses the language Pig loads the data, apply the
called HiveQL (HQL), which is similar to SQL. required filters and dump the data
it is responsible for managing HiveQL automatically translates SQL-like queries
and monitoring workloads, into MapReduce jobs. in the required format. Pig also
implementing security controls.. converts all the operation into Map
and Reduce tasks.

Apache HBase is NoSQL


• Map – It is the first phase of
database that runs on the top of
processing, where we specify all
Hadoop. It is a database that
the complex logic code.
stores structured data in tables
• Reduce – It is the second phase of
that could have billions of rows
processing. Here we specify light-
and millions of columns. HBase
weight processing like
also provides real-time access to
aggregation/summation.
read or write data in HDFS..
.

Hadoop Distributed File Avro It is an open source project that


System (HDFS) is the primary provides data serialization and data
storage system of Hadoop. exchange services for Hadoop. Using
HDFS store very large files serialization, service programs can
serialize data into files or messages.
running on a cluster of
It also stores data definition and data
commodity hardware
together in one message or file. or
message.
Teknologi Big Data adalah bidang yang didedikasikan untukmengumpulkan dan menyimpan
data dalam kapasitas dan kompleksitas besar yang sering berasal dari sumber
yang berbeda kemudian melakukan pemrosesan dan analisis data

Teknologi Big Data bukan untuk menggantikan manajemen


database "tradisional“ (untuk saat ini)

Analisis dataset Big Data membutuhkan


keahlian dari berbagai disiplin ilmu seperti
matematika, statistik, ilmu computer dan
keahlian spesifik lainnya.

Data dalam Big Data environment


umumnya terakumulas dari aplikasi,
sensor atausumber ekternal lainnya
01
02
03
DATA SET
Prescriptive Analyctics C
O
V M
A Predictive Analytics P
L
L E
U Diagnostic Analyctics X
I
E T
Descriptive Analyctics Y
Analisis deskriptif dilakukan untuk menjawab
pertanyaan tentang peristiwayang telah terjadi.
Bentuk analisis ini membuat kontekstual data untuk
menghasilkan informasi.

• Dihasilkanoleh ad-hoc reporting atau dashboards


• Nilai-> rendah
• Ketrampilan yg dibutuhkan juga hanya skill dasar

• Berapavolume penjualan12 bulanterakhir?

• Berapa jumlah permintaan layanan yang diterima


yang dikategorikan berdasarkan tingkat keparahan
dan lokasi geografis?

• Berapa komisi bulanan yang diperoleh oleh


setiap sales agent?
Analisis diagnostik bertujuan untuk menentukan
penyebab fenomena yang terjadi di masa lalu,
menggunakan pertanyaan yang berfokus pada
alasan di balik peristiwa tersebut.
✓ Value lebih baik dari Descriptive Analytics dan
membutuhkan skill yang lebih tinggi
✓ Data dari berbagai sumber
✓ Data disimpan dalam struktur yg sesuai untuk
keperluan drill-down dan roll-up analysis

1. Mengapa Q2 sales lebih kecil dari Q1 sales?

2. Mengapa permintaan support banyak berasal


dari wilayah barat daripada wilayah timur?

3. Mengapa ada peningkatan re-admission pasien


selama tiga bulan terakhir?
• Analisis prediktif dilakukan dalam upaya untuk
menentukan kemungkinan suatu peristiwa akan
terjadi di masa depan.

• Memahami keterkaitan kondisi saat ini atau


kondisi-kondisi sebelumnya dengan peristiwa
yang akan datang.

• Pertanyaan yang sering dilontarkan dalam


formulasi "apa-jika",

1. Seberapa kemungkinan pelanggan akan gagal dalam


pinjaman jika mereka tidak melakukan pembayaran bulanan?

2. Berapa tingkat kelangsungan hidup pasien jika Obat B


diberikan sebagai pengganti Obat A?

3. Jika pelanggan telah membeli Produk A dan B, berapa


peluang mereka juga akan membeli Produk C?
• Prescriptive Analytics dibangun berdasarkan
predictive analytics dengan memilih tindakan
yang paling efisien yang harus diambil

• Tindakan yang diambil harus mempunyai alasan


yang kuat untuk mendapatkan keuntungan atau
mengurangi resiko .

1. Prescriptive Analytics dibangun berdasarkan predictive


analytics dengan memilih tindakan yang paling efisien yang
harus diambil

2. Tindakan yang diambil harus mempunyai alasan yang kuat


untuk mendapatkan keuntungan atau mengurangi resiko .
You can simply impress your audience and
add a unique zing and appeal to your
Presentations. Easy to change colors,
photos and Text. Get a modern
PowerPoint Presentation that is beautifully
designed. You can simply impress your
audience and add a unique zing and
appeal to your Presentations. Easy to
change colors, photos and Text. Get a
modern PowerPoint Presentation that is
beautifully designed.

Modern
Portfolio
Presentation


You can simply impress your audience and
add a unique zing and appeal to your
Presentations. Easy to change colors,
photos and Text. Get a modern
PowerPoint Presentation that is beautifully
designed. You can simply impress your
audience and add a unique zing and
appeal to your Presentations. Easy to
change colors, photos and Text. Get a
modern PowerPoint Presentation that is
beautifully designed.

Modern
Portfolio
Presentation







BIG DATA ANALYCTIS
LIFE CYCLE
STAGE1 STAGE2 STAGE3 STAGE 4 STAGE5 STAGE6 STAGE7

Business Case Data Acquition Data Validation Data


Evaluation & Filtering & Cleansing Representation
Memilih dan • Menetapkanaturan
Proses representasi
Menentukan alasan,
menyaring data validasi struktur data yang
Batasan dan tujuan
untuk menghapus • Memeriksa data Data baru hasil dari dua
yang jelas di awal
Data data yang tidak yang ada sudah Aggregation dataset yang
sebelum Data Extraction
Identification diperlukan atau valid atautidak • Penggabungan digabungkan
menjalankan
tidak memiliki nilai Mengubah format • Menghapus data Dua Dataset yang
analisa yang tidak valid
Mengidentifikasi untuk dianalisa data dari berbagai berbeda
datasets yang sumber menjadi • Data yang tidak • Data bisa saja
diperlukan dan sesuai dengan valid dapat tersebar di
sumber datanya format data solution mengubah dan berbagai datasets
memalsukan hasil sehingga harus
berasal darimana Big Data
analisis digabung
• Mengintegrasikan
beberapa datasets
Menganalisa data yang sebenarnya
▪ Bisa melibatkan berbagai metode analisa
▪ Bisa berulang untuk sampai pola atau korelasi yang tepat
ditemukan
Analisa data bisa dibagi dua yaitu Confirmatory analysis dan
Exploratory Data Analysis

▪ Melakukan pendekatan deduktif, penyebab fenomena


diusulkan di depan (hipotesis)
▪ Analisa data digunakan untuk membuktikan atau
menyangkal hipotetsis

▪ Menggunakan pendekatan induktif, tidak ada hipotesisi di


depan
▪ Data dieksplorasi melalui analisis untuk mengembangkan
pemahaman tentang penyebab fenomena tersebut
✓ Hasil Analisa tidak akan bermanfaat jika yang paham hanya ahli
Analisa data

✓ Menggunakan Teknik visualisasi data dan alat untuk secara


grafis mengkomunikasikan hasil analisis untuk interpretasi yang
efektif oleh pengguna bisnis.

Memanfaatkanhasilanalisauntukkeperlanyang lebihbesar setelah


hasil analisis tersedia bagi pengguna bisnis untuk mendukung
pengambilan keputusan bisnis, seperti melalui dashboard,
mungkin ada peluang lebih lanjut untuk memanfaatkan hasil
analisis.

✓ Sebagai input untuk enterprise system


✓ Optimasi bisnis proses
✓ Alert
PRODUCT DEVELOPMENT

➢ Dengan memanfaatkan Big Data Perusahaan dapat membuat


produk yang terhubung dengan konsumen, serta memberikan nilai
tambah terhadap prod, meminimalkan resiko kegagalan,
mengalokasikan dan mengkoordinasikan penggunaan, sumber daya
penelitian lebih efisien..

➢ Dengan pemodelan preditktif analysis, perusahaan dapat


memperkirakan kinerja produk di pasar baik pra dan pasca
peluncuran dalam waktu dekat, menentukan rantai distribusi yang
optimal, dan mengoptimalkan strategi pemasaran untuk
memperoleh jumlah terbesar. pelanggan dengan biaya terendah.
MARKETING & ADVERTISING

Big Data dapat digambarkan sebagai sejumlah besar


informasi, yang dapat membantu pengiklan dan tim
marketing mendapatkan wawasan penting tentang demografi
target mereka. Melalui Big Data Analytics tim marketing dapat
mengetahui detail yang relevan, seperti pola belanja, minat,
kebiasaan dan tren konsumen.
CLOUD COMPUTING

Cloud computing dapat menyediakan tiga bahan penting yang


diperlukan untuk solusi Big Data:

➢ Dataset eksternal,
➢ Kemampuan pemrosesan skala besar
➢ Penyimpanan dalam jumlah besar
Q&A

THANK YOU
DREAM IT - WISH IT - DO IT

https://digitaloptima.id https://www.databootcamp.id

@digitaloptima_id
https://www.devbootcamp.id
https://bit.ly/digitaloptima_id

https://bit.ly/digitaloptima_ina

S-ar putea să vă placă și