Bine ați venit la Scribd!

Săriți peste schemele de tip carusel

3 Idiots Approach Display Advertising Challenge

Încărcat de

shafiahmedbd

0% au considerat acest document util (0 voturi)

315 vizualizări15 pagini

Drepturi de autor

Formate disponibile

PDF, TXT sau citiți online pe Scribd

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Raportați acest document

Drepturi de autor:

Formate disponibile

Descărcați ca PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

0% au considerat acest document util (0 voturi)

315 vizualizări15 pagini

3 Idiots Approach Display Advertising Challenge

Încărcat de

shafiahmedbd

Drepturi de autor:

Formate disponibile

Descărcați ca PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

Salt la pagina

Sunteți pe pagina 1din 15

Căutați în document

1/15

3 Idiots Approach for

Display Advertising Challenge
Yu-Chin Juan, Yong Zhuang, and Wei-Sheng Chin
NTU CSIE MLGroup

What This Competition Challenges Us?

Predict the click probabilities of impressions.

2/15

Dataset
Label
1
0
0

I1
3
7
12

I2
20
91
73

I13
2741
1157
1844

C1
68fd1e64
3516f6e6
05db9164
..
.

C2
80e26c9b
cfc86806
38a947a1

C26
4cf72387
796a1a2e
5d93f8ab

1457

68fd1e64

cfc86806

cf59444f

#Train:
#Test:
#Features after one-hot encoding:

3/15

45M
6M
33M

Evaluation

1X
yi log yi + (1 yi ) log (1 yi ),
logloss =
L
i=1

where L is the number of instances, yi is the true label (0 or 1),

and yi is the predicted probability.

4/15

5/15

This slide introduces our approach to achieve 0.44488 and 0.44479

on the public and private leaderboards, respectively.

Flowchart

6/15

Pre-A

nnz=13-39
feat=39

GBDT

nnz=30
feat=30 27

Pre-B

nnz=
69
feat
=10 6

CSV

Rst

Calib.

FFM

nnz means the number of non-zero elements of each impression; feat represents
the size of feature space.

Preprocessing-A

Purpose: generate features for GBDT.

All numerical data are included. (13 features)
Categorical features (after one-hot encoding) appear more
than 4 million times are also included. (26 features)

7/15

Gradient Boosting Decision Tree (GBDT)

8/15

Purpose: generate GBDT features.

We use trees in GBDT to generate features.
30 trees with depth 7 are used.
30 features are generated for each impression.
This approach is proposed by Xinran He et al. at Facebook.

Gradient Boosting Decision Tree (GBDT)

9/15

Example: Assuming that we have already trained GBDT with 3 trees with depth 2.
We feed an impression x into these trees. The first tree thinks x belong to node 4, the
second node 7, and the third node 6. Then we generate the feature 1:4 2:7 3:6 for
this impression.

x
1

2
4

3
5

1:4

2
7

3
5

2:7

2
7

3
5

3:6

Preprocessing-B

10/15

Purpose: generate features for FFM.

Numerical features (I1-I13) greater than 2 are transformed by
v blog(v )2 c.
Categorical features (C1-C26) appear less than 10 times are
transformed into a sepcial value.
GBDT features are directly included.
These three groups of features are hashed into 1M-dimension
by hashing trick.
Each impression has 13 (numerical) + 26 (categorical) + 30
(GBDT) = 69 features.

Hashing Trick

11/15

text

hash function

hash value

mod 106

feature

I1:3

739920192382357839297

839297

C1-68fd1e64

839193251324345167129

167129

GBDT1:173

923490878437598392813

392813

Field-aware Factorization Machine (FFM)

12/15

For the details of FFM, please check the following slides:

http://www.csie.ntu.edu.tw/~r01922136/slides/ffm.pdf

Calibration

Purpose: calibrate the final result.

The average CTRs on the public / private leaderboards are
0.2632 and 0.2627, respectively.
The average CTR of our submission is 0.2663.
There is a gap. So we minus every prediction by 0.003, and
the logloss is reduced by around 0.0001.

13/15

Running Time

14/15

Environment: A workstation with two 6-core CPUs

All processes are parallelized.
Process
Pre-A
GBDT
Pre-B
FFM
Calibration
Total

Time (min.)
8
29
38
100
1
176

Memory (GB)
0
15
0
16
0

Comparison Among Different Methods

15/15

Method
LR-Poly2
FFM
FFM + GBDT
FFM + GBDT (v2)
FFM + GBDT + calib.
FFM + GBDT + calib. (v2)

Public
0.44984
0.44613
0.44497
0.44474
0.44488
0.44461

v2: 50 trees and 8 latent factors

Private
0.44954
0.44598
0.44483
0.44462
0.44479
0.44449

S-ar putea să vă placă și

2 - FPGA Implementation of Pipelined 2D-DCT and Quantization Architecture For JPEG Image Compression.
Document6 pagini
2 - FPGA Implementation of Pipelined 2D-DCT and Quantization Architecture For JPEG Image Compression.
Mahesh Mahi
Încă nu există evaluări
SECTION A: Answer All Five Questions. Each Question Carries Two Marks (5x2 10)
Document4 pagini
SECTION A: Answer All Five Questions. Each Question Carries Two Marks (5x2 10)
sarika gurjar
Încă nu există evaluări
Graphics Display
Document59 pagini
Graphics Display
S RAJESH
Încă nu există evaluări
DSP Lab 13
Document5 pagini
DSP Lab 13
mpssassygirl
Încă nu există evaluări
Question Paper OR
Document6 pagini
Question Paper OR
Gokul K
Încă nu există evaluări
DS Updated PDF Questions
Document35 pagini
DS Updated PDF Questions
diksha1920dangde
Încă nu există evaluări
ENGG1015 Tutorial 5 Handout
Document8 pagini
ENGG1015 Tutorial 5 Handout
Anonymous K4n797I
Încă nu există evaluări
15A03601 Operations Research
Document2 pagini
15A03601 Operations Research
Raj Kumar
Încă nu există evaluări
Digitician
Document10 pagini
Digitician
Pablo Javier Frías
Încă nu există evaluări
CSE679: JPEG: JPEG Goals JPEG Compression Steps Lab
Document24 pagini
CSE679: JPEG: JPEG Goals JPEG Compression Steps Lab
xacdinhdi
Încă nu există evaluări
Golay Code
Document21 pagini
Golay Code
Asif Adyaan
Încă nu există evaluări
P1 Ii2005
Document3 pagini
P1 Ii2005
Boris Yanguez
Încă nu există evaluări
Matlabtalk 2
Document43 pagini
Matlabtalk 2
Anand Balaji
Încă nu există evaluări
Experiment-3.1: Shweta 20BCA1090 Uic (Bca) 20BCA3 "A" 5th 08-11-2022 Computer Graphics Lab 20CAP-316
Document4 pagini
Experiment-3.1: Shweta 20BCA1090 Uic (Bca) 20BCA3 "A" 5th 08-11-2022 Computer Graphics Lab 20CAP-316
Arjun Singh
Încă nu există evaluări
Matlab Talk
Document43 pagini
Matlab Talk
hrishikeshanand
Încă nu există evaluări
Unit - 1: Father of Computer Graphics
Document118 pagini
Unit - 1: Father of Computer Graphics
Prasanna Aravindan
Încă nu există evaluări
11 Mrs. Sadia Patka Dda Line Drawing Algorithm
Document21 pagini
11 Mrs. Sadia Patka Dda Line Drawing Algorithm
sova jetto
Încă nu există evaluări
Systemverilog - Lecture 1
Document62 pagini
Systemverilog - Lecture 1
Shilpa Reddy
Încă nu există evaluări
Simple Data Types in C: Alan L. Cox Alc@rice - Edu
Document41 pagini
Simple Data Types in C: Alan L. Cox Alc@rice - Edu
Niranjana Krishnan
Încă nu există evaluări
DS2 Tutorial 4 - Answers
Document7 pagini
DS2 Tutorial 4 - Answers
sathyanarayanan v
Încă nu există evaluări
Traveling Salesman Problem: A Case Study: Dr. Leena Jain Mr. Amit Bhanot
Document3 pagini
Traveling Salesman Problem: A Case Study: Dr. Leena Jain Mr. Amit Bhanot
maddymahek
Încă nu există evaluări
CMPT 365 Multimedia Systems: Lossy Compression
Document51 pagini
CMPT 365 Multimedia Systems: Lossy Compression
arunkorath6663
Încă nu există evaluări
Lec-4 3
Document12 pagini
Lec-4 3
Aayan Boradia
Încă nu există evaluări
Design and Implementation of A High-Speed, Low-Power VLSI Chip For The DCT Transform
Document34 pagini
Design and Implementation of A High-Speed, Low-Power VLSI Chip For The DCT Transform
Eric Dharan
Încă nu există evaluări
Higher College of Technology Department: Business Studies Assignment Based Assessment Semester: II A. Y.: 2019 / 2020 Student Name Student ID
Document11 pagini
Higher College of Technology Department: Business Studies Assignment Based Assessment Semester: II A. Y.: 2019 / 2020 Student Name Student ID
Rubab Kanwal
Încă nu există evaluări
MS SS 16
Document11 pagini
MS SS 16
f725qcsn74
Încă nu există evaluări
Tutorial 1 Day1
Document15 pagini
Tutorial 1 Day1
Gaurav Gaur
Încă nu există evaluări
Generating Random Numbers W. Implementation in C
Document43 pagini
Generating Random Numbers W. Implementation in C
janeThomas
Încă nu există evaluări
TI-89 Manual With Solutions
Document128 pagini
TI-89 Manual With Solutions
Ruben Perez Rivera
Încă nu există evaluări
Computer Graphics Question Bank
Document9 pagini
Computer Graphics Question Bank
Rahul Kumar
Încă nu există evaluări
Multinomial Logit Models With R: Library (Mlogit)
Document8 pagini
Multinomial Logit Models With R: Library (Mlogit)
Páblo Dias
Încă nu există evaluări
Display List
Document4 pagini
Display List
George Puiu
Încă nu există evaluări
Mat Lab Program
Document10 pagini
Mat Lab Program
Muhammad zaid
Încă nu există evaluări
Activity 2.3.1 Hexadecimal
Document5 pagini
Activity 2.3.1 Hexadecimal
travis
Încă nu există evaluări
Communication Lab Part-B, Experiment-3 and 4.
Document6 pagini
Communication Lab Part-B, Experiment-3 and 4.
GOWRI B M
Încă nu există evaluări
R Graphics4
Document51 pagini
R Graphics4
mopliq
Încă nu există evaluări
Turning Point Multiply by Two Digits
Document23 pagini
Turning Point Multiply by Two Digits
Bea Datay
Încă nu există evaluări
Software Process and Requirement
Document25 pagini
Software Process and Requirement
Unicorn54
Încă nu există evaluări
Ggplot2 Scatter Plots - Quick Start Guide - R Software and Data Visualization - Easy Guides - Wiki - STHDA
Document25 pagini
Ggplot2 Scatter Plots - Quick Start Guide - R Software and Data Visualization - Easy Guides - Wiki - STHDA
icen00b
Încă nu există evaluări
P&S 2020im14 Assignment Final
Document29 pagini
P&S 2020im14 Assignment Final
Muhammad Asim Muhammad Arshad
Încă nu există evaluări
Dar Solved Ans
Document20 pagini
Dar Solved Ans
Dev
Încă nu există evaluări
Chapter 3 Arithmetic For Computers-New
Document32 pagini
Chapter 3 Arithmetic For Computers-New
Stephanie
Încă nu există evaluări
On Building An R Report (Problem Set 0) : Objective
Document7 pagini
On Building An R Report (Problem Set 0) : Objective
Abner ogega
Încă nu există evaluări
Computer Graphics: Design of Line Algorithms
Document43 pagini
Computer Graphics: Design of Line Algorithms
Ahmed Fathi
Încă nu există evaluări
1.1 About Computer Graphics
Document30 pagini
1.1 About Computer Graphics
kishore
Încă nu există evaluări
Computer Graphis
Document7 pagini
Computer Graphis
Albin Ps Plappallil
Încă nu există evaluări
3 Lab Manual
Document45 pagini
3 Lab Manual
saikrishna645
Încă nu există evaluări
OR Record
Document35 pagini
OR Record
GOWTHAM H : CSBS DEPT
Încă nu există evaluări
Week 2 - Intro Mosel
Document46 pagini
Week 2 - Intro Mosel
Emile Cornelissen
Încă nu există evaluări
DDA Algorithm
Document5 pagini
DDA Algorithm
Neha Kirad
Încă nu există evaluări
Business Analytics-1: STR (Crew - Data)
Document16 pagini
Business Analytics-1: STR (Crew - Data)
Nikhil Malhotra
Încă nu există evaluări
System Identification Curve Fitting
Document24 pagini
System Identification Curve Fitting
hammoudeh13
Încă nu există evaluări
Coding Round TechgigMagicServ
Document6 pagini
Coding Round TechgigMagicServ
nishantgaurav23
Încă nu există evaluări
Computer Graphics Lab (CSP-305) Worksheet-2
Document5 pagini
Computer Graphics Lab (CSP-305) Worksheet-2
Samridh Garg
Încă nu există evaluări
How To Transfer in The Best Effective Way?: Transportation Problems (Network Problems)
Document9 pagini
How To Transfer in The Best Effective Way?: Transportation Problems (Network Problems)
Nathalia Shimizu
Încă nu există evaluări
Design A Fast ALU For The MIPS ISA - Requirements ?
Document71 pagini
Design A Fast ALU For The MIPS ISA - Requirements ?
thanhvnpt
Încă nu există evaluări
School of Computer Science and Engineering Winter Session 2020-21
Document45 pagini
School of Computer Science and Engineering Winter Session 2020-21
Priyanshu Mishra
Încă nu există evaluări
B.Sc.-Computer Science PDF
Document85 pagini
B.Sc.-Computer Science PDF
Piyush Annadate
Încă nu există evaluări
From Pixels to Animation: An Introduction to Graphics Programming
De la Everand
From Pixels to Animation: An Introduction to Graphics Programming
James Alan Farrell
Evaluare: 1 din 5 stele
1/5 (1)
Projects With Microcontrollers And PICC
De la Everand
Projects With Microcontrollers And PICC
Guillermo Perez Guillen
Evaluare: 5 din 5 stele
5/5 (1)
Multimodal Memetic Framework For Low-Resolution Protein Structure Prediction
Document46 pagini
Multimodal Memetic Framework For Low-Resolution Protein Structure Prediction
shafiahmedbd
Încă nu există evaluări
Amplmod
Document65 pagini
Amplmod
Syed Anwar Ul Hasan
Încă nu există evaluări
Large Divisions
Document7 pagini
Large Divisions
shafiahmedbd
Încă nu există evaluări
The Customer Value Gap
Document41 pagini
The Customer Value Gap
shafiahmedbd
Încă nu există evaluări
Becoming Productive in Haskell
Document7 pagini
Becoming Productive in Haskell
shafiahmedbd
Încă nu există evaluări
KSC2016 - Recurrent Neural Networks
Document66 pagini
KSC2016 - Recurrent Neural Networks
shafiahmedbd
Încă nu există evaluări
Child Development Table
Document1 pagină
Child Development Table
shafiahmedbd
Încă nu există evaluări
What - Are - Confidence Interval and P Value
Document8 pagini
What - Are - Confidence Interval and P Value
rxmd1
100% (1)
The High-Interest Credit Card of Technical Debt
Document9 pagini
The High-Interest Credit Card of Technical Debt
diana.yanti
Încă nu există evaluări
666 PDF
Document12 pagini
666 PDF
shafiahmedbd
Încă nu există evaluări
Python Optimization Modeling Objects (Pyomo)
Document17 pagini
Python Optimization Modeling Objects (Pyomo)
arteepu4
Încă nu există evaluări
How The Internet Works
Document17 pagini
How The Internet Works
shafiahmedbd
Încă nu există evaluări
Polya
Document4 pagini
Polya
api-211170679
Încă nu există evaluări
Introduction To Probability - Grinstead - Solutions To Odd Numbers
Document74 pagini
Introduction To Probability - Grinstead - Solutions To Odd Numbers
shafiahmedbd
Încă nu există evaluări
Linear Algebra
Document496 pagini
Linear Algebra
larybags
Încă nu există evaluări
Matrix Mult
Document72 pagini
Matrix Mult
shafiahmedbd
Încă nu există evaluări
Alain de Botton On Why We Travel - FT
Document6 pagini
Alain de Botton On Why We Travel - FT
shafiahmedbd
Încă nu există evaluări
Strassen
Document8 pagini
Strassen
shafiahmedbd
Încă nu există evaluări
Donald Knuth
Document21 pagini
Donald Knuth
davemallows
Încă nu există evaluări
Application Form Buttercup-Primary
Document5 pagini
Application Form Buttercup-Primary
shafiahmedbd
Încă nu există evaluări
Emacs For Data Science
Document8 pagini
Emacs For Data Science
shafiahmedbd
Încă nu există evaluări
Dynamo: Amazon's Highly Available Key-Value Store
Document16 pagini
Dynamo: Amazon's Highly Available Key-Value Store
Jeff Pratt
Încă nu există evaluări
Save
Document1 pagină
Save
shafiahmedbd
Încă nu există evaluări
Baishakh
Document1 pagină
Baishakh
shafiahmedbd
Încă nu există evaluări
Intelligent Web Servers As Agents: Mauro Gaspari Nicola Dragoni Davide Guidi
Document13 pagini
Intelligent Web Servers As Agents: Mauro Gaspari Nicola Dragoni Davide Guidi
shafiahmedbd
Încă nu există evaluări
Qualification of Class Y Flip Chip Cga Package Technology For Space
Document8 pagini
Qualification of Class Y Flip Chip Cga Package Technology For Space
Pepe Chorizo
Încă nu există evaluări
Standalone Financial Results, Limited Review Report For December 31, 2016 (Result)
Document4 pagini
Standalone Financial Results, Limited Review Report For December 31, 2016 (Result)
Shyam Sunder
Încă nu există evaluări
(LaSalle Initiative) 0
Document4 pagini
(LaSalle Initiative) 0
Ann Dwyer
Încă nu există evaluări
Cryptocurrency Research PDF
Document59 pagini
Cryptocurrency Research PDF
Anupriya
Încă nu există evaluări
The Evolution of Knowledge Management Systems Needs To Be Managed
Document14 pagini
The Evolution of Knowledge Management Systems Needs To Be Managed
henaedi
Încă nu există evaluări
Case Studies Interview
Document7 pagini
Case Studies Interview
xuyq_richard8867
100% (2)
Information Security Master Plan
Document6 pagini
Information Security Master Plan
Marubadi Rudra Shylesh Kumar
100% (2)
Sun God Nika
Document2 pagini
Sun God Nika
Elibom Dnegel
Încă nu există evaluări
All About History History of Communism - 4th Edition 2022
Document148 pagini
All About History History of Communism - 4th Edition 2022
Duke
100% (1)
Industry General
Document24 pagini
Industry General
ilieoniciuc
Încă nu există evaluări
Manual de Utilizare HUMAX DIGI TV RDS
Document116 pagini
Manual de Utilizare HUMAX DIGI TV RDS
enamicul50
Încă nu există evaluări
Top Survival Tips - Kevin Reeve - OnPoint Tactical PDF
Document8 pagini
Top Survival Tips - Kevin Reeve - OnPoint Tactical PDF
BillLudley5
100% (1)
Service M5X0G SM
Document98 pagini
Service M5X0G SM
biancocf
Încă nu există evaluări
CMS156
Document64 pagini
CMS156
Andres Raymond
Încă nu există evaluări
Grade 7 Hazards and Risks
Document27 pagini
Grade 7 Hazards and Risks
PEMAR ACOSTA
75% (4)
HAI ROBOTICS Introduction ENV2022.0829 Marketing
Document40 pagini
HAI ROBOTICS Introduction ENV2022.0829 Marketing
Kit Woo
Încă nu există evaluări
Cognitive Coaching Adelaide
Document3 pagini
Cognitive Coaching Adelaide
Business-Edu
100% (2)
Using Ms-Dos 6.22
Document1.053 pagini
Using Ms-Dos 6.22
lorimer78
100% (3)
Mystakidis2022 Metaverse
Document13 pagini
Mystakidis2022 Metaverse
Vennela Nandikonda
Încă nu există evaluări
Water Flow Meter Types
Document2 pagini
Water Flow Meter Types
Mohamad Asrul
Încă nu există evaluări
8A L31 Phiếu BT
Document7 pagini
8A L31 Phiếu BT
viennhu
Încă nu există evaluări
Term Paper A and C
Document9 pagini
Term Paper A and C
Kishaloy Nath
Încă nu există evaluări
Green Protect
Document182 pagini
Green Protect
Luka Kostic
Încă nu există evaluări
COACHING TOOLS Mod4 TGOROW
Document6 pagini
COACHING TOOLS Mod4 TGOROW
Zoltan GZoltan
Încă nu există evaluări
Pinterest or Thinterest Social Comparison and Body Image On Social Media
Document9 pagini
Pinterest or Thinterest Social Comparison and Body Image On Social Media
Agung Ikhssani
Încă nu există evaluări
LNWH Alcohol GUIDELINE SUMMARY 2018
Document1 pagină
LNWH Alcohol GUIDELINE SUMMARY 2018
Ai Hwa Lim
Încă nu există evaluări
Application of The Ritz Method To The Analysis of Non-Linear Free Vibrations of Beams
Document12 pagini
Application of The Ritz Method To The Analysis of Non-Linear Free Vibrations of Beams
Kuldeep Bhattacharjee
Încă nu există evaluări
Video Observation
Document8 pagini
Video Observation
api-532202065
Încă nu există evaluări
CA Level 2
Document50 pagini
CA Level 2
Cikya Comel
Încă nu există evaluări
Aryan Civilization and Invasion Theory
Document60 pagini
Aryan Civilization and Invasion Theory
Saleh Mohammad Tarif 1912343630
Încă nu există evaluări