Milestone Challenge Pentru Setul de Date Pentru Biciclete Uzate

Milestone Challenge pentru setul de date pentru biciclete
uzate
Bine ați venit la Provocarea Milestione, în acest scenariu, veți explora statistici descriptive despre setul de
date de biciclete folosite .
Notă -
 Adăugați celule suplimentare pentru codare, dacă este necesar.
 În cele din urmă, reporniți și rulați toate celulele după finalizarea provocării.
Rulați celula de mai jos pentru a importa pachetele de bază necesare

Notă - Acestea sunt pachete de bază necesare pentru a rezolva această provocare, vă rugăm să includeți
module adecvate din pachetele de mai jos pentru a rezolva această provocare pe baza scenariilor date.
[1]:
import numpy ca np
importa panda ca pd
statistici de import
import scipy
Rulați celula de mai jos pentru a descărca setul de date

[2]:
! wget hrcdn.net / s3_pub / istreet - active /- ccjO7ToeMlvfSIOr - Wxfg / Used_Bikes.csv

--2021-09-22 10:42:42-- http://hrcdn.net/s3_pub/istreet-assets/-ccjO7ToeMlvfSIOr-Wxfg/Used_Bikes.csv
Se rezolvă hrcdn.net (hrcdn.net)... 23.77.203.146, 23.77.203.144, 2600:1407:1800::173f:49d8, ...
Se conectează la hrcdn.net (hrcdn.net)|23.77.203.146|:80... conectat.
Solicitare HTTP trimisă, așteaptă răspuns... 301 Mutat permanent
Locație: https://hrcdn.net/s3_pub/istreet-assets/-ccjO7ToeMlvfSIOr-Wxfg/Used_Bikes.csv [urmează]
--2021-09-22 10:42:42-- https://hrcdn.net/s3_pub/istreet-assets/-ccjO7ToeMlvfSIOr-Wxfg/Used_Bikes.csv
Se conectează la hrcdn.net (hrcdn.net)|23.77.203.146|:443... conectat.
Solicitare HTTP trimisă, se așteaptă răspuns... 200 OK
Lungime: 2493547 (2,4 M) [application/octet-stream]
Se salvează în: „Used_Bikes.csv”
Used_Bikes.csv 100%[====================>] 2,38 M 9,68 MB/s în 0,2 s
2021-09-22 10:42:43 (9,68 MB/s) - „Used_Bikes.csv” salvat [2493547/2493547]
Încărcați setul de date

 Încărcați setul de date Bank Marketing din fișierul Used_Bikes.csv și salvați-l în variabila df.
[13]:
df = pd.read_csv(„Biciclete_Uzate.csv”)
Intrebarea 1
 (a) Din setul de date de mai sus, calculați media pentru toate coloanele numerice și convertiți-o în
dicționar și salvați-o în variabila medie .
 (b) Din setul de date de mai sus, calculați mediana pentru toate coloanele numerice și convertiți-o
în dicționar și salvați-o în variabila mediană .
 (c) Din setul de date de mai sus, calculați modul pentru toate coloanele numerice și convertiți-l în
dicționar și salvați-l în modul variabil.
 (d) Din valorile medii, mediane și mod ale coloanei kms_driven , aceasta este o distribuție
declinată pozitiv.
- Dacă răspunsul pentru afirmația de mai sus este da, atribuiți valoarea yes ca șir, altfel valoarea no ca
șir în variabila kms_driven.
Salvați ieșirile pentru (a), (b) și (c) în următorul format -
{Column Name: Value}
Exemplu -
{'vârsta': 85,85,
„kms_driven”: 1500,01,
„putere”: 200,01}
Notă - Aici rotunjiți valorile medii și mediane la două zecimale și modul la un număr întreg.
[57]:
medie = {"preț": preț.mean(),"kms_driven": kms_driven.mean(),"vârstă" :, age.mean(),"putere" :,

putere.mean()}
imprimare (mediu)
mediană = df.median()
mod = df.mode()
kms_driven = print („Da”)

Fișier „<ipython-input-57-b3982c389b48>” , rândul 1
medie = {"preț": preț.mean(),"kms_driven": kms_driven.mean(),"vârstă" :, age.mean(),"putere" :,
putere.mean()}
^
SyntaxError: sintaxă nevalidă
intrebarea 2
 (a) De la proprietarul coloanei, obțineți numărul tuturor categoriilor și convertiți-l în dicționar și
salvați-l în proprietarul variabilei.
 (b) Proprietarul coloanei pare să aibă o problemă de dezechilibru de clasă înaltă.
- Dacă răspunsul pentru declarația de mai sus este da, atribuiți valoarea yes ca șir, altfel valoarea no
ca șir în variabila class_imb.
Pentru întrebarea (a) salvați rezultatul în următorul format -
{Nume categorie: Număr}
Exemplu -
{„Primul proprietar”: 500,
„Al patrulea proprietar sau mai mult”: 300,
„Al doilea proprietar”: 200}

[58]:
proprietar =
class_imb =
Fișier „<ipython-input-58-7a9c7a6960d5>” , rândul 1
proprietar =
^
Întrebarea 3
 Pentru setul de date dat, găsiți următoarele -
 - (a) Varianta populației setului de date din toate coloanele numerice și salvați-o în variabila
p_var.

- (b) Abaterea standard a populației a setului de date din toate coloanele numerice și salvați-o în
variabila p_sd.
Pentru întrebările (a) și (b) salvați rezultatul în următorul format -
Exemplu -
{'vârsta': 85,85,
„putere”: 200,01}
Notă - Aici rotunjiți valorile la două zecimale și convertiți toate variabilele în dicționar.
[59]:
p_var =
p_sd =
Fișier „<ipython-input-59-039e0a8010f1>” , rândul 1
p_var =
^
Întrebarea 4
 Pentru setul de date dat, găsiți următoarele -
 - (a) Intervalul interquartil al coloanei preț și salvați-l în variabila iqr_price .


- (b) Intervalul interquartil al coloanei kms_driven și salvați-o în variabila iqr_kms_driven.
Notă - Aici rotunjiți valorile la două zecimale.
[ ]:
din scipy.stats import iqr
iqr_price =
iqr_kms_driven =
Întrebarea 5
 (a) Din setul de date dat găsiți matricea de corelație pentru toate coloanele numerice și salvați-o în
variabale df_corr . Aici rotunjiți valorile la două zecimale.
 (b) Din df_corr Vârsta este corelată negativ cu Prețul.

- Dacă răspunsul pentru afirmația de mai sus este da, atribuiți valoarea yes ca șir, altfel valoarea nu ca
șir în variabila Age_Price.
 (c) Din df_corr Puterea este corelată negativ cu Prețul.
șir în variabila Power_Price.
Pentru întrebările (a) salvați rezultatul în următorul format -
{Column Name: {Column Name: Value}}
Exemplu -
{'age': {'age': 0.2, 'kms_driven': 0.08, 'power': -0.25, 'price': 0.08},
'kms_driven': {'vârsta': -0,15,
„putere”: 0,18,
„preț”: 0,58}}
[ ]:
df_corr =
Age_Price =
Power_Price =
Întrebarea 6
 (a) Din setul de date dat găsiți asimetria pentru toate coloanele numerice și salvați-o în variabale
df_skew . Aici rotunjiți valorile la două zecimale.
 (b) Din df_skew , vârsta este destul de simetrică.
șir în variabila Age_Skew.
 (c) De la df_skew puterea este foarte denaturată.
șir în variabila Power_Skew.
Pentru întrebarea (a) salvați rezultatul în următorul format -
Exemplu -
{'vârsta': 55,85,
„putere”: 61,01}
[ ]:
df_skew =
Age_Skew =
Power_Skew =
Rulați celula de mai jos pentru a salva rezultatele

[ ]:
cu open('question1.txt', 'a') ca f:
print(medie, fișier = f)
print(mediana, fisier = f)
print(modul, fișier = f)
print(kms_driven , fisier = f)
print(proprietar, fisier = f)
print(class_imb, fisier = f)
print(p_var , fisier = f)
print(p_sd, fișier = f)
print(iqr_price , fisier = f)
print(iqr_kms_driven , fisier = f)
print(df_corr , fisier = f)
print(Vârsta_Preț, fișier = f)
print(Preț_Putere, fișier = f)
print(df_skew, fișier = f)
print(Age_Skew, fișier = f)
print(Power_Skew , fisier = f)
[ ]:
 Desc_Stats_Question.ipynb
 Used_Bikes.csv
 scor.py
 Terminalul 1
import ast
din hashlib import md5
import json
def get_file(nume_fișier):
cu open(file_name) ca f:
date = f.readlines()
returnează [s.rstrip('\n') pentru s în date]
scor = 0
încerca:
#Intrebarea 1
q1 = 0
întrebare1 = get_file ("întrebare1.txt")
întrebare1_1 = ast.literal_eval(intrebare1[0])
întrebare1_1 =sortată(întrebare1_1.articole(), cheie=lambda x: x[0])
întrebare1_2 = ast.literal_eval(întrebare1[1])
if(md5(str(intrebare1_1).encode()).hexdigest() == "5234e07f99ab2b913f26a9dd0d37a3e7" și
md5(str(intrebare1_2).encode()).hexdigest() == "8cf618082cb737082c73737045"
5(str(intrebare1_3) .encode()).hexdigest() == „7dfebef1f84a7c27b5562b8e84f692b0” și
md5(str(întrebare1[3]).encode()).hexdigest() == „a6105c0a611b41b08f63”):509208f63)
q1 = q1 +20
cu exceptia:
q1 = 0
#Intrebarea 2
încerca:
q2 = 0
if(md5(str(intrebare2_1).encode()).hexdigest() == "69f10a3346bf0f8d8b902a06642ae4ca" și
md5(str(intrebare2[1]).encode()).hexdigest() == "a6105b4090509050505000000000 "):
q2 = q2 + 10
cu exceptia:
q2 = 0
#Întrebarea 3
încerca:
q3 = 0
întrebarea3_2 = ast.literal_eval(întrebarea3[1])
if(md5(str(intrebare3_1).encode()).hexdigest() == "7759614969fe59a095a56b8eb2f6e812" și
md5(str(intrebare3_2).encode()).hexdigest() == "ba8c0fdd0804352fdd804352f6e812"
q3 = q3 + 20
cu exceptia:
q3 = 0
#Întrebarea4
încerca:
q4 = 0

if (md5 (str (întrebarea4 [0]). code ()). hexdigest () == "f19bb046ca4ba9a016360ca151cc8a0a" și
md5 (str (întrebarea4 [1]). code ()). 866 ") :
q4 = q4 +10
cu exceptia:
q4 = 0
#Întrebarea5
încerca:
q5 = 0
if(md5(json.dumps(question5_1, sort_keys=True).encode('utf-8')).hexdigest() ==
"25fa51b43ce1c5bbc55fa494ce634be1" și md5(str(question5[1]).encode()). () ==
„a6105c0a611b41b08f1209506350279e” și md5(str(intrebare5[2]).encode()).hexdigest() ==
„7fa3b767c460b54a2be4d49030b349c7”):
q5 = q5 +20
cu exceptia:
q5 = 0
#Întrebarea 6
încerca:
q6 =0
if(md5(str(question6_1).encode()).hexdigest() == "cf85a8394c75181155a2b67a581601b0" and

md5(str(question6[1]).encode()).hexdigest() == "7fa3b767c460b54a2be4d49030b349c7"):
q6 = q6 +20
cu exceptia:
q6 = 0
încerca:
scor = q1 + q2 + q3 + q4 + q5 + q6
print("FS_SCORE:{0}%".format(score))
cu exceptia:
print("FS_SCORE:0%")

Milestone Challenge Pentru Setul de Date Pentru Biciclete Uzate

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Milestone Challenge Pentru Setul de Date Pentru Biciclete Uzate

Încărcat de

Drepturi de autor:

Formate disponibile

Milestone Challenge pentru setul de date pentru biciclete

 Adăugați celule suplimentare pentru codare, dacă este necesar.

Rulați celula de mai jos pentru a importa pachetele de bază necesare

Rulați celula de mai jos pentru a descărca setul de date

! wget hrcdn.net / s3_pub / istreet - active /- ccjO7ToeMlvfSIOr - Wxfg / Used_Bikes.csv

Used_Bikes.csv 100%[====================>] 2,38 M 9,68 MB/s în 0,2 s

2021-09-22 10:42:43 (9,68 MB/s) - „Used_Bikes.csv” salvat [2493547/2493547]

Încărcați setul de date

{Column Name: Value}

medie = {"preț": preț.mean(),"kms_driven": kms_driven.mean(),"vârstă" :, age.mean(),"putere" :,

kms_driven = print („Da”)

 (b) Proprietarul coloanei pare să aibă o problemă de dezechilibru de clasă înaltă.

{Nume categorie: Număr}

{„Primul proprietar”: 500,

„Al patrulea proprietar sau mai mult”: 300,

„Al doilea proprietar”: 200}

 - (a) Intervalul interquartil al coloanei preț și salvați-l în variabila iqr_price .

din scipy.stats import iqr

 (b) Din df_corr Vârsta este corelată negativ cu Prețul.

{Column Name: {Column Name: Value}}

{'age': {'age': 0.2, 'kms_driven': 0.08, 'power': -0.25, 'price': 0.08},

'kms_driven': {'vârsta': -0,15,

 (b) Din df_skew , vârsta este destul de simetrică.

{Column Name: Value}

Rulați celula de mai jos pentru a salva rezultatele

din hashlib import md5

returnează [s.rstrip('\n') pentru s în date]

întrebare1 = get_file ("întrebare1.txt")

întrebare1_1 =sortată(întrebare1_1.articole(), cheie=lambda x: x[0])

întrebare1_3 =sortată(întrebare1_3.articole(), cheie=lambda x: x[0])

întrebare2 = get_file ("întrebare2.txt")

întrebare2_1 =sortată(întrebare2_1.articole(), cheie=lambda x: x[0])

întrebare3 = get_file ("întrebare3.txt")

întrebare3_1 =sortată(întrebare3_1.articole(), cheie=lambda x: x[0])

întrebare3_2 =sortată(întrebare3_2.articole(), cheie=lambda x: x[0])

întrebare4 = get_file ("întrebare4.txt")

întrebare5 = get_file ("întrebare5.txt")

întrebare5_1 =sortată(întrebare5_1.articole(), cheie=lambda x: x[0])

întrebare6 = get_file ("întrebare6.txt")

întrebare6_1 =sortată(întrebare6_1.articole(), cheie=lambda x: x[0])

if(md5(str(question6_1).encode()).hexdigest() == "cf85a8394c75181155a2b67a581601b0" and

S-ar putea să vă placă și