Sunteți pe pagina 1din 11

Milestone Challenge pentru setul de date pentru biciclete

uzate
Bine ați venit la Provocarea Milestione, în acest scenariu, veți explora statistici descriptive despre setul de
date de biciclete folosite .

Notă -

 Adăugați celule suplimentare pentru codare, dacă este necesar.

 În cele din urmă, reporniți și rulați toate celulele după finalizarea provocării.

Rulați celula de mai jos pentru a importa pachetele de bază necesare


Notă - Acestea sunt pachete de bază necesare pentru a rezolva această provocare, vă rugăm să includeți
module adecvate din pachetele de mai jos pentru a rezolva această provocare pe baza scenariilor date.
[1]:

import numpy ca np
importa panda ca pd
statistici de import
import scipy

Rulați celula de mai jos pentru a descărca setul de date


[2]:

! wget hrcdn.net / s3_pub / istreet - active /- ccjO7ToeMlvfSIOr - Wxfg / Used_Bikes.csv


--2021-09-22 10:42:42-- http://hrcdn.net/s3_pub/istreet-assets/-ccjO7ToeMlvfSIOr-Wxfg/Used_Bikes.csv
Se rezolvă hrcdn.net (hrcdn.net)... 23.77.203.146, 23.77.203.144, 2600:1407:1800::173f:49d8, ...
Se conectează la hrcdn.net (hrcdn.net)|23.77.203.146|:80... conectat.
Solicitare HTTP trimisă, așteaptă răspuns... 301 Mutat permanent
Locație: https://hrcdn.net/s3_pub/istreet-assets/-ccjO7ToeMlvfSIOr-Wxfg/Used_Bikes.csv [urmează]
--2021-09-22 10:42:42-- https://hrcdn.net/s3_pub/istreet-assets/-ccjO7ToeMlvfSIOr-Wxfg/Used_Bikes.csv
Se conectează la hrcdn.net (hrcdn.net)|23.77.203.146|:443... conectat.
Solicitare HTTP trimisă, se așteaptă răspuns... 200 OK
Lungime: 2493547 (2,4 M) [application/octet-stream]
Se salvează în: „Used_Bikes.csv”

Used_Bikes.csv 100%[====================>] 2,38 M 9,68 MB/s în 0,2 s

2021-09-22 10:42:43 (9,68 MB/s) - „Used_Bikes.csv” salvat [2493547/2493547]

Încărcați setul de date


 Încărcați setul de date Bank Marketing din fișierul Used_Bikes.csv și salvați-l în variabila df.

[13]:

df = pd.read_csv(„Biciclete_Uzate.csv”)

Intrebarea 1
 (a) Din setul de date de mai sus, calculați media pentru toate coloanele numerice și convertiți-o în
dicționar și salvați-o în variabila medie .

 (b) Din setul de date de mai sus, calculați mediana pentru toate coloanele numerice și convertiți-o
în dicționar și salvați-o în variabila mediană .

 (c) Din setul de date de mai sus, calculați modul pentru toate coloanele numerice și convertiți-l în
dicționar și salvați-l în modul variabil.

 (d) Din valorile medii, mediane și mod ale coloanei kms_driven , aceasta este o distribuție
declinată pozitiv.

- Dacă răspunsul pentru afirmația de mai sus este da, atribuiți valoarea yes ca șir, altfel valoarea no ca
șir în variabila kms_driven.
Salvați ieșirile pentru (a), (b) și (c) în următorul format -

{Column Name: Value}

Exemplu -

{'vârsta': 85,85,

„kms_driven”: 1500,01,

„putere”: 200,01}

Notă - Aici rotunjiți valorile medii și mediane la două zecimale și modul la un număr întreg.
[57]:

medie = {"preț": preț.mean(),"kms_driven": kms_driven.mean(),"vârstă" :, age.mean(),"putere" :,


putere.mean()}

imprimare (mediu)

mediană = df.median()
mod = df.mode()

kms_driven = print („Da”)


Fișier „<ipython-input-57-b3982c389b48>” , rândul 1
medie = {"preț": preț.mean(),"kms_driven": kms_driven.mean(),"vârstă" :, age.mean(),"putere" :,
putere.mean()}
^
SyntaxError: sintaxă nevalidă

intrebarea 2
 (a) De la proprietarul coloanei, obțineți numărul tuturor categoriilor și convertiți-l în dicționar și
salvați-l în proprietarul variabilei.

 (b) Proprietarul coloanei pare să aibă o problemă de dezechilibru de clasă înaltă.

- Dacă răspunsul pentru declarația de mai sus este da, atribuiți valoarea yes ca șir, altfel valoarea no
ca șir în variabila class_imb.
Pentru întrebarea (a) salvați rezultatul în următorul format -

{Nume categorie: Număr}

Exemplu -

{„Primul proprietar”: 500,

„Al patrulea proprietar sau mai mult”: 300,

„Al doilea proprietar”: 200}


[58]:

proprietar =

class_imb =
Fișier „<ipython-input-58-7a9c7a6960d5>” , rândul 1
proprietar =
^
SyntaxError: sintaxă nevalidă

Întrebarea 3
 Pentru setul de date dat, găsiți următoarele -

 - (a) Varianta populației setului de date din toate coloanele numerice și salvați-o în variabila
p_var.

- (b) Abaterea standard a populației a setului de date din toate coloanele numerice și salvați-o în
variabila p_sd.
Pentru întrebările (a) și (b) salvați rezultatul în următorul format -
{Column Name: Value}

Exemplu -

{'vârsta': 85,85,

„kms_driven”: 1500,01,

„putere”: 200,01}

Notă - Aici rotunjiți valorile la două zecimale și convertiți toate variabilele în dicționar.
[59]:

p_var =

p_sd =
Fișier „<ipython-input-59-039e0a8010f1>” , rândul 1
p_var =
^
SyntaxError: sintaxă nevalidă

Întrebarea 4
 Pentru setul de date dat, găsiți următoarele -

 - (a) Intervalul interquartil al coloanei preț și salvați-l în variabila iqr_price .



- (b) Intervalul interquartil al coloanei kms_driven și salvați-o în variabila iqr_kms_driven.
Notă - Aici rotunjiți valorile la două zecimale.
[ ]:

din scipy.stats import iqr

iqr_price =

iqr_kms_driven =

Întrebarea 5
 (a) Din setul de date dat găsiți matricea de corelație pentru toate coloanele numerice și salvați-o în
variabale df_corr . Aici rotunjiți valorile la două zecimale.

 (b) Din df_corr Vârsta este corelată negativ cu Prețul.


- Dacă răspunsul pentru afirmația de mai sus este da, atribuiți valoarea yes ca șir, altfel valoarea nu ca
șir în variabila Age_Price.
 (c) Din df_corr Puterea este corelată negativ cu Prețul.

- Dacă răspunsul pentru afirmația de mai sus este da, atribuiți valoarea yes ca șir, altfel valoarea nu ca
șir în variabila Power_Price.
Pentru întrebările (a) salvați rezultatul în următorul format -

{Column Name: {Column Name: Value}}

Exemplu -

{'age': {'age': 0.2, 'kms_driven': 0.08, 'power': -0.25, 'price': 0.08},

'kms_driven': {'vârsta': -0,15,

„kms_driven”: 0,3,

„putere”: 0,18,

„preț”: 0,58}}
[ ]:

df_corr =

Age_Price =

Power_Price =

Întrebarea 6
 (a) Din setul de date dat găsiți asimetria pentru toate coloanele numerice și salvați-o în variabale
df_skew . Aici rotunjiți valorile la două zecimale.

 (b) Din df_skew , vârsta este destul de simetrică.

- Dacă răspunsul pentru afirmația de mai sus este da, atribuiți valoarea yes ca șir, altfel valoarea nu ca
șir în variabila Age_Skew.
 (c) De la df_skew puterea este foarte denaturată.

- Dacă răspunsul pentru afirmația de mai sus este da, atribuiți valoarea yes ca șir, altfel valoarea nu ca
șir în variabila Power_Skew.
Pentru întrebarea (a) salvați rezultatul în următorul format -

{Column Name: Value}

Exemplu -
{'vârsta': 55,85,

„kms_driven”: 76,01,

„putere”: 61,01}
[ ]:

df_skew =

Age_Skew =

Power_Skew =

Rulați celula de mai jos pentru a salva rezultatele


[ ]:

cu open('question1.txt', 'a') ca f:

print(medie, fișier = f)
print(mediana, fisier = f)
print(modul, fișier = f)
print(kms_driven , fisier = f)

cu open('question2.txt', 'a') ca f:
print(proprietar, fisier = f)
print(class_imb, fisier = f)

cu open('question3.txt', 'a') ca f:
print(p_var , fisier = f)
print(p_sd, fișier = f)

cu open('question4.txt', 'a') ca f:
print(iqr_price , fisier = f)
print(iqr_kms_driven , fisier = f)

cu open('question5.txt', 'a') ca f:

print(df_corr , fisier = f)
print(Vârsta_Preț, fișier = f)
print(Preț_Putere, fișier = f)

cu open('question6.txt', 'a') ca f:
print(df_skew, fișier = f)
print(Age_Skew, fișier = f)
print(Power_Skew , fisier = f)
[ ]:

 Desc_Stats_Question.ipynb
 Used_Bikes.csv
 scor.py
 Terminalul 1

import ast

din hashlib import md5

import json

def get_file(nume_fișier):

cu open(file_name) ca f:

date = f.readlines()

returnează [s.rstrip('\n') pentru s în date]

scor = 0

încerca:

#Intrebarea 1

q1 = 0

întrebare1 = get_file ("întrebare1.txt")

întrebare1_1 = ast.literal_eval(intrebare1[0])

întrebare1_1 =sortată(întrebare1_1.articole(), cheie=lambda x: x[0])

întrebare1_2 = ast.literal_eval(întrebare1[1])
întrebare1_2 =sortată(întrebare1_2.articole(), cheie=lambda x: x[0])

întrebare1_3 = ast.literal_eval(întrebare1[2])

întrebare1_3 =sortată(întrebare1_3.articole(), cheie=lambda x: x[0])

if(md5(str(intrebare1_1).encode()).hexdigest() == "5234e07f99ab2b913f26a9dd0d37a3e7" și
md5(str(intrebare1_2).encode()).hexdigest() == "8cf618082cb737082c73737045"
5(str(intrebare1_3) .encode()).hexdigest() == „7dfebef1f84a7c27b5562b8e84f692b0” și
md5(str(întrebare1[3]).encode()).hexdigest() == „a6105c0a611b41b08f63”):509208f63)

q1 = q1 +20

cu exceptia:

q1 = 0

#Intrebarea 2

încerca:

q2 = 0

întrebare2 = get_file ("întrebare2.txt")

întrebare2_1 = ast.literal_eval(intrebare2[0])

întrebare2_1 =sortată(întrebare2_1.articole(), cheie=lambda x: x[0])

if(md5(str(intrebare2_1).encode()).hexdigest() == "69f10a3346bf0f8d8b902a06642ae4ca" și
md5(str(intrebare2[1]).encode()).hexdigest() == "a6105b4090509050505000000000 "):

q2 = q2 + 10

cu exceptia:

q2 = 0
#Întrebarea 3

încerca:

q3 = 0

întrebare3 = get_file ("întrebare3.txt")

întrebare3_1 = ast.literal_eval(întrebare3[0])

întrebare3_1 =sortată(întrebare3_1.articole(), cheie=lambda x: x[0])

întrebarea3_2 = ast.literal_eval(întrebarea3[1])

întrebare3_2 =sortată(întrebare3_2.articole(), cheie=lambda x: x[0])

if(md5(str(intrebare3_1).encode()).hexdigest() == "7759614969fe59a095a56b8eb2f6e812" și
md5(str(intrebare3_2).encode()).hexdigest() == "ba8c0fdd0804352fdd804352f6e812"

q3 = q3 + 20

cu exceptia:

q3 = 0

#Întrebarea4

încerca:

q4 = 0

întrebare4 = get_file ("întrebare4.txt")


if (md5 (str (întrebarea4 [0]). code ()). hexdigest () == "f19bb046ca4ba9a016360ca151cc8a0a" și
md5 (str (întrebarea4 [1]). code ()). 866 ") :

q4 = q4 +10

cu exceptia:

q4 = 0

#Întrebarea5

încerca:

q5 = 0

întrebare5 = get_file ("întrebare5.txt")

întrebare5_1 = ast.literal_eval(intrebare5[0])

întrebare5_1 =sortată(întrebare5_1.articole(), cheie=lambda x: x[0])

if(md5(json.dumps(question5_1, sort_keys=True).encode('utf-8')).hexdigest() ==
"25fa51b43ce1c5bbc55fa494ce634be1" și md5(str(question5[1]).encode()). () ==
„a6105c0a611b41b08f1209506350279e” și md5(str(intrebare5[2]).encode()).hexdigest() ==
„7fa3b767c460b54a2be4d49030b349c7”):

q5 = q5 +20

cu exceptia:

q5 = 0

#Întrebarea 6
încerca:

q6 =0

întrebare6 = get_file ("întrebare6.txt")

întrebare6_1 = ast.literal_eval(intrebare6[0])

întrebare6_1 =sortată(întrebare6_1.articole(), cheie=lambda x: x[0])

if(md5(str(question6_1).encode()).hexdigest() == "cf85a8394c75181155a2b67a581601b0" and


md5(str(question6[1]).encode()).hexdigest() == "7fa3b767c460b54a2be4d49030b349c7"):

q6 = q6 +20

cu exceptia:

q6 = 0

încerca:

scor = q1 + q2 + q3 + q4 + q5 + q6

print("FS_SCORE:{0}%".format(score))

cu exceptia:

print("FS_SCORE:0%")

S-ar putea să vă placă și