Sunteți pe pagina 1din 2

Exercitii

1. Setati-va directorul de lucru


2. Importati setul de date states.csv si creati dataframe-ul bd_states
3. Verificati tipul obiectului importat
4. Atasati setul de date tiparului de cautare in R
5. Obtineti lista variabilelor din acest dataframe
6. Creati setul de date states1 din bd_states, care sa contina doar variabilele stateid,
state si south, in aceasta ordine
7. Creati setul de date states2 din bd_state, eliminand variabilele state si attend
8. Din setul de date states1, redenumiti variabilele state in state_name, iar stateid in
abv
9. Verificati tipul variabilelor din bd_states
10. Schimbati clasa variabilei state in sir de caractere
11. Verificati daca s-a produs schimbarea
12. Pentru bd_states, calculati media coloanelor trnout00 si trnout04. Rezultatul sa
apara intr-o coloana noua, numita trnout_mean
13. Adaugati o noua observatie in setul states1. Inlaturati observatia adaugata.
Exportati setul de date states1 in fisierul states2.csv
14. In bd_states, creati variabila d1_urban folosind valorile variabilei urban, care sa
aiba 3 intervale de frecventa egala, cu categoriile urban1, urban2, urban3
15. Din bd_states, selectati doar statele din regiunile (region) Midwest si West.
Salvati rezultatul in setul de date WestRegion
16. Din bd_states selectati doar statele care nu sunt din regiunea (region) de sud.
Salvati setul de date rezultat cu denumirea non_south
17. Creati setul de date sel1 selectand din bd_states acele state care au un procent de
hispanici (hispanic) >5% si in care a castigat Obama in 2008 (obama_win08)
18. Ordonati setul bd_states alfabetic dupa numele statelor.
19. Creati variabila d_urban folosind valorile variabilei urban, cu categoriile: small
(<45%), average (45-60%), high (>60%)
20. Schimbati denumirile categoriilor variabilei d_urban in U1, U2 si U3
21. Pentru variabila abortion, inlocuiti toate valorile mai mari de 15 cu valoarea
mediei variabilei

S-ar putea să vă placă și