Documente Academic
Documente Profesional
Documente Cultură
INTREBAREA 5. Care sunt instrumentele tehnice pe care le-ați folosi în scopuri de analiză
și prezentare?
RASPUNS
În calitate de analist, trebuie să cunosc urmatoarele instrumentele:
1. MS SQL Server, MySQL
Pentru lucrul cu date stocate în baze de date relaționale
2. MS Excel, Tableau
Pentru crearea de rapoarte și tablouri de bord
3. Python, R, SPSS
Pentru analiza statistică, modelarea datelor și analiza exploratorie
4. MS PowerPoint
Pentru prezentare, afișarea rezultatelor finale și a concluziilor importante
INTREBAREA 6. Care sunt cele mai bune metode si pasi de curățare a datelor?
RASPUNS
1. Un plan de curățare a datelor înțelegând unde au loc erorile comune și mențineți toate comunicațiile
deschise.
2. Înainte de a lucra cu datele voi identifica și elimina duplicatele. Acest lucru va duce la un proces de analiză
a datelor ușor și eficient .
3. Voi verifica acuratețea datelor, setand validarea încrucișată, menține tipurile de valori ale datelor și furnizați
constrângeri obligatorii.
4. Voi normalizați datele la punctul de intrare, astfel încât să fie mai puțin haotic.
5. Ma voi asigura că toate informațiile sunt standardizate, ceea ce duce la mai puține erori la intrare.
Ștergere listwise.
În metoda de ștergere listwise, o înregistrare întreagă este exclusă din analiză dacă lipsește o singură valoare.
Imputarea mediei.
Se baga Valoarea medie a răspunsurilor celorlalți participanți și completați valoarea lipsă.
Substituirea regresiei.
Utilizam analize de regresie multiplă pentru a estima o valoare lipsă.
Imputații multiple.
Acesta creează valori plauzibile pe baza corelațiilor pentru datele lipsă și apoi voi face media seturi de date simulate
prin încorporarea erorilor aleatorii în predicțiile dvs.
INTREBAREA 15. Ce inseamna outlier? Aratati graphic cum intelegeti. Cum veti trata
aceste valori?
RASPUNS
Un outlier este un punct de date care este îndepărtat de alte puncte similare.
Acestea se pot datora variabilității măsurătorii sau pot indica erori experimentale.
Pentru a trata valorile aberante, putem folosi următoarele patru metode:
Eliminați înregistrările aberante
Limitați datele aberante
Atribuiți o nouă valoare
Încercați o nouă transformare
INTREBAREA 21. Care este funcția de a găsi ziua săptămânii pentru o anumită valoare a
datei? Care e sintaxa?
RASPUNS
Pentru a obține ziua săptămânii, voi folosi funcția WEEKDAY().
Aceasta va returna 6 ca rezultat, adică 17 decembrie este sâmbătă.
INTREBAREA 23. Cum subsetați sau filtrați datele în SQL? Scieti Sintaxa
RASPUNS
Pentru a subseta sau filtra datele în SQL, folosim WHERE și HAVING. De exemplu avem tabelul
Folosind acest tabel, să găsim înregistrările pentru filmele care au fost regizate de Brad Bird.
Mai jos de exemplu voi filtra tabelul pentru regizorii ale căror filme au o durată medie mai mare de 115
minute.
INTEBAREA 24. Care este diferența dintre clauza WHERE și clauza HAVING în SQL?
RASPUNS
WHERE HAVING
Clauza WHERE operează pe date de rând. Clauza HAVING operează pe date agregate.
În clauza WHERE, filtrul are loc înainte de a se HAVING este folosit pentru a filtra valorile dintr-un grup.
face orice grupări.
Funcțiile agregate nu pot fi utilizate. Pot fi utilizate funcții agregate.
INTREBAREA 25. Este corectă interogarea SQL de mai jos? Dacă nu, cum îl vei rectifica?
RASPUNS
Este incorect, deoarece nu putem folosi numele aliasului în timp ce filtram datele folosind clauza WHERE. Va
arunca o eroare.
INTREBAREA 29. Care sunt diferitele tipuri de unuiuni pe care le oferă Tableau?
RASPUNS
Unirile din Tableau funcționează în mod similar cu instrucțiunea SQL join. Tipurile de îmbinări acceptate de
Tableau:
Left Outer Join
Uniunea exterioară dreaptă
Unire exterioară completă
Inner Join
INTREBAREA 31. Care este sintaxa corectă pentru funcția reshape() în NumPy pentru
Python? Scrie sintaxa
RASPUNS
INTEBAREA 32. Care sunt metodele de creare a unei Data frame în Pandas?
RASPUNS
Există două moduri de a crea un Dataframe in Pandas.
Prin inițializarea unei Liste
INTREBAREA 33. Scrieți codul pentru Python pentru a crea Data Frame al unui angajat
din fișierul „emp.csv” și afișați Head and Summary
RASPUNS
Pentru a crea un DataFrame în Python , trebuie să importez biblioteca Pandas
Din ea voi utiliza funcția read_csv pentru a oi încărca fișierul .csv.
Tot aici voi arata locația unde numele fișierului și extensia acestuia urmează setul de date.
Deoarece valoarea 8 este prezentă în al doilea rând al primei coloane, folosim aceleași poziții de index și o
transmitem array .
INTREBAREA 40. Din DataFrame de mai jos, cum veți găsi valorile unice ale fiecărei
coloane și cum veți găsi datele pentru Age<35 și Height>6?
RASPUNS
Pentru a găsi valorile unice și numărul de elemente unice, voi folosi funcția unique() și nunique().
INTREBAREA 44. Dati definitii si explicate diferenta dintre date, informatii si cunostinte?
RASPUNS
Datele sunt o colecție de fapte și detalii brute, neorganizate, cum ar fi text, observații, cifre, simboluri și descrieri ale
lucrurilor etc.
Informațiile sunt datele prelucrate, organizate și structurate. Informatia oferă context pentru date și permite luarea
deciziilor.
Cunoștinte - este starea de a cunoaște ceva prin înțelegerea conceptelor, studiului și experientei. Cunoașterea conotă
înțelegerea încrezătoare teoretică sau practică a unei entități, împreună cu capacitatea de a o utiliza într-un scop
specific
De exemplu: Nota studentului la test – este Data. Nota medie a unei clase este informația derivată din datele.
Informațiile nu sunt suficiente pentru a face generalizări sau predicții despre cineva sau ceva. Cunoașterea are
capacitatea de a prezice sau de a face inferențe.
Fiecare informație nu este neapărat o cunoaștere, dar toată cunoașterea este o informație.
INTREBAREA 45. Cum intelegeti termenul Business Intelligence? Pentru ce este folosit?
RASPUNS
Business Intelligence (BI) este un proces bazat pe tehnologie pentru analiza datelor și furnizarea de informații
acționabile care îi ajută pe directori, manageri și lucrători să ia decizii informate de afaceri.
Capacitățile BI vă permit să:
Colectați date actualizate
Prezentați date ușor de înțeles
Furnizați date în timp util angajaților
INTREBAREA 45. Care minum de particularitati ar trebui de analizat intro solutie noua de
BI?
RASPUNS
- Să fie o singură platformă BI. Deoarece soluția care oferă o singură platformă integrată de aplicațiiare un
Ecosistem consacrat, oferind mai multe soluții pentru raportare, descoperire, analiză și alte funcții.
- Sa fie SaaS: BI ca serviciu (BIaaS) Soluiia BI trebuie să fie ușor de accesat indiferent dacă aceștia sunt la
birou sau la distanță sau în mișcare. O soluție cloud oferă cel mai mare potențial de accesibilitate și
disponibilitate. Poate fi accesată când și unde este necesar, pentru utilizare individuală sau pentru partajare
cu colegii.
- BI conectat. Conexiunile preconfigurate elimină timpul necesar pentru realizarea conexiunilor și reduc
complexitatea soluției, permițându-le angajaților din departamentul IT să se concentreze asupra altor sarcini.
- Posibilitate de a dace analizele augmentate. Utilizează conceptul de Machine Learning integrat. Acest tip de
soluție poate susține utilizatorii în colectarea, analiza, interpretarea și transmiterea informațiilor, pentru
simplificarea și automatizarea sarcinilor.
- Vizualizarea datelor. Cu ajutorul vizualizării datelor se obtin informații noi și unice prin crearea de aplicații
complexe de date de tip mashup. De asemenea, puteți crea narațiuni despre activitate., utilizând imagini cu
impact ridicat, care nu necesită instruire specializată pentru a fi interpretate.
- Business Intelligence cu autoservire Soluția BI trebuie să permită o navigare ușoară, având caracteristici de
tip punct-și-clic sau glisare și fixare. Trebuie să aibă un DashBoard cu acces intuitiv și interactiv la
informații și să ofere navigare ghidată, etapizată și funcții integrate, astfel încât să nu fie necesară
personalizarea. De asemenea, utilizatorii trebuie să aibă control deplin asupra încărcării datelor și a analizei
acestora din orice unghi, pentru a descoperi problemele existente și noi oportunități. Aceștia trebuie să poată
combina date interne și externe pentru a obține informații mai complexe. Când vine vorba de partajarea a
ceea ce au învățat, utilizatorii trebuie să își poată crea propriile rapoarte.
- Mobile Business Intelligence
INTREBAREA 46. Care sunt cele mai importante caracteristici și funcționalități pe care ar
trebui să le aibă un instrument eficient de business intelligence?
RASPUNS
- Dashboards
- Visualizations
- BI Reporting Tools
- Predictive Analytics
- Data Mining
- ETL – Extract Transfer Loads – instrumente care transferă date de la un depozit de date la altul
- OLAP – Online analytical processing
- Drill-Down
INTREBAREA 47. Business Intelligence vs. Business Analytics: Care este diferența?
RASPUNS
Business Analytics (BA) - un termen umbrelă pentru tehnicile de analiză a datelor . Analiza de afaceri (BA) ajută la
prezicerea a ceea ce se va întâmpla în viitor și prescrie ce ar trebui să faceți pentru a crea rezultate mai bune.
Business Intelligence este descriptivă și vă spune care este situația actuală și ce s-a întâmplat pentru a ne duce la acea
stare în trecut.