Sunteți pe pagina 1din 59

<7X

UNIVERSITATEA
DIN 49
GREENWICH
COMP1682: Proiectul din ultimul an

O investigație pentru a stabili dacă o companie care este mai activă pe Social Media
are mai mult "succes" decât una cu o prezență online mai
mică

Numele studentului

000111111

Supervizor: Numele supervizorului

Număr de cuvinte: 12,104

BSc Business Computing

O disertație prezentată în îndeplinirea parțială a Universității din Greenwich

Abstract

Proiectul își propune să descopere dacă companiile care utilizează rețelele sociale ca instrument de marketing
pentru conectarea cu clienții au o reputație mai bună și / sau sunt mai profitabile decât o companie fără o
prezență online sau cu o prezență online foarte mică.

1
Raportul se va concentra pe cercetarea dezvoltării marketingului relațiilor cu clienții în ultimii patruzeci de ani,
ceea ce a dus la analiza sentimentelor prin răzuirea datelor și extragerea textului și recunoaște diferitele
programe pe care un dezvoltator le-ar putea folosi pentru a vizualiza datele colectate prin aceste metode în
secolul 21. În plus, raportul va examina metodologiile utilizate în etapele de planificare și dezvoltare ale
ciclului de viață al produsului.

Mulţumirilor
Proiectul creat nu ar fi fost posibil fără mulți oameni minunați care m-au încurajat în ultimii patru ani,
mulțumesc.

Mulțumiri speciale supervizorilor mei pentru că m-au încurajat și m-au ajutat pe tot parcursul dezvoltării
acestui proiect, amândouă sunteți modele feminine foarte puternice și sunt recunoscătoare că am fost în clasa
voastră anul trecut.

De asemenea, un imens mulțumesc familiei mele pentru că a fost alături de mine ca prima persoană care a
mers la universitate: mamei mele pentru că s-a asigurat întotdeauna că sunt bine și mi-a oferit gustări acolo
unde este necesar, tatălui meu pentru că a crezut întotdeauna în mine din momentul în care i-am spus că vreau
să intru la informatică, spunându-mi că pot face orice din momentul în care am început școala.

Surorile mele necesită, de asemenea, recunoaștere suplimentară pentru că oferă excursii la Byron Burger și
McDonalds și verificări gramaticale / ortografice ori de câte ori am nevoie de ele.

2
Cuprins
<7X UNIVERSITATEA DIN 49 GREENWICH.................................................................................1
Cuprins.......................................................................................................................................3
1 Secțiunea 1: Introducere.....................................................................................................5
2 Secțiunea 2: Analiza literaturii de specialitate....................................................................6
Cât de bun este "bun"? Acum cu și mai multe cuvinte!...............................................12
YouGov................................................................................................................................13
3 Secțiunea 3: Cercetare de produs......................................................................................15
3.4 Model de notare ponderat..........................................................................................18
4 Secțiunea 4: Aspecte și considerații juridice, sociale, etice și profesionale.....................19
5 Secțiunea 5: Cerințe și metodologie.................................................................................20
5.5 Metodologie...............................................................................................................21
5.6 Justificarea caracterului adecvat al unei metodologii sau al unui cadru urmat.........23
6 Design...................................................................................................................................23
6.1 Diagrama cazului de utilizare UML..........................................................................23
7 Procesul de dezvoltare..........................................................................................................25
7.1 Etapa 1: Preluarea inițială a codului Python..............................................................25
7.2 Etapa 2: Implementarea analizei semantice..............................................................29
7.2.1 Iterația 1...............................................................................................................29
7.2.2 Iterația 2...............................................................................................................29
7.2.3 Iterația 3...............................................................................................................29
7.3 Etapa 3: Colaționarea datelor în Excel......................................................................30
7.4 Etapa 4: Crearea vizualizărilor de date...........................................................................31
7.5 Cutie de timp.............................................................................................................34
7.6 Posibile abordări alternative......................................................................................34
8 Testare...............................................................................................................................35
9 Evaluare............................................................................................................................36
9.1 Evaluarea produsului.................................................................................................36
9.2 Autoevaluare..............................................................................................................37
10 concluzie.............................................................................................................................39
10.1 Constatări privind reputația.......................................................................................39
10.2 Constatări privind rentabilitatea...................................................................................42
11 Bibliografie.........................................................................................................................43
12 Apendice.............................................................................................................................45
12.1 Apendicele A: Cifre......................................................................................................45
12.2 Anexa B: Raport contextual.........................................................................................46
12.3 Anexa C: Codul notebook-ului Python Jupyter............................................................47
12.4 Anexa D: Codul analizei semantice.............................................................................48

3
12.5 Anexa E: Formule de calcul tabelar Excel................................................................51
12.6 Apendicele F: Vizualizări de date Tableau...............................................................53
:o......................................................................................................................................................54
12.7 Apendicele G: Încercări.............................................................................................57
1.1

Tablou public de tablouri de bord:


https://public.tableau.com/profile/georgia6424#!/vizhome/DataVisualisations/GatheringStats

4
1 Secțiunea 1: Introducere
1.1 Fond

A fost întotdeauna important ca întreprinderile să își comercializeze produsele, iar în ultimul deceniu publicul
a început să realizeze modul în care social media a devenit din ce în ce mai importantă în publicitatea
întreprinderilor. Oamenii folosesc Social Media pentru a-și exprima orice opinie, emoție, îngrijorare sau
plângere pe care o au cu privire la produsele și serviciile pe care le folosesc. De cele mai multe ori,
consumatorii le postează pentru că doresc un răspuns de un fel de la publicul larg sau de la compania însăși.

Acest proiect va încerca să identifice dacă există o legătură între o afacere cu o strategie online bună și dacă
acest lucru are un efect asupra reputației lor generale – și asupra valorii profiturilor realizate – în comparație
cu profiturile întreprinderilor care utilizează social media mai rar sau poate deloc.

În era digitală modernă, cu mulți cumpărători online aparținând generațiilor Millennial sau Gen-Z, companiile
încearcă să-și mărească poziția în Social Media, deoarece cred că o bună prezență în social media duce la o
creștere a raportului, a reputației și, prin urmare, la o creștere a profiturilor. Proiectul va crea un set de date
din postările de pe social media, va analiza pozitivitatea sau negativitatea propoziției și va transforma aceste
date în vizualizări pentru a afișa emoțiile publicului diferitelor companii.

1.2 Informații despre client

Clientul pentru acest proiect și raport este un comerciant cu amănuntul de îmbrăcăminte din stradă. Ei decid
dacă să investească într-o prezență online în încercarea de a-și crește profitabilitatea, deoarece acest lucru ar
implica angajarea de personal de servicii pentru clienți pentru a monitoriza rețelele sociale, fotografi pentru a
încărca postări de înaltă calitate, ceea ce ar necesita, prin urmare, mult timp și bani.

1.3 Apropia

Prezentul raport începe prin discutarea unei analize a literaturii de specialitate din secțiunea 2 și continuă prin
investigarea produselor similare care există pe piață în secțiunea 3. Aceasta este urmată de posibilele
considerente juridice, sociale, etice și politice din secțiunea 4 și o discuție a cerințelor și a metodologiei
utilizate pentru dezvoltare în secțiunea 5. Secțiunea 6 se concentrează pe planurile de proiectare pentru
proiect, secțiunea 7 va demonstra pașii făcuți în fiecare etapă a procesului de dezvoltare. Secțiunea 8
revizuiește testarea și verificarea capacităților proiectului, secțiunea 9 este centrată în jurul evaluării
proiectului, precum și a dezvoltatorului. Secțiunea 10 se încheie apoi cu constatările proiectului general.

5
2 Secțiunea 2: Analiza literaturii de specialitate
2.1 Abordarea căutării literaturii

Cercetarea întreprinsă pentru proiect a fost o combinație de diverse surse online și fizice, pentru a identifica
orice tendințe în Social Media Marketing / Social Customer Relationship Management sau ipoteze care există
deja în sectorul pieței. Deoarece domeniul marketingului social media este un subiect relativ nou în cadrul
tehnologiei, nu există o abundență de texte fizice largi care să susțină sau să nege orice argument în acest
sens. De fapt, multe cărți / texte fizice referitoare la acest subiect se concentrează pe formulele utilizate pentru
a analiza datele găsite, spre deosebire de a avea o opinie pentru sau împotriva utilizării acestora. Sursele
online, cum ar fi revistele, articolele și alte site-uri web permit obținerea unor materiale mult mai moderne, cu
privire la o varietate mai largă de opinii și studii din ultimii ani; Prin urmare, majoritatea surselor și
materialelor din întreaga analiză a literaturii de specialitate sunt online.

2.2 Identificarea problemei

În societatea modernă, a devenit un calvar lunar să vezi cum un brand face un faux pas de afaceri. După
aceasta:
1) Majoritatea canalelor de știri ar discuta în detaliu.
2) Publicul, clienți sau nu, își împărtășesc apoi opiniile și indignarea pe rețelele sociale personale sau pe
rețelele sociale ale companiei.
3) Compania ar emite cel mai probabil scuze și ar șterge toate dovezile acestor falsuri.
4) Lumea ar merge mai departe.

Numai în 2018, Snap Chat a pierdut aproape 2 miliarde de dolari de la celebrități care și-au împărtășit noua
reținere față de companie cu privire la unele modificări ale interfeței de utilizare, precum și la aprobarea unor
reclame neetice (Bullock, 2018). IHOP din SUA a pierdut milioane de dolari schimbându-și brandingul înapoi
de la IHOB la IHOP după ce noua schimbare a numelui în "International House of Burgers" a fost primită
oribil în întreaga lume, rezultând în clienți și numeroase companii batjocorindu-i pentru încercarea schimbării
(Tobin, 2018) (Roberts, 2018). A existat indignare în ianuarie față de alegerile modelului H&M în ceea ce
privește hanoracele cu tematică animală din colecția lor pentru copii, ceea ce a dus la o pierdere a profitului și
la proteste / revolte în unele dintre magazinele lor din Africa de Sud (Fortin, 2018).

De la dezvoltarea rapidă a tehnologiei, informațiile sunt semnificativ mai ușor de descoperit în zilele noastre
decât au fost cu doar un deceniu în urmă, ceea ce a permis răspândirea fenomenului global al mentalității
mulțimii. Acest lucru a însemnat că o greșeală de marketing, care ar fi putut fi trecută cu vederea în trecut,
este plasată sub microscop și analizată în prezent. Această mentalitate sau indignare a mulțimii tinde să aibă
un efect continuu asupra reputației unei afaceri și, prin urmare, toate întreprinderile trebuie să fie deosebit de
precaute cu marketingul și social media.

Rangul GenZ H (%) Milenara


Marcă Marcă
Gen Z Rang (%)

1 Oreo 75.0 1 Nike 65.2


2 Nike 69.3 2 Hershey's 63.5
3 Hershey's 67.1 3 Amazon 62.6
4 Kraft Mac &; Brânză 63.8 4 Oreo 60.3

5 Micuța Debbie 62.5 S Scop 60.0


6 M&M 61.3 6 M&M 59.1

6
7 Amazon 59.3 7 Anonim 56.3

8 Sub armură 57.0 8 Heinz Ketchup 56.2


9 Levi's 56.0 9T PayPal 55.6

10 Măr 55.2 9T Fața nordică 55.6

Figura 1. (YPulse, 2018)

În mod evident, potrivit unui sondaj privind încrederea mărcii realizat de YPulse, mărcile care au cele mai
mari ratinguri de loialitate în rândul milenialilor / Gen-Z sunt cele care tind să facă publicitate pe social media
și au o prezență online mare, cum ar fi Nike (Joseph, 2017), Oreo (O'flynn, 2017) și M&M (Marketing Week,
2018), precum și mărcile tipice de uz casnic, cum ar fi Amazon și Apple.

2.3 Discuție inițială

Potrivit (Edosomwan, Kalangot Prakasan, Kouame, Watson și Seymour, 2011), "social media poate fi numită
o strategie și o priză pentru difuzare, în timp ce rețelele sociale sunt un instrument și un utilitar pentru
conectarea cu ceilalți" și se aliniază cu viziunea comună de afaceri că "Dacă scopul unei afaceri este de a
ajunge la clienți acolo unde se află, O prezență în social media pare necesară." (Adams-Mott, 2018).

Acest consens general este ceea ce a determinat companiile să-și vizeze clienții online, folosind aplicații de
social media, mai degrabă decât metode tradiționale de publicitate, cum ar fi într-un ziar, la radio sau la
televiziune. De exemplu, cercetările au arătat că tinerii cu vârste cuprinse între 17 și 35 de ani își ridică
telefoanele de 50-75 de ori pe zi (Eadicicco, 2015), în timp ce într-un studiu publicat de Music Business
Association, doar 12% dintre tineriimileniali ascultau radioul, iar 51% ascultau servicii de streaming precum
Spotify sau Apple Music (McIntyre, 2016).

În plus, 67% dintre mileniali plătesc pentru 1-3 servicii de streaming ca alternativă la plata pentru televiziunea
prin cablu sau vizionarea canalelor TV care necesită o licență TV, datorită libertății pe care o au asupra a ceea
ce doresc să vizioneze, lipsa reclamei se întrerupe pe tot parcursul, totul la un preț mult mai mic decât ar plăti
gospodăria tipică pentru televiziunea prin cablu (Arnold, 2017).

2.4 Managementul relațiilor cu clienții

Managementul relațiilor cu clienții (CRM) a existat ca o abordare a gestionării schimburilor unei companii cu
clienții actuali – precum și potențiali – folosind analiza datelor. Deși ideea sistemelor de marketing bazate pe
clienția fost discutată de-a lungul anilor 1980, adusă în mare măsură de sistemul de marketing al bazelor de
date al lui Robert și Kate Kestnbaum (CRM Switch, 2013), primul sistem creat cu un accent specializat CRM
nu a fost până la Siebel Systems în 1993.

Acest nou sistem și idealurile sale au fost bine primite de revoluționari, așa cum (Gates, 1999) a spus odată că
"modul în care colectezi, gestionezi și folosești informațiile va determina dacă câștigi sau pierzi". Această
idee de colectare și analiză a informațiilor, cum ar fi tendințele bazate pe clienți, a deschis calea pentru
managementul relațiilor cu clienții pe care îl vedem astăzi, adică "Clienții care se angajează într-o conversație
pe pagina de marcă social media a unei întreprinderi așteaptă atenție și rezolvare a preocupărilor lor de la
întreprindere la fel cum ar face pe un canal CRM tradițional, cum ar fi telefonul sau e-mailul". (Ajmera, Ahn,
Nagarajan, Verma și contractor, 2013). Datorită acestui fapt, s-ar putea argumenta că interacțiunile social
media pe care le vedeți clienții având în fiecare zi cu afaceri online este una dintre cele mai eficiente utilizări
ale CRM în zilele noastre.

7
2.4.1 Beneficiile CRM cu Social Media Marketing

Există mai multe aspecte benefice ale managementului relațiilor cu clienții:


1) Permite companiilor să trateze fiecare client individual, spre deosebire de un grup, datorită colectării
de date personale unice pentru fiecare persoană.
2) Ajută la gestionarea și centralizarea datelor clienților într-un singur loc.
3) Ajută la determinarea aspectelor afacerii care funcționează bine și a aspectelor care pot fi
îmbunătățite.
4) Crește productivitatea angajaților, deoarece sistemul colectează informațiile despre clienți și, prin
urmare, tot ce trebuie să facă angajatul este să utilizeze aceste informații în timpul interacțiunii.

2.5 Social CRM

Social Customer Relationship Management implică utilizarea serviciilor și tehnologiei social media pentru a
permite companiilor să comunice mai bine cu baza lor de clienți, cum ar fi descoperirea volumului de trafic
web, a numărului de "urmăritori" pe anumite rețele sociale, precum și a numărului de mențiuni pe care o
companie le poate primi pe aceste site-uri (Castronovo &; Huang, 2012). În timp ce CRM tradițional a fost
dezvoltat în anii '80, Social CRM a început să devină un subiect de conversație abia în ultimul deceniu
datorită creșterii numărului de utilizatori pe social media în această perioadă de timp.

Este important să rețineți, totuși, că, în timp ce CRM tradițional se bazează pe "colectarea și gestionarea
datelor actuale ale clienților", Social CRM este "mai mult o strategie pentru implicarea clienților", deoarece
permite companiilor să urmărească comunicările de vânzări, precum și interacțiunile pe social media. Social
CRM a ajutat la crearea unei căi către potențialii clienți, vorbind cu ei pe propria platformă de socializare
preferată și îi ajută să-și împărtășească propriile experiențe cu mii de alții online (Rouse, 2017).

8
Dobânda ore © suplimentare •<>«

1 ianuarie 2004 Iun 1,2012

Figura 2. Google Trends

2.6 Lideri actuali în Social Media Marketing

Începând cu octombrie 2018, mărcile "High Street" care au fost clasificate drept "cele mai de succes pe
rețelele sociale din Marea Britanie", potrivit Red Hot Penny, sunt comercianți cu amănuntul mai scumpi, cum
ar fi Nike, Adidas, Tommy Hilfiger, Doc Martens și Marks & Spencer. Aceste branduri "demonstrează că își
cunosc publicul pe toate canalele și îi pot implica activ într-un mod natural". (Red Hot Penny, 2018). Acest
lucru poate rezulta, totuși, din "efectul bandwagon" (Coleman, 2003), deoarece mărcile sunt toate nume de uz
casnic pe termen lung, prin urmare poate exista o ușoară părtinire. Acest lucru lasă un gol pe piață, și anume
pentru alternative mai ieftine, cu care întreprinderile digitale se pot angaja.

Dacă ar fi să investigați aceste cinci companii și să le excludeți pe cele două cu cele mai mari etichete de preț
(Tommy Hilfiger și Doc Martens), mărcile au fiecare peste 30,000 de tweet-uri pe Twitter-urile companiei
respective. Nike (@nike), de exemplu, are peste 35.500 de tweet-uri, în ciuda ultimelor patru tweet-uri postate
(începând cu 2019) fiind cu două luni mai devreme, noiembrie 2018. Acest lucru se datorează faptului că
contul lor Twitter petrece ore întregi răspunzând la tweet-urile clienților, negative sau pozitive, pentru a arăta
bazei lor de clienți că îi caută ca o modalitate de a construi loialitate.

La o scară mult mai mare, Marks &; Spencer (@marksandspencer), au peste 416.000 de tweet-uri și, pe
parcursul zilei lor de lucru (8am până la 10pm), răspund la sute de clienți, direcționând reclamațiile către
căsuța de e-mail directă sau adresele de e-mail, astfel încât preocupările clienților să nu treacă neobservate,
răspunzând la comentariile de laudă și informând clienții cu privire la întrebările generale, cum ar fi orele de
deschidere a magazinelor și când este probabil ca produsele să revină în stoc.

9
Aceste interacțiuni sunt ceea ce a permis un nivel bun de încredere într-o companie pentru clienții săi și sunt
ceea ce îi inspiră să includă rețelele sociale ale afacerii în viața lor de zi cu zi, în ciuda faptului că nu au
întâlnit niciodată persoana de cealaltă parte a ecranului, pur și simplu de Economic Times, "publicului tău îi
pasă de tine dacă îi ești de ajutor" (Thiagarajan, 2018).

4 )N ISIP @SANDYJM12-47M V Philly @philippadixon -1h


11 6 ©MARKSANDSPENCER OMG! CHLOE MI-A TRIMIS STILURI DE LA TRY IT TUESDAY ȘI I N% HEART ©marksandspencer vă mulțumesc că ați făcut toate dulciurile cu jeleu (Percy și Colin)
THEM! EXCELENTĂ TREABĂ! legume acum tocmai am intrat în căutarea celor vegetale și Io și iată că toți sunt
APRECIEZ ATÂT DE MULT XXX
Q1TOS
MARCAJE M&SQ ©ȘI SPENCER -45M V
M&S ÎNCÂNTAT SĂ AUD CĂ ACESTEA AU FOST UN HIT SANDY! :D CU STIMĂ, JAKE
M&S Q ©marksandspencer -1h
EU Q 1 T O 1 0 M&S Sunteți atât de bineveniți! :D Sper că vă puteți bucura în continuare de aceste Philly!
Care sunt mofturile tale? - Jake
G), NISIP @SANDYJM12 37M V

* ' 6J CUMPARAT ROCHIE SAFARI 9


EU Q I T O 0 Philly @philippadixon -1h
Va trebui să le încerc pe toate pentru a afla W W W 55
PC MSS» /. N
M&S
©MARKSANDSPENCER
( URMĂREȘTE )
X______________-
V Îi

Răspunsul la @sandyjm12 M&S •


M&S ©Marksandspencer
Yay! Mă bucur că ai găsit ceva care îți place
:D Vă mulțumim pentru tweet! :) - Jake Răspunsul la @philippadixon

16:02-9 ianuarie 2019


Nu le mâncați pe toate dintr-o dată, vă veți
1 Îmi place ( îmbolnăvi ;) Să aveți o săptămână minunată :) - Jake
15:16-9 ianuarie 2019

Figurile 3 și 4. M&S Twitter

2.7 Rețele sociale

Cea mai imperativă parte a Social CRM este asigurarea faptului că afacerea utilizează social media corectă
pentru a ajunge la publicul țintă, "Cu câțiva ani în urmă, ideea de marketing social media era în mare parte
limitată la Facebook și Twitter. În ultimii ani, acest tip de marketing s-a extins pentru a include site-uri
populare precum Pinterest, Instagram, Snapchat, YouTube și Tumblr. (Adams-Mott, 2018)

În scopul acestui proiect, au fost analizate trei rețele sociale pentru potențialul lor: Instagram, Facebook și
Twitter. Instagram tinde să fie comentarii scurte, uneori chiar emoji - ceea ce este încurajat în secțiunea lor de
comentarii (Fingas, 2018) și, prin urmare, nu oferă suficiente date pentru a privi analiza sentimentelor.
Facebook conține funcții pentru dezvoltatori care permit înregistrarea datelor prin API-ul lor Graph, cu toate
acestea, de la indignarea Cambridge Analytica / Facebook din 2018, Facebook a revocat accesul la toate
instrumentele utilizate pentru răzuirea datelor din grupuri și pagini (Y, 2019), acest lucru a făcut incredibil de
dificil accesul la acesta, deoarece trebuie să furnizați un prototip funcțional al programului dvs. înainte ca
Facebook să acorde acces. Din acest motiv, Facebook nu va fi folosit pentru analiză.

Twitter a fost întotdeauna folosit de companii pentru analizele sale, atât de mult încât Twitter și-a dezvoltat
propriul site web "Analytics" în 2014 (Edwards, 2014), este, de asemenea, cel mai simplu de răzuit date,
deoarece permit aplicații bazate pe dezvoltatori web, precum și cel mai ușor de vizualizat opiniile
utilizatorilor prin interfața de utilizare a site-ului în sine. Cu creșterea sa recentă la 280 de caractere, Twitter
este platforma perfectă pentru a analiza opiniile consumatorilor și, prin urmare, va fi singura platformă Social
Media pentru acest proiect.

10
2.8 Cele mai bune perioade potențiale ale anului pentru a investiga

Există mai multe momente într-un an când clienții sunt mai predispuși să cumpere și, prin urmare,
întreprinderile sunt mai active pe social media și pun strategii de marketing în încercarea de a atrage afaceri.
S-ar putea spune că cel mai bun moment al anului pentru a investiga sentimentele clienților față de o afacere
este perioada festivă, deoarece este una dintre perioadele cheie ale anului în care întreprinderile concurează în
ceea ce privește cumpărăturile consumatorilor britanici, cheltuielile medii de Crăciun crescând de la an la an
în Marea Britanie, iar cheltuielile anuale ale țării ajungând cu mult peste media europeană (Clarke, 2017).

În perioada festivă, social media este folosită pentru a distribui campania sau reclama de Crăciun a unei
companii și poate deveni un eveniment anual pentru o afacere, de exemplu reclama anuală de Crăciun a lui
John Lewis, care începe să câștige impuls în fiecare an cu cel puțin o lună înainte de lansarea anunțului
(Google Trends, 2008). Alte perioade ale anului în care angajamentul este crescut sunt evenimente precum
vânzările de sfârșit de sezon, Black Friday, Ziua Îndrăgostiților, weekendul de Paște și sărbătorile de vară.

Companiile trebuie să ia în considerare impactul acestor evenimente pentru a obține o acoperire optimă a
rețelelor sociale în sectorul lor de piață. De fapt, analistul social media James Lovejoy a declarat: "fiind tăcute
sau neacordând atenție la ceea ce se întâmplă pe social, multe mărci devin oarbe la modul în care sunt
discutate online și la modul în care social le afectează". (Iliashov, 2015).

2.9 Extragerea textului și analiza sentimentelor

Proiectul va folosi extragerea textului pentru a extrage informații de pe Twitter pentru analiză. Deoarece
există un timp limitat pentru crearea proiectului, învățarea automată nu poate fi utilizată, deoarece acest lucru
necesită mai multe date, precum și date de instruire, prin urmare regulile lingvistice sunt alegerea mai
sensibilă. Există multe beneficii pentru regulile lingvistice, cum ar fi analiza rapidă, datele neregulate ușor de
identificat și analiza granulară pentru a împărți datele în secțiuni mai mici, cum ar fi fraze sau cuvinte / emoji
utilizate, toate acestea fiind benefice pentru un proiect de această scară (Huddy, 2017).

După extragerea datelor, analiza sentimentelor va fi utilizată pentru a determina dacă sentimentul general al
mesajului este pozitiv, neutru sau negativ, folosind Python. Acest lucru ar permite apoi o concluzie cu privire
la opinia generală a unei companii de către consumatorii săi, ceea ce, la rândul său, ar putea duce la strategii
de afaceri / decizii de marketing; Pak și Paroubek au explicat bine acest lucru, afirmând: "Pe măsură ce tot
mai mulți utilizatori postează despre produsele și serviciile pe care le folosesc sau își exprimă opiniile politice
și religioase, site-urile de microblogging devin surse valoroase de opinii și sentimente ale oamenilor. Astfel de
date pot fi utilizate eficient pentru studii de marketing sau sociale. (Pak și Paroubek, 2010).

11
Cât de bun este "bun"? Acum cu și mai multe cuvinte!
Pe o scară de la o la 10, unde o este "foarte negativ" și 10 este foarte pozitiv, în general, cât de pozitiv sau
negativ ar fi următorul cuvânt / frază pentru cineva atunci când l-ați folosit pentru a descrie ceva?

Abisal, îngrozitor, îngrozitor, îngrozitor, teribil


Foarte rău Gunoi foarte rău
Nesatisfăcător Rău Sărac
Destul de rău
Destul de rău Oarecum rău Sub medie Mediocră Medie Nu e rău
Târg
Bine, OK
Amendă satisfăcătoare
Oarecum bun Destul de bun Decent Peste medie Destul de bun Bun Mare
Foarte bun Foarte bun Minunat Fantastic Superb Briliant Incredibil Excelent
Remarcabil
Perfect

12
YouGov
Figura 5. YouGov "Cât de bun este bine?"
2.10 Concluzie

După revizuirea
scrierii diferitelor Scor
surse prin mediu
intermediul site- 121
urilor web, 134
revistelor etc., o 144
172
majoritate
175
covârșitoare a 176
materialului găsit 1.85
demonstrează 2.17

credibilitatea 2.48
2.60
dezvoltării
271
proiectului, care
2.80
va fi dus mai 2.85
departe în etapele 3-16
sale de dezvoltare. 3.38
De-a lungul 4.29
cercetării au fost 509
513
descoperite
543
informații care 548
înconjoară 551
perspectiva CRM 5-70
și, în plus, 580
versiunea 582

modernă, Social 6.48


CRM, precum și 6.56
6.62
beneficiile 6.76
acestora. 6.92
Companiile cu 776
cele mai bune 7.78
strategii de 7.90
marketing online 8.44
8.74
din ultimii ani și 8.77
avantajele 8.77
utilizării 8.81

diferitelor Social 8.95


Media pentru 9.11
9.16
marketing pe baza
0123456789 10
bazei lor de clienți Foarte negativ Foarte pozitiv

au fost, de
asemenea,
analizate.

13
Cercetarea a confirmat că media socială ideală pentru analiză este Twitter, deoarece oferă cea mai largă
acoperire a consumatorilor, precum și confirmarea utilizării regulilor lingvistice pentru a analiza sentimentul
datelor colectate. Cercetările au confirmat, de asemenea, cele mai bune perioade ale anului pentru a finaliza
setul de date pentru acest proiect, cu toate acestea, este posibil să nu fie posibilă colectarea datelor în aceste
momente, deoarece programul proiectului este ianuarie-aprilie, iar dacă proiectul ar fi creat folosind date din
perioada festivă 2018, aceste informații ar putea fi depășite până la termenul limită al proiectului. Prin urmare,
datele vor fi colectate atunci când proiectul ajunge în acel punct special în dezvoltare, estimat a fi în jurul lunii
martie sau aprilie.

14
3 Secțiunea 3: Cercetare de produs

Deoarece marketingul social media este încă o piață emergentă, există diverse alte produse care permit unei
companii să-și revizuiască acoperirea social media, inclusiv câți oameni se uită, se angajează și vorbesc
despre postările lor.

Criteriile de utilizare pentru proiect precizează:


1) Utilizatorul trebuie să poată accesa postările de pe Twitter.
2) Utilizatorul trebuie să poată vedea analiza sentimentului cu privire la aceste postări.
3) Utilizatorul trebuie să poată vizualiza vizualizările de date ale acestor constatări.

3.1 Twitter

Un exemplu în acest sens este propria "Twitter Analytics" a Twitter, la care toată lumea are acces în cadrul
site-ului Twitter. Acest lucru permite utilizatorilor să investigheze "numărul de afișări", "numărul de
interacțiuni" și "rata de implicare (afișări împărțite la angajamente)" per Tweet trimis, precum și câte persoane
au făcut clic pe Tweet-ul în sine, au făcut clic pe profil după ce au văzut Tweet-ul și "Retweeted", au răspuns
și l-au "apreciat".

<7X UNIVERSITATEA DIN 49 GREENWICH 1


Cuprins 3
1 Secțiunea 1: Introducere 5
2 Secțiunea 2: Analiza literaturii de specialitate 6
Cât de bun este "bun"? Acum cu și mai multe cuvinte! 12
YouGov 13
3 Secțiunea 3: Cercetare de produs 15
3.4 Model de notare ponderat 18
4 Secțiunea 4: Aspecte și considerații juridice, sociale, etice și profesionale 19
5 Secțiunea 5: Cerințe și metodologie 20
5.5 Metodologie 21
5.6 Justificarea caracterului adecvat al unei metodologii sau al unui cadru urmat 23
6 Design 23
6.1 Diagrama cazului de utilizare UML 23
7 Procesul de dezvoltare 25
7.1 Etapa 1: Preluarea inițială a codului Python 25
7.2 Etapa 2: Implementarea analizei semantice 29
7.2.1 Iterația 1 29
7.2.2 Iterația 2 29
7.2.3 Iterația 3 29
7.3 Etapa 3: Colaționarea datelor în Excel 30
7.4 Etapa 4: Crearea vizualizărilor de date 31
7.5 Cutie de timp 34

15
7.6 Posibile abordări alternative 34
8 Testare 35
9 Evaluare 36
9.1 Evaluarea produsului 36
9.2 Autoevaluare 37
10 concluzie 39
10.1 Constatări privind reputația 39
10.2 Constatări privind rentabilitatea 42
11 Bibliografie 43
12 Apendice 45
12.1 Apendicele A: Cifre 45
12.2 Anexa B: Raport contextual 46
12.3 Anexa C: Codul notebook-ului Python Jupyter 47
12.4 Anexa D: Codul analizei semantice 48
12.5 Anexa E: Formule de calcul tabelar Excel 51
12.6 Apendicele F: Vizualizări de date Tableau 53
:o 54
12.7 Apendicele G: Încercări 57

Figura 6. Analize Twitter

În timp ce acest lucru oferă o analiză detaliată a tweet-urilor individuale - și dacă utilizatorul are un cont de
afaceri activat, îi permite să vadă angajamentul pentru toate tweet-urile lor combinate - Twitter Analytics nu
permite nicio formă de analiză a sentimentelor, deoarece se limitează la valori cantitative, spre deosebire de
cele calitative.

Deși este posibil să folosiți "căutarea avansată" Twitter în acest caz pentru a căuta cuvinte cheie pentru analiza
sentimentelor, acest lucru este greoi și obositor, deoarece dezvoltatorul ar trebui să pieptene fiecare cuvânt
posibil pe care ar dori să-l caute și să formeze manual rezultatul general din diferitele rezultate.

3.2 Informații Hootsuite

Un alt produs care ar putea fi perceput ca fiind similar cu Project este Hootsuite Insights, o funcție
suplimentară a instrumentului de analiză Hootsuite. Acest instrument de analiză oferă o defalcare a diferitelor
măsuri, cum ar fi numărul de mențiuni pe site-ul de socializare, geo-distribuția, limba, sexul și sentimentul
mediu al mesajelor față de companie.

Hootsuite permite, de asemenea, companiei să-și conecteze conturile pentru peste 35 de rețele sociale, cum ar
fi Facebook, Twitter, YouTube, Google+, LinkedIn, Instagram și Pinterest; nu există nicio îndoială că
Hootsuite sunt lideri de piață în Social Networking Analytics.

În ciuda acestui fapt, există trei dezavantaje imaginabile ale produsului Hootsuite care nu se potrivesc
cerințelor de utilizare pentru Proiectul în dezvoltare, primul fiind că nu permit vizualizarea statisticilor altor
companii; majoritatea cifrelor pe care le oferă Utilizatorului, trebuie să fie conectate pentru a le vizualiza. În

16
plus, al doilea fiind costul sistemului de comercializare; capacitatea de a privi "Analiza personalizată", adică
analiza sentimentelor, determină creșterea abruptă a costului pe lună pentru serviciile lor de la 25 GBP pe lună
la 99 GBP, ceea ce, în funcție de lichiditatea afacerii și de cheltuielile acestora, poate fi exclus. În cele din
urmă, al treilea dezavantaj este similar cu cel al căutării avansate Twitter, astfel încât, dacă afacerea dorește să
investigheze analiza sentimentelor, trebuie să introducă cuvintele, frazele și emoji-urile pe care doresc să le
caute singuri, spre deosebire de produsul care are o bancă de cuvinte pozitive, neutre și negative din care
sistemul ar putea prelua imediat.

Figura 7. Informații Hootsuite

3.3 Semantria for Excel dezvoltat de Lexalytics

Semantria a fost fondată în 2011 într-un efort de a face analiza sentimentelor disponibilă pentru un public mai
larg. Ideea afacerii este de a analiza polaritatea postărilor de pe rețelele sociale față de companie folosind
extragerea și clasificarea entităților, ceea ce înseamnă că compania poate obține o afișare aprofundată a
emoțiilor clienților față de aceștia.

17
Numărul de categorii de utilizatori PolaritateaI
Categorie utilizator Negativ neutru Total general pozitiv
Hoteluri 1 49 37 87
Hrană 2 35 30 67
Serviciu clienți 2 34 26 62
Imobiliare 20 16 36
Călătorie 1 17 17 35
Tehnologie 4 18 11 33
Software și Internet 2 21 6 29
Artă 1 10 3 14
Jocuri video 8 5 13
Guvern 10 2 12
Căsătorie 1 8 2 11
Băuturi 1 6 3 10
Sănătate 6 4 10
Toaletă 1 4 4 9
Site-ul 7 1 8
Spațiu 1 5 1 7
Lege 2 3 5

Figura 8. lexalitice

Beneficiile utilizării Semantria, spre deosebire de Hootsuite sau Twitter Analytics, sunt că se spune că
Semantria analizează nu numai cuvintele individuale dintr-o propoziție, ci și esența propoziției în ansamblu
pentru a permite o analiză mai profundă. Acest lucru este util cu analiza sentimentelor, deoarece surprinde
momentele în care postările de pe social media ar fi putut fi scrise într-un mod sarcastic, ceea ce este tipic în
zilele și epoca modernă.

În timp ce Semantria are multe calități benefice ca produs Social Media Analytics, aspectul instrumentului
este deosebit de simplu, oferind doar nume de categorii și numărul de răspunsuri legate de acesta. Din acest
motiv, Semantria nu îndeplinește criteriile minime de utilizare pentru proiect, deoarece nu oferă nicio formă
de vizualizare a datelor, cum ar fi grafice sau diagrame, ceea ce ar face informațiile mult mai ușor de citit și
de înțeles.

3.4 Model de notare ponderat

Un model ponderat de notare a fost dezvoltat pentru a investiga gradul general de utilizare a acestor trei
produse, având în vedere criteriile de utilizare. Cele mai importante criterii au fost considerate a fi navigarea
setului de date și vizualizarea vizualizărilor de date, iar acestea permit cel mai mare contact cu datele, însă
filtrarea și sortarea datelor au primit, de asemenea, o pondere mare în cadrul modelului.

Scor cerință
Criterii Greutate Twitter Informații Hootsuite Semantia
Răsfoiți setul de date 30% 100 50 0
Sortarea datelor după 10% 30 50 50
emoție
Sortarea datelor după 5% 0 60 0
timp
Sortarea datelor după 5% 0 50 0
Sortarea datelor după 10% 100 0 25
companie
Filtrarea datelor după 10% 100 100 60
cuvânt sau expresie
Vizualizarea 30% 0 60 0
vizualizărilor de date
Scoruri ponderate 100% 53 51 13.5

În concluzie, în timp ce programele menționate mai sus au toate propriile beneficii pentru utilizare, niciunul
dintre ele nu acoperă toate cele trei criterii de utilizare, așa cum se arată în modelul de notare ponderat de
niciunul dintre produsele găsite în timpul cercetării produsului care a dus la peste 55/100, de aceea proiectul
creat este singur în domeniul său.

18
4 Secțiunea 4: Aspecte și considerații juridice, sociale, etice și
profesionale

Ca și în cazul oricărui proiect creat online, dezvoltatorul trebuie să ia serios în considerare orice posibile
probleme care ar putea apărea de la începuturile sale. Regulamentul general privind protecția datelor (GDPR)
care a intrat în vigoare în mai 2018 trebuie luat în considerare, deoarece scopul proiectului este de a colecta
date de la persoane fizice fără a le informa despre aceasta. Cu toate acestea, deoarece site-urile de rețele
sociale sunt conștiente de faptul că multe companii colectează date de pe site-urile lor în scopuri de marketing
și în alte scopuri, este scris în Termenii și condițiile acestor site-uri că datele utilizatorului pot fi colectate. În
ciuda acestui fapt, este încă ambiguu din punct de vedere social și etic să colectezi datele oamenilor în aceste
scopuri fără a-i informa despre asta, deoarece marea majoritate a publicului nu va citi niciodată Termenii și
condițiile (Cakebread, 2017).

Din cauza scandalului recent care implică Facebook și Cambridge Analytica, Facebook și multe alte rețele
sociale și-au înăsprit securitatea care implică aplicații realizate de utilizatori terți. Această mișcare a fost
inițiată cu bună credință datorită dorinței lor de a proteja datele consumatorilor lor, totuși înseamnă că a făcut
mult mai dificilă extragerea datelor de pe aceste site-uri; Facebook fiind cel mai lung proces pentru a obține
autorizația de a colecta acest lucru, chiar dacă aplicația este creată în scopuri științifice sau educaționale.

Legea privind protecția datelor din 2018 este implementarea specifică a GDPR din Marea Britanie, care
controlează modul în care informațiile personale ale unei persoane sunt utilizate de organizații sau companii.
De exemplu, o companie trebuie să se asigure că informațiile personale sunt "utilizate corect, legal și
transparent", "utilizate în scopuri specificate, explicite" și "păstrate nu mai mult decât este necesar" (Gov.uk,
2018).

Ar putea fi considerat evaziv din punct de vedere legal, social, etic și profesional în interesul acestui proiect,
deoarece este foarte puțin probabil ca dezvoltatorul să contacteze proprietarul fiecărui cont pentru a primi
permisiunea de a utiliza postările lor de pe rețelele sociale. Dacă o persoană ar contacta un site de socializare
pentru a-și șterge datele, ceea ce este în drepturile sale de la implementarea GDPR, nu ar ști dacă datele sale
au fost utilizate de orice altă parte fără permisiunea lor, prin urmare, informațiile lor pot exista în continuare,
în ciuda faptului că persoana își exercită "dreptul de a fi uitat" (art. 17 GDPR).

Există considerente profesionale care ar trebui luate în considerare, în care datele specifice colectate
găzduiesc opiniile clienților cu privire la diferiți concurenți pentru marca utilizatorului. Aceste informații nu
ar trebui să fie vizualizate de niciun angajat care nu are nevoie să le vizualizeze, deoarece datele brute
colectate folosind codul Python pot include nume de utilizator, nume și locații și alte informații personale pe
care rețelele sociale le colectează despre utilizatorii lor.

19
5 Secțiunea 5: Cerințe și metodologie

5.1 Analiza cerințelor

Deoarece Proiectul nu atrage părți interesate terțe, în cazul în care un sistem și-ar fi putut stabili cerințele prin
sondaje și chestionare, dezvoltatorul nu a putut face acest lucru. Datorită acestui fapt, cerințele au rezultat în
primul rând din discuțiile cu clienții, precum și din investigarea sistemelor concurenților și descoperirea
aspectelor pe care dezvoltatorul consideră că le-ar fi putut adăuga pentru a-și continua programele.

5.2 Compararea sistemelor

Pentru a colecta datele de pe Twitter, cea mai bună soluție este utilizarea unei combinații de aplicații terțe și
Python, care permite dezvoltatorului să colecteze datele exacte de care au nevoie și să anuleze orice părți ale
fișierului pe care le consideră inutile.

După colectarea datelor, acestea trebuie exportate, ceea ce permite dezvoltatorului să se uite peste setul de
date și să găsească orice anomalii, precum și să se asigure că datele au fost colectate corect. Cea mai bună
soluție posibilă pentru aceasta este să utilizați Excel pentru a crea formulele pentru analiza sentimentelor,
înainte de a încărca datele într-un instrument de vizualizare a datelor, cum ar fi Tableau.

5.3 Cerințe funcționale

Cerințele funcționale pentru acest proiect sunt următoarele:


1) Utilizatorii pot răsfoi cu ușurință setul complet de date (adică postările de pe rețelele sociale)
2) Utilizatorii pot sorta datele după timp
3) Utilizatorii pot sorta datele după emoții
4) Utilizatorii pot sorta datele după sex
5) Utilizatorii pot sorta datele după companie
6) Utilizatorii pot filtra datele după cuvinte specifice
7) Utilizatorii pot edita și elimina date
8) Utilizatorii pot vizualiza o varietate de vizualizări de date prefabricate pentru date
9) Utilizatorii își pot crea propriile vizualizări de date pentru date
10) Utilizatorii își pot exporta vizualizările de date individual
11) Utilizatorii își pot exporta vizualizările de date în ansamblu
12) Utilizatorii pot încărca seturi de date pentru analiză
13) Dezvoltatorul poate încărca seturi de date pentru analiză

5.4 Cerințe nefuncționale

Cerințele nefuncționale pentru acest proiect sunt următoarele:


1) Datele trebuie păstrate în siguranță
2) Proiectul trebuie să se desfășoare fără probleme, cu întreruperi minime
3) Proiectul trebuie să se actualizeze singur dacă se adaugă date noi la setul de date
4) Datele individuale ale unei persoane trebuie să poată fi șterse la cerere
5) Proiectul trebuie să fie ușor de utilizat

20
Ar trebui furnizat un tabel MoSCoW pentru a forma ordinea de prioritate pentru cerințele stabilite.
Acestea sunt împărțite în "Trebuie să aibă", "Ar trebui să aibă", "Ar putea avea" și "Nu va avea (de
data aceasta)".

Nu. Cerință. Moscova?


1) Utilizatorii pot răsfoi cu ușurință setul complet de date (adică postările de pe Trebuie să
rețelele sociale) aibă
Ar trebui să
2) Utilizatorii pot sorta datele după timp
aibă
Trebuie să
3) Utilizatorii pot sorta datele după emoții
aibă
Ar fi putut
4) Utilizatorii pot sorta datele după sex
avea
Trebuie să
5) Utilizatorii pot sorta datele după companie
aibă
Ar trebui să
6) Utilizatorii pot filtra datele după cuvinte specifice
aibă
Ar fi putut
7) Utilizatorii pot edita și elimina date
avea
Utilizatorii pot vizualiza o varietate de vizualizări de date prefabricate pentru Trebuie să
8)
date aibă
Ar trebui să
9) Utilizatorii își pot crea propriile vizualizări de date pentru date
aibă
Trebuie să
10) Utilizatorii își pot exporta vizualizările de date individual
aibă
Trebuie să
11) Utilizatorii își pot exporta vizualizările de date în ansamblu
aibă

12) Utilizatorii pot încărca seturi de date pentru analiză Nu va avea


Ar fi putut
13) Dezvoltatorul poate încărca seturi de date pentru analiză avea
Cantitatea de cerințe prioritare "Must have" nu ar trebui să depășească niciodată 60%, în cadrul
acestui proiect există 6 cerințe "Must have" și 13 cerințe totale, ceea ce dă un procent de 46%,
cerințele "Ar trebui să aibă" convingând încă 23%. În consecință, nu ar trebui să existe îngrijorări cu
privire la calendarul acestui proiect.

5.5 Metodologie

Pentru ca majoritatea proiectelor să aibă succes, echipa de proiect ar trebui să urmeze o metodologie adecvată
pe tot parcursul creării sale. Proiectul va fi dezvoltat folosind o metodologie iterativă DSDM Atern; acest
lucru se datorează în mare parte celor opt principii ale DSDM Atern, care se leagă de idealurile programului:

Principiul 1. "Concentrați-vă pe nevoia de afaceri"

21
Deoarece proiectul se referă în mod specific la o afacere și la ceea ce doresc să descopere despre o legătură
între utilizarea social media și reputație / profit, se referă foarte mult la primul principiu al DSDM "Focus on
the Business Need". Programatorii vor avea nevoie de comunicare constantă și feedback între ei și companie
pentru a evalua cerințele, precum și pentru a stabili o înțelegere mai profundă a nevoilor afacerii, predominant
prin tehnica MoSCoW.

Principiul 2. "Livrați la timp"

Un alt principiu al Atern, "Deliver on Time", este legat de proiect, deoarece există un termen limită strict de
29 aprilie pentru ca proiectul și rapoartele să fie scrise și încheiate. Acest lucru poate fi realizat în primul rând
prin stabilirea unor termene limită conștiincioase pentru a menține progresul fluid al proiectului și
concentrarea asupra priorităților de afaceri pe tot parcursul.

Mai mult, un alt aspect al DSDM care privește timpul este "regula 80:20". Deoarece proiectul se concentrează
pe colectarea datelor de pe platformele de comunicare socială, acesta ar putea fi considerat un procent mare
din proiectul general, prin urmare, este probabil ca 80% din proiect să poată fi finalizat în 20% din timp, iar
restul de 80% din timp să poată fi utilizat pentru a adăuga detalii fine și pentru a spori funcționalitatea.

Principiul 3. "Colaborați"

Lucrul în echipă pe tot parcursul proiectului și inclusiv contribuția și feedback-ul clientului, asigură crearea
celui mai bun proiect posibil. Acest lucru permite:

1) O mai bună înțelegere a sarcinii la îndemână și a rezultatului așteptat.


2) Viteză mai mare în care se obține rezultatul.
3) O proprietate comună între creatorii proiectului și clienți.

Pentru a se asigura că acest lucru este realizat, liderul de proiect trebuie să implice activ pe toată lumea din
echipă pentru a forma o mentalitate "o singură echipă", precum și pentru a-i împuternici să ia decizii cu
privire la proiect.

Principiul 4. "Nu faceți niciodată compromisuri în ceea ce privește calitatea"

Acest principiu prevede că nivelul de calitate la care proiectul urmează să fie finalizat ar trebui să fie convenit
la începutul planificării și toate lucrările finalizate asigură atingerea acestui nivel.

Prin urmare, managerul de proiect trebuie să stabilească nivelul de calitate anticipat la începutul formării
proiectului și să se asigure că calitatea nu devine o eventuală variabilă. De asemenea, trebuie să garanteze
testarea proiectului la începutul dezvoltării și continuu după, ceea ce poate fi realizat prin mai multe metode,
cum ar fi funcționalitatea, gradul de utilizare sau testarea performanței.

Principiul 5. "Dezvoltă-te iterativ"

Similar principiului patru, principiul cinci se concentrează pe dezvoltarea și testarea proiectului printr-un stil
de dezvoltare iterativ. Pentru a realiza acest lucru, managerul de proiect, în timp ce dezvoltă iterativ, trebuie
să se asigure și să confirme continuu că sistemul corect este construit. Apoi, dacă este necesar, schimbați
dezvoltarea proiectului pentru a vă asigura că obține cea mai bună producție posibilă, continuând să
experimentați și să evoluați proiectul.

Principiul 6. "Construiți treptat din fundații ferme"

22
Principiul șase se referă direct la beneficiile afacerii, implicând faptul că construirea incrementală permite
proiectului să fie lansat mai devreme pentru client, ceea ce permite dezvoltatorilor să înțeleagă domeniul de
aplicare al afacerii și să raporteze potențialele actualizări la cerințele lor operaționale.

Acest lucru este posibil prin stabilirea unei cantități mari de design înainte de începerea dezvoltării, alături de
eforturile pentru o livrare timpurie a produsului final. Este esențial ca dezvoltatorul să se concentreze pe ceea
ce dorește să fie produs - spre deosebire de modul în care intenționează să ajungă la acesta - în tot acest timp.

Principiul 7. "Comunicați continuu și clar"

Deoarece comunicarea slabă este adesea citată ca fiind cea mai mare cauză unică a eșecului proiectului,
tehnicile și principiile asociate DSDM Atern sunt concepute pentru a îmbunătăți comunicarea între membrii
echipei de dezvoltare pentru a asigura un model de afaceri de succes.

Modul superlativ pentru managerul de proiect de a se asigura că acest principiu este menținut este prin
asigurarea unor activități care încurajează comunicarea eficientă între echipe, cum ar fi organizarea de ateliere
și solicitarea documentației față în față. În plus, interacțiunea dintre echipă și acționari, atât formală, cât și
informală, este imperativă. Acest lucru poate fi completat prin păstrarea documentației, cum ar fi itinerariile.

Principiul 8. "Demonstrați controlul"

Principiul final implică faptul că echipa controlează proiectul în orice moment. Acest lucru se realizează prin
a fi proactiv atunci când monitorizați și controlați progresul realizat cu proiectul, precum și prin posibilitatea
de a dovedi în orice moment că dețin controlul. Acest lucru ar trebui stabilit în întreaga echipă prin utilizarea
zilnică a nivelurilor adecvate de formalitate pentru a asigura procedura, precum și gestionarea contractelor și a
altor nevoi de afaceri în consecință.

5.6 Justificarea caracterului adecvat al unei metodologii sau al unui cadru


urmat

Principalul motiv pentru care DSDM Atern a fost aleasă ca metodologie pentru această operațiune este că
proiectul se conformează multora dintre principiile sale, cum ar fi "concentrarea pe nevoia de afaceri" și
"livrarea la timp". Utilizarea acestei metodologii asigură crearea unui produs specific, care este stabilit de
nevoile afacerii, precum și date precise pentru finalizarea fiecărui aspect al proiectului. Cantitatea mare de
planificare și detalii pe care DSDM le încurajează certifică faptul că proiectul va fi finalizat la timp.

6 Design
6.1 Diagrama cazului de utilizare UML
Diagrama cazurilor de utilizare ilustrată mai jos (Figura 9.) demonstrează diferitele acțiuni pe care un
utilizator le poate finaliza prin cod, precum și limitările. După cum se arată mai jos, un actor (utilizator) este
capabil să "Interogare de intrare" pentru codul de căutat, "Listă" datele, ceea ce include posibilitatea de a
vizualiza o listă de Tweets, precum și permiterea exportului datelor din program într-un fișier .csv. De
asemenea, trebuie să poată termina programul.

23
Figura 9. Draw.io

24
7 Procesul de dezvoltare

7.1 Etapa 1: Preluarea inițială a codului Python

În prima etapă de dezvoltare, sarcina cheie a fost de a scrie codul care să permită clientului să preia un număr
stabilit de tweet-uri de pe Twitter care includ un anumit cuvânt sau frază, decisă de client. Pentru a face acest
lucru, este necesară o aplicație Twitter. Începând cu noiembrie 2017, Twitter a solicitat tuturor utilizatorilor să
creeze un cont de dezvoltator Twitter pentru a crea o aplicație, în care trebuie să fie de acord cu diferite
cerințe legale și etice și să specifice natura aplicației pe care o creează (Roth, 2018).

Aplicații > Mining Demo UoG

Detaliile aplicației Chei și jetoane Permisiuni

Detaliile aplicației

Pictograma aplicației

Pictograma aplicației este prestabilită, dați clic pe Editați pentru a încărca.

Numele aplicației

Minerit Demo UoG

Descriere

Extragerea datelor din tweet-uri publice care includ cuvinte cheie (nume de companii) sau hashtag-uri

Adresa URL a site-ului web

https://twitter.com/

Conectați-vă cu Twitter

Dezactivat

Adresa URL de apelare inversă

Niciunul

Adresa URL a termenilor și condițiilor

Adresa URL a politicii de confidențialitate

Numele organizației

Adresa URL a site-ului web al organizației

Utilizarea aplicației

Aplicația va fi utilizată pentru a extrage date pentru uz personal pentru un proiect universitar din ultimul an. Va fi folosit doar pentru a descoperi tweet-uri
care # sau scriu numele unei companii pentru a găsi opinia generalăa publicului. Acest lucru (în proiect) va fi apoi comparat cu profitabilitatea companiei
pentru a vedea dacă există o legătură între activitatea online, reputație și profit.

Figura 10. Twitter Developers, "Detalii aplicație"

De-a lungul procesului de aplicare s-a afirmat în mod repetat că aplicația va fi dezvoltată în scopuri
educaționale, deoarece acest lucru crește șansele sale de a fi aprobată. În mod plăcut, aplicația a fost aprobată
în termen de cinci minute de la depunerea sa și apoi i s-au atribuit diferite chei API și jetoane de acces pentru
a

25
permite unei bucăți de cod să acceseze Twitter printr-un sistem terț, în acest caz, Jupyter Notebook.

Aplicații > Mining Demo UoG

Detalii aplicație Chei și jetoane Permisiuni

Chei și jetoane

Chei API pentru consumatori

Revocați J Regenerați

Figura 11. Twitter Developer, "Chei și jetoane" (Chei și jetoane redactate)

Odată ce aplicația a fost aprobată și apoi ar putea recolta date de pe Twitter, cheile și jetoanele ar putea fi
implementate în cod. În conformitate cu cel de-al șaselea principiu al DSDM, "Construiți iterativ din
fundațiile firmei", baza proiectului a fost scrierea codului care a preluat datele de pe Twitter, asigurarea
funcționării și recuperarea tipurilor de date necesare (cum ar fi tweet-ul întreg, ora și numele de utilizator) și
apoi implementarea factorului de analiză a sentimentului.

Pentru a ajuta la crearea acestui proiect, a fost importată o bibliotecă Python bazată pe Twitter, Tweepy
("bliti", 2019), care permite accesul ușor la Tweets prin API-ul Twitter. Tweepy oferă un număr mare de
fragmente de cod și tutoriale în documentația lor, care ajută mii de oameni să-și folosească sistemul pentru a
simplifica codul în care sunt solicitate date de la Twitter, precum și specificarea variabilelor exacte necesare.
Codul utilizatorului github ritvikmath a fost, de asemenea, utilizat ca structură pentru preluarea Tweet-urilor (
ritvikmath , 2018).

Codul inițial pentru această etapă a proiectului a fost conceput pentru a verifica cronologia dezvoltatorului ca
măsură de precauție pentru a se asigura că codul funcționează - acest lucru fiind posibil prin funcția "celulă" a
Jupyter Notebook - înainte de a permite utilizatorului să introducă un cuvânt sau o expresie. Programul va
căuta apoi prin cele mai recente 100 de tweet-uri care includ această interogare și le va afișa pe ecran pentru
ca utilizatorul să le navigheze, înainte de a le exporta într-un fișier .csv numit după alegerea utilizatorului.

Iteraţii
Repetare Dată Cod Rezultat
1 24/2/19 Eșua
Importul CSV
Buclă infinită a celor
# Crearea obiectului API în timp ce transmiteți mai recente 17
informații de autentificare tweet-uri
API = Tweepy. API(auth)

# Deschideți/creați un fișier pentru a adăuga


date
csvFile = deschis('asos3.csv', 'a')

26
csvWriter = csv.writer(csvFile)

# Apelarea funcției user_timeline cu parametrii


noștri
rezultate = api.search(q=interogare, lang=limbă)

contor = 0

în timp ce contorul != 500:


Pentru Tweet în rezultate:
dacă (nu tweet.retweeted) și ("RT @" nu
în tweet.text):
#Write rând la fișierul csv / folosesc
codificarea utf-8
csvWriter.writerow([tweet.created_at,
tweet.user.screen_name, tweet.text])
contor +=1

csvFile.close()

2 25/2/19 Importul CSV Cu toate acestea,


succesul elimină
# Crearea obiectului API în timp ce transmiteți emoji-urile
informații de autentificare
API = Tweepy. API(auth)

# Deschideți/creați un fișier pentru a adăuga


date
csvFile = deschis('asos5.csv', 'a')

#Use CSV Writer


csvWriter = csv.writer(csvFile)

# Apelarea funcției user_timeline cu parametrii


noștri
rezultate = api.search(q=query, lang=language,
count=100)

Pentru Tweet în rezultate:


dacă (nu tweet.retweeted) și ("RT @" nu
este în tweet.text):
#Write rând la fișierul csv / folosesc
codificarea utf-8
csvWriter.writerow([tweet.created_at,
tweet.user.screen_name, tweet.text.encode('utf-
8')])

csvFile.close()

3 25/2/19 Importul CSV Succes

# Crearea obiectului API în timp ce transmiteți


informații de autentificare
API = Tweepy. API(auth)

# Deschideți/creați un fișier pentru a adăuga


date
csvFile = deschis('asos3.csv', 'a')

27
#Use CSV Writer
csvWriter = csv.writer(csvFile)

# Apelarea funcției user_timeline cu parametrii


noștri
rezultate = api.search(q=query, lang=language,
count=500)

Pentru Tweet în rezultate:


dacă (nu tweet.retweeted) și ("RT @" nu
este în tweet.text):
#Write un rând la fișierul csv / Folosesc
codificarea
UTF-8
csvWriter.writerow([tweet.created_at,
tweet.user.screen_name, tweet.text])

csvFile.close()

Deși codul a fost parțial scris de Tweepy, au existat mai multe linii care au trebuit modificate, adăugate sau
eliminate, deoarece nu se potriveau specificațiilor pentru proiectul creat. Cea mai importantă parte a acestui
lucru a implicat exportul tweet-urilor. Se crede că, în special în zilele noastre pe social media, o mare parte a
analizei semantice se bazează pe emoji și emoticoane folosite de public. Ca atare, codul privind exportul de
tweet-uri într-un fișier .csv a trebuit să fie editat pentru a se asigura că nu există nicio formatare în cadrul
procesului care să elimine emoji-urile sau să le facă ilizibile de o foaie de calcul.

A existat o problemă inițială la deschiderea documentelor create de program. Excel a fost necesar pentru a
crea formulele necesare pentru a analiza tweet-urile în mod corespunzător, cu toate acestea nu este capabil să
citească emoji-uri dintr-un fișier .csv. Deoarece programul a fost dezvoltat folosind un MacBook,
dezvoltatorul a avut acces și la Numbers din pachetul iWorks de la Apple. Deschiderea fișierelor .csv în
Numbers, apoi exportarea lor într-un fișier .xlsx pentru a le deschide apoi în Excel a fost o soluție perfectă
pentru aceasta, deoarece fișierele .xlsx pot fi utilizate și în software-ul de vizualizare a datelor.

Figura 12. Deschiderea unui fișier .csv în Excel


@boohoo 2019-04-10 16:19:06 helenbrzzz
https://t.co/rSACWgxIWp
@boohoo 2019-04-10 16:17:25 krtaaa93 @ boohoo stânga

@boohoo 2019-04-10 16:14:22 DanWarren1982 @afcjohnboy @ DannyBrookerS @ boohoo Și o filă de bar de 705 GBP

@boohoo 2019-04-10 16:11:06 FierceFabRev


Caut o jachetă nouă de vârste și l-am găsit pe cel perfect pe ©boohoo Căutarea sa încheiat în cele din urmă. V
@booboo 2019-04-10 16:11:00 TNEZ ©boohoo E miercuri băieți

@boohoo 2019-04-10 16:10:50 morminteO3 ©boohoo stânga ev

@boohoo 2019-04-10 16:10:43 Missourian51 ©boohoo Corect, vă rog

@boohoo 2019-04-10 16:05:13 devynnaomi


Primul meu pachet de la ©boohoo a venit prin poștă 5
@boohoo 2019-04-10 1601:34 LucyPurtFace În prezent, editez ca o femeie nebună pentru a obține acest ©videoclip de maternitate boohoo în seara asta pe canalul meu. Link-ul va fi... https ://t.co/qf5oVe Toqe

@booboo 2019-04-10 15:58:43 Y8Meenz ©Boohoo de ce Boohoo îmi încurcă în mod repetat comanda

@boohoo 2019-04-10 15:54:33 Boohoo CSHELP ©@shellbabes96 boohoo Hei Shell, îmi pare rău să aud asta! Îmi puteți trimite numărul comenzii prin mesaj direct și voi ... https:/t.co/Yw1nKBhf6Q

@boohoo 2019-04-10 15:53:32 shelly41 ©boohoo Am primit comanda mea astăzi că vreau să mă întorc Nu găsesc numărul comenzii mele puteți să mi-l trimiteți vă rog ... https:/t.co/bDIYhc4JRH

@boohoo 2019-04-10 15:46:53 Duck_Face_79


©boohoo dreapta •
@boohoo 2019-04-10 15:44:12 Manni_K28 ©boohoo stânga

@boohoo 2019-04-10 15:38:45 donnababy99 ©boohoo stânga v

Figura 13. Deschiderea aceluiași fișier .csv în Numbers

28
7.2 Etapa 2: Implementarea analizei semantice

7.2.1 Iterația 1

Următoarea etapă de dezvoltare a fost scrierea codului necesar pentru a scana fiecare tweet individual și a-i da
un rating din zece, în funcție de cât de pozitiv sau negativ părea tweet-ul. Utilizarea Python pentru codificare a
devenit rapid o pacoste din cauza lipsei unei caracteristici "carcasă" sau "comutare" pe care ar fi avut-o
codificarea în Java sau C ++.

Deși nu este deosebit de atractiv din punct de vedere estetic, s-a luat decizia de a utiliza diverse afirmații
"dacă" care să verifice fiecare tweet individual în cadrul .csv "pentru buclă" și să caute diferite cuvinte
comune care pot apărea. Aceste cuvinte au fost stabilite inițial prin YouGov "Cât de bun este bine?" Diagramă
(Figura 5.), la care se face referire în secțiunea 2 a raportului, apoi construită cu mai multe articole despre
sentimentul emoji-urilor (Novak, Smailovic, Sluban și Mozetic, 2015), (Lim, 2018) și (Brandwatch, 2019).

7.2.2 Iterația 2

După crearea bazei inițiale pentru cod, acesta a fost rulat de mai multe ori. Orice tweet care nu dădea un rating
semantic a fost analizat pentru a vedea ce limbaj a fost folosit și contextul în care a fost utilizat, ceea ce a
permis dezvoltatorului să crească limbajul care urmează să fie analizat în viitor.

O altă problemă evidențiată a fost că o mulțime de emoji care nu au fost menționate în niciunul dintre
articolele de cercetare nu au fost evaluate deloc. Folosind un site web care contează de fiecare dată când un
emoji este utilizat într-un tweet (emojitracker, 2019), dezvoltatorul a analizat primele treizeci de emoji
utilizate în întreaga lume și a vizualizat câteva sute de tweet-uri per emoji pentru a analiza contextul general al
utilizării acelui emoji, înainte de a le implementa în cod.

Odată implementate, un număr mare de Tweet-uri eșantionate ar reveni cu o valoare semantică atașată. Cu
toate acestea, atunci când reflectăm asupra datelor eșantionate ale fișierelor .csv, a ieșit la iveală faptul că
adevăratul context al Tweet-urilor a devenit adesea interpretat greșit, deoarece codul nu a putut determina
întotdeauna rezultatul implicit al mesajului.

Exemplele includ codul care clasifică un Tweet ca negativ datorită emoji-ului ales de Utilizator, chiar dacă
limbajul folosit alături de acesta a fost de fapt pozitiv. Într-un alt caz, codul s-a străduit să determine dacă
feedback-ul a fost pozitiv sau negativ, din cauza limbajului conflictual folosit. Codul a evaluat emoji-urile
folosite ca 5/10, un scor indiferent și indiferent, în timp ce limba aleasă mai târziu în Tweet a obținut un scor
mult mai pozitiv 8/10 sau 9/10.

7.2.3 Iterația 3

Datorită acestor tweet-uri cu diferite semnificații potențiale "alunecând prin fisuri", s-a decis că codul ar trebui
editat pentru a rezuma valoarea fiecărui cuvânt, frază sau emoji / emoticon folosit.

De exemplu, cu tweet-ul:

" Vă mulțumim @hm pentru vânzarea acestui tricou uimitor &^^V Total îndrăgostit https://t.co/50tfmtlwNU"

Emoji-ul are valoarea 5, deoarece poate fi folosit atât în sens pozitiv, cât și negativ, emoji-ul inimii are
valoarea 8, iar cuvântul "dragoste" are valoarea 9. În cadrul iterațiilor 1 și 2, valoarea acestui tweet ar fi fost
înregistrată ca 5, datorită emoji-ului fiind primul lucru menționat în tweet; odată ce codul a fost editat cu un
"Contor" și "Sumă" a valorilor, acest tweet a returnat apoi o valoare semantică de (5 + 8 + 9) / 3, pentru o
valoare totală de 7,3 recurentă. După alte rulări operaționale ale fișierelor .csv cu această nouă versiune de cod
pentru a căuta orice omisiuni lingvistice, a fost aprobată să fie versiunea finală.

29
7.3 Etapa 3: Colaționarea datelor în Excel

Fișierul Excel a fost proiectat să conțină cinci coloane de date care au fost considerate cele mai importante
pentru analiză:
- Numele companiei discutate
- Ora Tweet
- Numele de utilizator al tweeterului
- Tweet-ul în sine
- Evaluarea semantică

După cum sa explicat anterior, din cauza emoji-urilor care nu se formatează corect în Excel, setul de date a
fost inițial compilat în Numbers și apoi a fost exportat ca fișier .xlsx pentru a fi deschis și sortat în Excel.
Funcțiile de sortare și filtrare din cadrul aplicației au însemnat că orice tweet-uri fără valoare semantică ar
putea fi anulate din eșantionul de date, deoarece nu aveau niciun scop în analiză și ar fi interferat, de
asemenea, cu calculele efectuate în document.

Acesta a fost momentul în care vizualizările de date au trebuit să fie planificate, deoarece formulele create
trebuiau să ajute la vizualizarea datelor. Calculele alese au fost:
1) Evaluarea semantică medie a Tweets per companie.
2) Numărul de tweet-uri semantice din eșantion.
3) Numărul de Tweets pe oră a zilei.
4) Numărul de Tweets per companie per evaluare de la 1-10.

Aceste calcule au fost transmise printr-o combinație de formule "COUNT", "COUNTIF", "COUNTIFS",
"SUM" și "SUMIF" care au prezentat datele în formă numerică în foaia de calcul Excel, lângă datele în sine.
Aceste formule sunt prezentate în apendicele E.

30
IOLNO. OEIWEITSOA
FIRMĂ IEIn
vacăAraUxmIIER ORĂ TWEETS PER HOU
1.00
ASOS 128 655 5.12 ASOS 1,424,000 ASOS 128 01:00 3
1.00
BOOMOO 109 595 5 78 BOOMOO 609,400 BOOMOO 103 02:00 2
htpsan.coDhGU4p54 1.00
H&M 40 268 558 H&M 184.600 H&M 48 03:00 3
TPS n.co/nydv6kRTGH 1.00 GHIDAT GHIDAT
GHIDAT GREȘIT 97 604 5 6 23 GREȘIT 415.300 GREȘIT 97 04:00 8
UCA... 1.00
NASTY GAL 72 386 5.39 NASTY GAL 22.259 NASTY GAL 72 05:00 5
Ier... 1.00 148,200
ZARA 30 220 6.11 ZARA ZARA 36 06:00 un
1.00
Total: 484 07:00 el
1.00
8 00 11
1.00
9 00 18
. https:n.co/1016Xe98zn 2 00
10:00 21
"Shamoonyou 2 00
11:00 38
2.00
12:00 23
itps:n.colg9/7LIxTEC 2.00
13:00 46
Ng: 2.00
14:00 14
soin.colyuUIBzN4W) 2.00
15:00 25
2.00
16:00 33
https McouHB6ZPeQGD 2.00
17:00 41
ps:/n.co/TQ1 wBe3UTe 2.00
18:00 21
2.00
19:00 66
2.00
20:00 18
4.00
21:00 49
4.00
22:00 14
un necinstit 4.00
23:00 t
TBF 5.00
12:00 2
5.00

s:/n.co/4q281syhH7 5 00

5.00

Comanda Toromcthem 5.00


din nou X
5.00

*— 5.00

an.co/Mk3QNTO6PD 5.00

n... 5.00

NTTPS 5.00
:/R.co/SCRnOXZKhG
500

Figura 14. Captură de ecran cu date numerice lângă datele tweet în foaia de calcul Excel

Utilizarea Excel pentru a putea vizualiza setul de date a fost imperativă, deoarece se referă la mai multe dintre
cele treisprezece cerințe găsite în secțiunea 5 a raportului, cum ar fi:
- Utilizatoriisunt capabili să răsfoiască cu ușurință setul complet de date (adică postările de pe rețelele
sociale) (Req. Numărul 1)
- Utilizatoriisunt capabili să sorteze datele după timp (Req. Numărul 2)
- Utilizatoriisunt capabili să sorteze datele după emoție (Req. Numărul 3)
- Utilizatoriisunt capabili să sorteze după companie (Req. Numărul 5)
- Utilizatoriisunt capabili să filtreze datele după cuvinte specifice (Req. Numărul 6)
- Utilizatoriisunt capabili să editeze și să elimine date (Req. Numărul 7)

În timp ce majoritatea acestor cerințe au fost "Must haves" pe tabelul MoSCoW, câteva dintre ele au fost "Ar
trebui să aibă" și, prin urmare, depășesc așteptările clienților prin includerea în proiect.

7.4 Etapa 4: Crearea vizualizărilor de date

Software-ul decis pentru proiect a fost Tableau, datorită capacităților sale vaste care au permis crearea a șase
vizualizări diferite ale datelor pentru a le prezenta clientului. Având o mare varietate de vizualizări care pot fi
ușor compactate într-unul sau două tablouri de bord pentru lizibilitate, înseamnă că Clientul poate lua o
decizie în cunoștință de cauză cu privire la cât de mult să investească în CRM-ul său social. Simplitatea
Tableau asigura, de asemenea, ca odata ce proiectul este predat Clientului, acesta poate vizualiza, edita si
adauga date suplimentare la setul de date, cu instruirea corecta.

Deși Tableau a dezvoltat mai multe iterații ale software-ului lor pentru diferite niveluri de analiză a datelor,
produsul standard și, prin urmare, cel utilizat pentru acest proiect a fost "Tableau Desktop 2019.1". După
deschiderea Tableau, acesta întreabă instantaneu ce sursă de date să "Conectați" pentru a importa datele. Acest
lucru îl face extrem de ușor, deoarece "Microsoft Excel" se află în partea de sus a listei de opțiuni și este
simplificat la numele software-ului, spre deosebire de numele extensiei numelui de fișier, ".xlsx". După
aceasta, este simplu să alegeți coloanele de date care vor fi utilizate, iar Tableau răspunde prin trimiterea

31
coloanelor în ceea ce crede că sunt "dimensiuni" și "măsuri" pentru a crea cu exactitate tipul corect de
vizualizare.

Dimensiuni bolnav P •
Andreea Nume companie implicit

Andreea Numele companiei pentru medii


Andreea Numele companiei pentru nr. De tweet-uri semantice
Andreea Numele companiei pentru numărul total de tweet-uri
e Oră

# Nr. de Tweets pe evaluare


Andreea Anteturi separate de tweet
Andreea Cuvinte separate Tweet
E Ora Tweet
Andreea Tweet

Andreea Nume utilizator

Andreea Numele măsurilor

Măsurile
# ASOS
# MEDIE
# Boohoo
# H&M
# Ghidat greșit
# Urât Gal
# Nu. De tweet-uri semantice în eșantion
# NU. DE TWEETS
# Evaluare semantică
# SUMA TWEET-URILOR
# Nr. total. De tweet-uri pe pagina de Twitter a companiei din Marea Britanie și pe pagina de ajutor
# Tweets pe oră
# Zara
# Număr de înregistrări
# Măsurați valorile

Figura 15. Tabel care împarte coloanele în "Dimensiuni" și "Măsuri"

Prima vizualizare demonstrează un "Cloud de cuvinte" al celei mai utilizate limbi în Tweet-urile colectate.
Acest lucru a fost dificil de construit la început, deoarece Tableau nu are capacitatea de a împărți propozițiile
în cuvinte individuale. Prin urmare, Tweet-urile au trebuit împărțite folosind funcția "Text în coloane" din
Excel, care ia un eșantion de date și îl împarte în cuvinte individuale, depunând fiecare într-o celulă diferită.
Deși util, a făcut ca documentul să pară neîngrijit și, prin urmare, a fost finalizat la sfârșitul procesului, astfel
încât să poată fi scos din vedere, în dreapta tabelelor prezentate în figura 14.

După ce această operațiune a fost finalizată, cele douăzeci și șapte de coloane în care au fost împărțite Tweet-
urile au trebuit să fie îmbinate împreună pentru a permite crearea Word Cloud. Aici este utilizată caracteristica
Tableau 'Pivot'. Acest lucru creează două valori din orice număr selectat de utilizator: o combinație de
anteturi, coloane și o combinație de coloane de valori.

Ulterior, funcția "Filter" a trebuit să fie utilizată pentru a cerne cuvintele generice care nu au nicio valoare
semantică. Beneficiul acestei caracteristici este de a aduce la lumină datele descriptive care vor arăta contextul
dorit al clientului, creatorul Tweet-ului.

Cu această ocazie, odată ce acest proces a fost finalizat, un total de 236 de valori au fost negate din eșantion,
cum ar fi "de asemenea", "face", "salut", "eu" etc. Eșantionul a fost apoi lăsat cu cuvinte care au explicat de ce
au existat Tweet-urile, de exemplu "livrare" demonstrează că o mare parte din eșantion a avut o întrebare sau
o declarație cu privire la livrare, "returnări" etc. precum și diverse cuvinte pentru a demonstra emoții, cum ar
fi "ca", "bun", "iubitor", "drăguț" etc.

A fost important să se includă o reprezentare vizuală a datelor eșantion, precum și cifrele din spatele analizei,
deoarece permite clientului să vizualizeze emoțiile transmise pe un spectru mai larg decât pozitivitatea /
negativitatea. Trecerea cu mouse-ul peste cuvintele din vizualizare dezvăluie de câte ori a fost menționat acel
cuvânt în eșantion, care, dacă este filtrat de Top 50 utilizat, este între 7 și 45 de ori pe cuvânt.
A doua vizualizare creată demonstrează ratingul semantic mediu al fiecărei companii în ordine de la cel mai
mare la cel mai mic. Aceasta a fost creată printr-un tabel realizat în foaia de calcul Excel care a permis
plasarea unei valori numite "Evaluare semantică" (per companie) pe o axă și plasarea valorilor
corespunzătoare "Nume companie" pe cealaltă. A fost important să se creeze acest lucru, deoarece oferă
clientului o privire rapidă asupra companiilor care au cele mai multe reacții pozitive sau negative din partea
clienților lor. Aceștia se pot concentra apoi asupra datelor acestor companii atunci când se uită la celelalte

32
vizualizări sau pot alege să analizeze în continuare datele în ansamblu.

Acesta a fost unul dintre graficele mai ușor de creat, deoarece informațiile au fost ușor de preluat din foaia de
calcul. În plus, pentru a facilita vizualizarea acestor date de către Client într-un mod ușor de utilizat, valorile
semantice pentru fiecare companie au fost plasate în partea de sus a graficului, ceea ce este util pentru acest
scenariu datorită valorilor medii pentru primele trei companii (Missguided, H&M și Zara) fiind la doar 0,12
distanță.

A treia vizualizare a datelor utilizează o diagramă circulară care afișează câte tweet-uri au fost trimise în
general, pe oră a zilei. Aceasta a fost una dintre cele mai greu de creat vizualizări; Tableau nu permite ca
valorile care sunt pur și simplu "HH:MM" să fie un format valid, prin urmare generează propria dată
(01/01/1899) pentru a fi utilizată ca substituent. Din acest motiv, la crearea diagramei radiale, a trebuit să se
verifice dacă etichetele de pe grafic și taste nu includeau data substituentă, deoarece acest lucru ar fi făcut
graficul confuz și distrage atenția de la datele sale.

Similar celei de-a doua vizualizări, pentru a face informațiile mai ușor de citit "dintr-o privire" pentru Client,
au fost adăugate etichete care explică ora la care se corelează fiecare segment al graficului. Cu aceste
informatii este simplu sa percepeti cele mai populare ore pentru trimiterea Tweet-urilor, iar in cazul in care
Clientul ar dori suma exacta de Tweet-uri pe ora, poate pur si simplu sa treaca mouse-ul peste graficul din
cadrul Tableau si acesta va dezvalui aceste informatii.

O diagramă circulară suplimentară, a patra vizualizare, a fost creată pentru a afișa numărul total de tweet-uri
per companie colectate în eșantion. Deoarece proiectul este o investigație nu numai a valorii semantice, ci și a
popularității companiilor în cauză, această diagramă prezintă cu ușurință numele fiecărei companii și numărul
exact de tweet-uri din eșantionul pe care îl dețin.

Având această diagramă demonstrează că, în ciuda faptului că o companie are probabil mai multe tweet-uri
trimise decât oricare alta, majoritatea dintre ele ar putea să nu arate nicio valoare sentimentală și să fie pur și
simplu curioase și banale, spre deosebire de opiniile care ar putea influența alți potențiali clienți. Această
diagramă a fost relativ ușor de creat în Tableau, mai ales după crearea unei diagrame radiale în vizualizarea
anterioară.

Penultima vizualizare este o defalcare a numărului de Tweets per Rating – din 10 – per companie. Fiecare
companie are propria diagramă cu bare etichetată de la 1 la 10, care arată numărul de Tweet-uri pe care le-au
primit în cadrul fiecărui rating, pe care Clientul îl poate trece cu mouse-ul pentru a se uita la numărul exact de
Tweet-uri, însă acest lucru nu a fost modul în care a fost inițial planificat să fie prezentat.

Ideea inițială pentru această vizualizare a fost de a prezenta o diagramă cu bare stivuite care să demonstreze
numărul total de Tweet-uri din setul de date cu fiecare valoare din 10, aceasta ar demonstra apoi ce companie
a primit un număr notabil de Tweet-uri în cadrul acelei valori. Deoarece datele au fost colectate din Excel
folosind formule, datele - în mod similar cu cuvintele individuale pentru Word Cloud - ar fi trebuit să fie
îmbinate împreună cu un Pivot, totuși acest lucru a fost problematic, deoarece fiecare set de date poate avea
un singur Pivot.

Aceasta a însemnat că, atunci când a încercat să pivoteze datele împreună, a fuzionat cu datele Word Cloud și
a făcut ambele seturi de valori ilizibile. Deși acest lucru a fost frustrant, datele au încă sens logic pe cont
propriu și sunt ușor de înțeles ca șase diagrame cu bare separate.

A șasea și ultima vizualizare a fost singura statistică care nu provine direct din datele colectate, deoarece
acționează ca informații de bază despre companiile studiate pentru a furniza clientului informații
suplimentare. Acesta prezintă o diagramă cu bare care afișează numărul de tweet-uri pe care fiecare companie
le-a trimis pe pagina lor de Twitter din Marea Britanie, precum și "Pagina de ajutor", dacă posedă una,
începând cu 10 aprilie 2019. Acest lucru este util pentru a compara cât de activă este o companie pe social
media cu datele completate din alte vizualizări.

33
După ce aceste vizualizări au fost construite, au fost generate și conectate două tablouri de bord pentru a crea
un mediu pentru a vizualiza cu ușurință rezultatele.

Aceste tablouri de bord au fost împărțite în "Colectarea statisticilor", care conține:


- Tweets pe oră
- Numărul de Tweets per companie
- Numărul general de tweet-uri al companiei pe paginile lor Twitter

Precum și "Statistici de analiză" care deține:


- Cloud-ul mondial
- Evaluarea semantică medie pe companie
- Defalcarea numărului de Tweets per evaluare per companie.

Deoarece toate informațiile nu ar încăpea pe un singur tablou de bord, a fost imperativ să se asigure că modul
în care datele sunt prezentate clientului este ușor de utilizat. Acest lucru a fost realizat prin împărțirea lor în
cele trei vizualizări privind baza statisticilor și cele trei vizualizări privind analiza, în timp ce aprofundarea
datelor, deoarece aceasta părea cea mai logică abordare.

Un aspect cheie al prezentării acestor diagrame a fost acela de a se asigura că sunt ușor de dedus, datorită
căruia fiecare diagramă urmează aceeași schemă de culori de douăzeci de culori diferite - numită Tableau 20
în setările Tableau - pentru a o menține uniformă și acceptabilă din punct de vedere estetic pentru Client.
Acest lucru a trebuit să fie ușor modificat pentru vizualizarea trei , deoarece au existat mai mult de 20 de
intrări. Acolo unde avea sens și nu făcea vizualizarea prea aglomerată, etichetele au fost plasate chiar pe
diagramă, deoarece acest lucru a eliminat necesitatea unei "chei" deasupra, lateral sau dedesubt fiecare
diagramă, deoarece acestea ocupau spațiu valoros.

7.5 Cutie de timp

Sarcină Sarcină Starea activității


Număr
1 Cercetare inițială Finalizat la timp
2 Colectarea cerințelor Finalizat la timp
3 Scrierea codului Finalizat la timp
4 Rulați codul la fiecare două ore de la 12pm la 12am A rulat codul de cel puțin 5 ori pe
pentru fiecare companie (de 7 ori pe companie) companie, totuși unele Tweet-uri au apărut
în mai mult de un eșantion din cauza lipsei
de Tweet-uri cu privire la acea companie
în cele 2 ore.

Finalizat la timp
5 Proiectarea și dezvoltarea foilor de calcul Excel Finalizat la timp
6 Compilarea și exportul datelor în Excel Finalizat la timp
7 Formule create în Excel Finalizat la timp
8 Vizualizări de date create Toate vizualizările create conform
planului, cu excepția diagramei cu bare
stivuite, care a fost adaptată.

Finalizat la timp.
9 Testarea funcției Finalizat la timp
10 Remediați erorile găsite în perioada de testare Finalizat la timp
11 Prezentarea produsului către client Finalizat la timp
12 Raport final Finalizat la timp
13 Produsul final Finalizat la timp
7.6 Posibile abordări alternative

O serie de metode au fost luate în considerare în diferite etape de dezvoltare a proiectului. Un exemplu în
acest sens a fost în timpul procesului preliminar de proiectare, când a existat o dezbatere cu privire la faptul

34
dacă setul de date ar trebui prezentat ca o bază de date SQL sau într-o foaie de calcul, cum ar fi Excel sau
Numbers.

Partea pozitivă a deținerii datelor într-o bază de date este că este mai sigură și deține un nivel mai ridicat de
securitate decât o foaie de calcul. Acest lucru se datorează faptului că este mai dificil să ștergeți accidental
înregistrările și este criptat la un standard mai ridicat decât o foaie de calcul tipică. Cu toate acestea, s-ar putea
argumenta că un număr mai mare de public larg poate vizualiza și edita foi de calcul în comparație cu
cunoașterea SQL. Din acest motiv, s-ar putea face greșeli dacă o persoană neexperimentată încearcă să editeze
datele din baza de date.

După colectarea datelor, o altă dilemă a înconjurat decizia cu privire la instrumentul de vizualizare care
trebuie utilizat, deoarece fiecare dintre liderii de piață are propriile puncte forte și puncte slabe. O opțiune
posibilă a fost Power BI, un instrument deținut de Microsoft care se conectează direct la Excel pentru a crea
grafice și tablouri de bord din date. Un altul a fost SiSense, care permite vizualizarea datelor, dar se consideră
o "soluție de analiză a datelor mari" atât pentru analiza, cât și pentru vizualizarea volumelor mari de date.

Dupa revizuirea aspectelor pozitive si negative ale celor trei optiuni, Tableau a fost ales datorita bogatiei sale
de caracteristici in ceea ce priveste vizualizarea datelor – care este tot ceea ce era necesar in acea etapa a
procesului de dezvoltare – precum si datorita unei chei de licenta gratuite pentru Tableau Desktop.

8 Testare
In urma dezvoltarii celor doua tablouri de bord pentru a prezenta datele clientului, intregul proiect Tableau a
fost supus unor teste amanuntite si cuprinzatoare pentru a se asigura ca functioneaza conform asteptarilor.
Acest lucru poate fi găsit în apendicele G. Testul 9 a demonstrat că o formulă creată pentru a număra numărul
de Tweet-uri pe oră nu se comporta corect. Găsirea acestui lucru mi-a permis să repar formula și să forțez o
actualizare a vizualizărilor pentru a mă asigura că dețin datele corecte. Toate celelalte 26 de teste au trecut
prima dată.

35
9 Evaluare

9.1 Evaluarea produsului

Pentru a analiza dacă proiectul a fost un succes, consider că este imperativ să privim înapoi la cerințele
colectate și să vedem dacă acestea au fost îndeplinite în conformitate cu prioritizarea Ministerului de
Înțelegere.

Nu. Cerință. Moscova? Final


Produs?
1) Utilizatorii pot răsfoi cu ușurință setul complet de date (adică postările de Trebuie să aibă Da
pe rețelele sociale)

Ar trebui să
2) Utilizatorii pot sorta datele după timp Da
aibă

3) Utilizatorii pot sorta datele după emoții Trebuie să aibă Da

Ar fi putut
4) Utilizatorii pot sorta datele după sex Nu
avea

5) Utilizatorii pot sorta datele după companie Trebuie să aibă Da

Ar trebui să
6) Utilizatorii pot filtra datele după cuvinte specifice Da
aibă
Ar fi putut
7) Utilizatorii pot edita și elimina date Da/Nu
avea
8) Utilizatorii pot vizualiza o varietate de vizualizări de date prefabricate Trebuie să aibă Da
pentru date

Ar trebui să
9) Utilizatorii își pot crea propriile vizualizări de date pentru date Da
aibă

10) Utilizatorii își pot exporta vizualizările de date individual Trebuie să aibă Da

11) Utilizatorii își pot exporta vizualizările de date în ansamblu Trebuie să aibă Da

12) Utilizatorii pot încărca seturi de date pentru analiză Nu va avea Posibil
Ar fi putut
13) Dezvoltatorul poate încărca seturi de date pentru analiză avea Posibil

Din cele treisprezece cerințe colectate, fiecare cerință care a fost clasificată inițial "trebuie să aibă" sau "ar fi
trebuit" a fost implementată cu succes, singurul "nu" hotărât în cadrul cerințelor este în ceea ce privește
sortarea datelor în funcție de sex. Acest lucru se datorează faptului că Twitter nu activează această opțiune în
mod nativ și ar implica un nivel profund de învățare automată pentru a analiza numele de utilizator, numele
afișate și tweet-urile pentru a analiza dacă sistemul crede că un cont este bărbat sau femeie. Orice altă cerință
ar putea fi un "da" cu instruirea corectă a sistemului.

În ciuda faptului că marea majoritate a cerințelor sunt îndeplinite, încă mai cred că există multe lucruri care
pot fi îmbunătățite în ceea ce privește sistemul pe care l-am creat. În primul rând, planul inițial a fost de a
analiza datele de pe Facebook și Instagram, precum și Twitter, totuși, din cauza GDPR, procesul îndelungat de
solicitare a permisiunii de a construi o aplicație pe Facebook în 2019 necesită mai mult timp și buget decât am
avut ca student. Acest lucru se datorează faptului că necesită un întreg prototip funcțional al aplicației pe care
o construiți înainte de a o aproba.

36
În plus, deoarece Facebook deține Instagram și nu au o platformă pentru aplicații terțe în cadrul aplicației
Instagram în sine, un alt tip de instrument de răzuire a datelor ar fi trebuit să fie codificat și testat, ceea ce din
nou a necesitat mult mai mult timp decât a trebuit să lucrez la proiect.

Cred, de asemenea, că, având în vedere mai mult timp, proiectul ar fi putut colecta mult mai multe date decât
deține în prezent, ceea ce ar oferi o reprezentare mai exactă a opiniilor publicului cu privire la companii. Acest
lucru mi-ar fi permis, de asemenea, să analizez mai multă semantică și să îmbunătățesc în continuare zona
particulară a codului care detectează sentimentul datelor menționate.

Cu toate acestea, consider că acest proiect conține o reprezentare completă a opiniilor publicului online cu
privire la anumite companii. Codul privind analiza semantică oferă, de asemenea, o citire exactă a gândurilor
unui consumator, iar vizualizările de date create prin Tableau arată o varietate de moduri interesante de a privi
datele colectate. Acest lucru permite o analiză ușor de utilizat pentru un sens mai profund odată comparat cu
succesul general al unei companii.

Dacă acest proiect ar avea iterații viitoare, ar beneficia de adaptarea într-o bază de date pentru securitate și
viteza de colectare și rechemare a datelor, deoarece acest lucru ar forma mai multă structură pentru proiect.
Numărul companiilor monitorizate ar putea fi mărit și cred, de asemenea, că ar fi o idee bună să fie
implementați "ascultători de flux" care să răzuiască fiecare Tweet pe măsură ce este postat și să-l încarce în
baza de date, spre deosebire de a avea o persoană care rulează manual codul la fiecare una până la două ore.

În versiunile viitoare ale proiectului, m-aș asigura, de asemenea, că există date în valoare de săptămâni și luni,
deoarece acest lucru deblochează apoi posibilitatea de a analiza sentimentul mediu al Tweet-urilor lună de
lună, precum și volumul de Tweet-uri colectate. Acest lucru ar putea fi apoi vizualizat prin Tableau ca o
comparație a datelor fiecărei companii individuale, precum și o evaluare a pieței în ansamblu.

9.2 Autoevaluare

Având în vedere nivelul meu de calificare ca student universitar cu cunoștințe simpliste de codificare, cred că
am creat acest proiect cât mai bine posibil.

Când am început să cercetez acest proiect, am știut că va trebui să învăț un limbaj de codare în care aveam
experiență minimă, dacă nu deloc, deoarece cele patru sau cinci limbaje de codare pe care le cunosc bine le-
am învățat încă din școala secundară. Din acest motiv, când m-am decis asupra Python pentru limbajul meu de
codare, știam că proiectul va fi o luptă de creat, dar eram dornic de provocare, deoarece am găsit fascinant
subiectul proiectului meu și nu exista nicio modalitate de a crea proiectul pe care îl doream fără a încerca
învățarea Python.

Un dezavantaj al acestui lucru, totuși, a fost că probabil puneam prea multă presiune asupra mea pentru a
învăța un limbaj de codare complet nou în ultimul meu an de universitate. De câteva ori m-am blocat pe o
bucată relativ simplă de cod pentru care cred că aș fi știut soluția dacă educația mea în limbaj s-ar potrivi cu
cea a Java, HTML sau CSS. Datorită acestui fapt, mă simt ca și cum aș fi pierdut câteva zile schimbând părți
mici din codul meu pentru a investiga unde am greșit, ceea ce, în general, a ajuns să fie o problemă cu sintaxa
mea și nu cu codul scris în sine.

Având șansa de a crea din nou întregul proiect, cred că multe dintre îmbunătățirile pe care le-aș face ar fi
bazate pe timp. Aș începe să învăț Python și să finalizez tutoriale mai devreme în ciclul de dezvoltare, astfel
încât să pot petrece mai puțin timp rezolvându-mi codul. Apoi aș putea petrece mai mult timp dezvoltând
proiectul și mărind domeniul de aplicare: fie că este vorba de dimensiunea setului de date, de numărul de
companii analizate sau de fiabilitatea analizei semantice.

Dacă mi s-ar oferi posibilitatea, aș petrece mai mult timp dezvoltându-mi setul de abilități cu Tableau,
deoarece este un sistem atât de puternic și capabil și mă simt ca și cum aș fi pășit doar suprafața capacităților
sale.

În ciuda acestui fapt, am început acest proiect dorind să analizez cât de pozitive sau negative au fost opiniile
oamenilor pe social media și să afișez rezultatele și am dezvoltat un program care face exact acest lucru. Am
reușit să îndeplinesc fiecare dintre cerințele pe care mi-am propus inițial să le îndeplinesc în cadrul secțiunii 5

37
a raportului și am învățat un nou limbaj de codare care mă va ajuta foarte mult post-universitar în sectorul
analizei datelor.

Din aceste motive, cred că am creat un model bun, funcțional, care îndeplinește scopurile și obiectivele pe
care mi le-am propus inițial și sunt mulțumit de munca mea.

38
10 concluzie
Acest raport și-a propus inițial să investigheze dacă există o legătură între cât de activă este o companie pe
social media, reputația online cu clienții și profiturile sale, prin analiza semantică și vizualizarea datelor
rezultatelor.

10.1 Constatări privind reputația

Vizualizările de date create evidențiază legătura potențială dintre cât de proactivă este o companie online și
reputația medie pe care o au față de clienții sau potențialii clienți.

Nr. total. De tweet-uri pe pagina de Twitter a companiei

Figura 16. Numărul total de tweet-uri trimise de pe pagina Twitter a companiei (Marea Britanie, dacă este posibil) și de pe pagina de
ajutor (dacă este cazul)

După cum se arată, numărul de tweet-uri trimise de fiecare companie variază drastic între cele șase companii
alese pentru studiu. În ordine de la cele mai multe la cele mai puține:
1) ASOS
2) Boohoo
3) Ghidat greșit
4) H&M
5) Zara
6) Urât Gal

39
Figura 17. Evaluarea semantică medie pe companie

Acest lucru se dezvoltă în comparație cu ratingul semantic mediu al fiecărei companii din Tweet-urile
colectate, în care:
1) Ghidat greșit
2) H&M
3) Zara
4) Boohoo
5) Urât Gal
6) ASOS

Prima comparație interesantă este compania care a trimis cele mai multe Tweet-uri cu aproape 800.000, adică
ASOS, are cel mai mic rating de valoare semantică, în timp ce H&M și Zara, care au trimis unele dintre cele
mai mici numere de Tweet-uri de pe conturile lor de Twitter corporative și au o prezență online mai mică, au
un rating semantic mai mare. La prima vedere, pare că există o corelație mică între cele două grafice
prezentate, totuși, atunci când datele sunt revizuite fără includerea uneia dintre companii, graficele au o
corelație clară între ele.

S-ar putea argumenta că interacțiunea cu clienții (adică Social CRM) pe Twitter inspiră clienții să se
gândească în mod conștient la marcă și, prin urmare, este mai probabil să dorească să cumpere acolo. Mai
multe branduri, de obicei cele destinate generațiilor tinere, vor încărca imagini amuzante, citate, chestionare
sau alte postări care încurajează comunicarea dintre ele și clienții lor.

Unul dintre aceste branduri, Missguided, postează imagini sau videoclipuri pe care cred că baza lor de
utilizatori le consideră "relatabile" în fiecare zi. Clienții reacționează apoi la aceste postări și le tratează la fel
cum ar face-o dacă un cont non-corporativ le-ar fi trimis și răspund la Tweet cu reacția lor sau etichetează un
prieten în el cu un comentariu. Postarea acestui tip de conținut inundă apoi feed-ul companiei cu clienții care
răspund, precum și eticheta "@Missguided".

Missguided Q @Missguided • 23 aprilie


Nimeni:

Nici măcar o singură persoană:

Eu beat:

Figura 18. Tweet ghidat greșit

40
21:30 paigelouisee2 ©Missguided Phil și grant / zac și Cody 7.00
Missgulde d
Missgulde
21:31 Anna_Jane_R ©Zac și Cody au fost ghidați greșit 7.00
d
Missgulde 10:43 Sianduff 7.50
©Atmosferă Missguided Slay 37 @callysmitherman
d
Ghid greșit 10:43 Moduri de diversitate ©@ericafmstyle Missguided Aceasta este minunata Erica. 7.50

Missgulde
11:00 Ghidat greșit Amintiri V https:/t.co/lw8kaemOs3 7.50
d
Missgulde 17:30 Ghidat greșit Mulțumesc tuturor celor care au intrat Felicitări acestor gagici ♦ 7.50
d
Ghidul
09:16 shazywaz2003 ©Misguided Slay prune t 800
greșit d
Ghidul
09:35 Charlieeeann ©@ClaireH202 Missguided dttso gata 9 8.00
greșit d
Ghidul
10:33 Kelli Enewton ©STRĂLUCIRE SNATCHED ghidată greșit 8.00
greșit d
Ghidul
greșit d
10:39 Ellistuesday
©@Corleelizabethx Missguided Există până la 50% reducere la tot astăzi: https://t.co/3qxGkGbpxJ v' 8.00

Missgulde 11:23 _TanyaCMakeup 8.00


Am fost fata Q 9 t htips7/t.c<yoPVBA8leVq
d
Ghidul
11:29 Doamna SandraB @Missguided_help Bună ziua întrebare de la un client francez, codul pe care mi l-ați trimis nu funcționează pe site 8.00
greșit d
Ghidul
13:39 Shelleyb_97 Îmi place cum Missguided au făcut publicitate acestei vânzări uriașe când într-adevăr au crescut prețurile inițiale, așa că într-adevăr plătim mai :)))) 8.00
greșit d
Ghidul
13:39 Shelleyb_97 Îmi place cum Missguided au făcut publicitate acestei vânzări uriașe când într-adevăr au crescut prețurile inițiale, așa că într-adevăr plătim mai :)))) 8 00
greșit d
Ghidul
13:42 HelenSmiddy Toate pielea de găină V http$://t.co/m4l1xZakkY 8.00
greșit d
Ghidul
13:42 HelenSmiddy Toate pielea de găină V https://t.co/m411xZakkY 8.00
greșit d
Ghidul
14:00 itslxurenjade Nu vă pot spune cât de entuziasmat este 1 dimineața pentru asta!!! Unul dintre filmele mele Disney preferate vreodată GWhttpsi/t .co/lpA4TGJrOK 8.00
greșit d
Ghidul
greșit d
14:00 itslxurenjade
GW https://t.co/lpA4TGJrOK 8.00

Ghidul
16:56 Theblckhipster Am nevoie de toate părțile acestei ©colecții Playboy x ©Missguided în viața mea cât mai curând posibil 8.00
greșit d
Ghidul
greșit d
Ghidul
17:45 Amygardnerr
©Missguided Ekkkkk fi uimitor v 8.00

greșit d
17:46 Beccccaaa_X ©Missguided ©leesamoconnor Sugar Angel și Lit Gem dt 8.00

Ghidul 18:40 odavii73 ©Missguided Zack și Cody din viața suitei • 8.00
greșit d

Figura 19. Extras din setul de date


Acest fragment dintr-o fracțiune din date demonstrează modul în care Missguided își inundă fluxul Twitter cu
un număr mare de oameni care pur și simplu au o conversație cu compania, spre deosebire de a pune întrebări
sau de a împărtăși opinii despre aceasta. Fiecare dintre aceste Tweet-uri are un rating de 7 sau mai mare
datorită limbajului pozitiv folosit în Tweet, în ciuda faptului că Tweet-ul nu are nimic de-a face cu compania
în sine.

Din acest motiv, dacă Missguided este negat din rezultate și vizualizările datelor, se dezvăluie un model mult
mai clar.

Nr. total. De tweet-uri pe pagina de Twitter a companiei

Figura 20. Ghidat greșit negat

Evaluarea semantică medie pe companie


Societatea N..

H&M m 6.174

Zara m 6.111

Boohoo n 5.948
Nasty Gal m 5.435

ASOS m 5.117

01234567

Avg. Evaluare semantică -

Figura 21. Ghidat greșit negat

41
Dacă Missguided este eliminat, uitându-ne la evaluările semantice versus activitatea companiei, se arată că, în
mod amuzant, cu cât o companie este mai activă pe social media, cu atât are o reputație online mai proastă de
la clienții lor. Companiile ASOS, Boohoo și Nasty Gal – toate bazate exclusiv online, au cele mai slabe trei
ratinguri medii semantice, în timp ce H&M și Zara, care au atât o prezență constantă online, cât și offline, în
ciuda mai puține Tweet-uri, au un rating general mai mare.

S-ar putea argumenta că acest lucru se datorează faptului că, cu cât o companie este mai activă pe social
media, cu atât mai multe comentarii tind să inspire, precum și ideea că oamenii sunt mai puțin susceptibili să
ofere feedback pozitiv despre o interacțiune sau un produs dacă este bun, dar este mai probabil să ofere
feedback negativ dacă este rău (Thomas, 2018). Acest lucru ar putea oferi o perspectivă asupra motivului
pentru care companiile online au cele mai proaste ratinguri și, prin urmare, s-ar putea spune că, cu cât o
companie are un impact mai mare asupra rețelelor sociale, cu atât ar putea avea o reputație mai proastă online.

10.2 Constatări privind rentabilitatea


Din cercetările efectuate cu privire la rentabilitatea fiecărei companii, dintre care majoritatea discută anul
fiscal recent încheiat, au fost descoperite și analizate o serie de statistici în comparație cu datele găsite în
secțiunea 10.1:
- Compania cu cel mai mare rating semantic, H&M, a anunțat că profiturile au scăzut pentru al șaptelea
trimestru consecutiv din decembrie 2018 până în februarie 2019, în scădere cu 1,5% față de anul
precedent (Irish Times, 2019).
- Al doilea mai înalt rating semantic, profiturile Zara înregistrate în ianuarie 2018 au crescut cu 30%,
cel

până la 40,86 milioane de lire sterline față de anul precedent (Companies House, 2018).
- , veniturile Boohoo au crescut cu 48%, iar profiturile au crescut cu 38%, până la 59,9 milioane de
În al 3-lea rând

lire sterline (Kinder, 2019).


- Locul
4, Nasty Gal, deținut de Boohoo, vânzările au crescut cu 96%, până la 47,9 milioane de lire sterline
(Kinder, 2019), veniturile fiind absorbite în Boohoo.
- și cel mai scăzut rating semantic, ASOS a raportat în perioada de 6 luni din 28 august 2018
Al 5-lea

până la 28 februarie 2019, profiturile au scăzut cu 87% față de anul precedent (BBC News, 2019)
- Missguided a suferit o pierdere înainte de impozitare de 46 de milioane de lire sterline din aprilie
2017 până în aprilie 2018, comparativ cu o pierdere de 1,6 milioane de lire sterline în anul precedent,
pe care au pus-o pe seama "investițiilor premature" (BBC News, 2019).

Încă o dată, există o corelație mică între cifrele prezentate. În ciuda acestui fapt, se poate spune că există o
ușoară asociere între cât de activă este o companie pe social media și veniturile aferente. Boohoo, al doilea cel
mai activ cont corporativ, a avut o creștere de aproape 50%, ASOS, în timp ce a scăzut cu 87% în profiturile
înainte de impozitare, a câștigat o creștere de 14% a vânzărilor de la an la an, iar cifra de afaceri a grupului
Missguide pentru acest an a crescut cu 4,9%, până la 215,91 milioane de lire sterline (Nazir, 2019).

Există ceva de spus cu privire la profitabilitatea piețelor online în secolul 21, care poate fi analizat prin
analizarea răspunsurilor lor din social media folosind sistemele sugerate în acest raport. Deși se pare că, cu cât
o companie este mai activă pe social media, cu atât este mai probabil să primească comentarii negative: acest
lucru nu ar trebui neapărat să fie văzut ca un lucru negativ, fiind mai activ și comunicând mai mult cu clienții
pare să crească vânzările.

42
11 Bibliografie
"Bliti". (2019, 4). Tweepy. Adus de la Tweepy: https://www.tweepy.org/
Adams-Mott, A. (2018, 6). Avantajele și dezavantajele marketingului social media. Adus 1 9, 2019, din Small Business Chronicles:
http://smallbusiness.chron.com/advantages-disadvantages- social-media-marketing-21890.html
Šilingas, D. și Butleris, R. (2015). Spre implementarea unui cadru pentru modelarea cerințelor software în MagicDraw UML.
Tehnologia informației și controlul, 38 alineatul (2).
Ajmera, J., Ahn, H.-i., Nagarajan, M., Verma, A. și antreprenor, D. (2013). Un sistem CRM pentru social media. WWW '13 Lucrările
celei de-a 22-a conferințe internaționale privind World Wide Web, 49-58.
Arnold, A. (2017, 10). Comoditate vs. experiență: Milenialii iubesc streamingul, dar nu sunt gata să renunțe
Cinema încă. Adus de la Forbes:
https://www.forbes.com/sites/andrewarnold/2017/10/26/millennials-love-streaming-but- nu-sunt-gata-să-arunce-cinema-
doar-încă/#2d11e7b56311
stirile BBC. (2019, 4). Profiturile ASOS scad cu 87% după un an dificil. Preluat de la BBC News:
https://www.bbc.co.uk/news/business-47877688
stirile BBC. (2019, 1). Lanțul de modă ghidat greșit vede pierderile crescând odată cu creșterea costurilor. Preluat de la BBC News:
https://www.bbc.co.uk/news/business-46783114
Ceas de marcă. (2019, 3 29). Cele mai populare emoji. Adus de la Brandwatch: https://www.brandwatch.com/blog/the-most-popular-
emojis/
Bullock, L. (2018, 11 27). Cele mai mari eșecuri ale rețelelor sociale din 2018. Adus de la Forbes:
https://www.forbes.com/sites/lilachbullock/2018/11/27/biggest-social-media-fails- 2018/#da9943518f8c
Pâine prăjită, C. (2017, 11, 15). Nu sunteți singurul, nimeni nu citește termenii acordurilor de serviciu. Adus de la Business Insider:
https://www.businessinsider.com/deloitte-study-91-percent-agree-terms-of-service- fără-citire-2017-11?r=US&IR=T
Castronovo, C. și Huang, L. (2012). Social Media într-un model alternativ de comunicare de marketing.
Jurnalul de dezvoltare a marketingului și competitivitate, 117-131.
Clarke, J. (2017, 11). Cumpărătorii din Marea Britanie vor cheltui mai mult de Crăciun în comparație cu anul trecut. Adus de la
Independent: https://www.independent.co.uk/news/business/news/uk-shopping-christmas- forecast-british-consumers-
brexit-a8031606.html
Coleman, A. (2003). Dicționarul Oxford de Psihologie. New York: Oxford University Press, p.77.
Casa Companiilor. (2018, 1). Raportul anual și situațiile financiare pentru exercițiul financiar încheiat la 31 ianuarie 201.
Adus de la Companies House: https://s3.eu-west-2.amazonaws.com/document-api-
images-live.ch.gov.uk/docs/sdOxhBqVYBtgmcjTTqR2-
Tm72MSHyljBSTk8S7U_Z9g/application-pdf? X-AMZ-Algorithm=AWS4-HMAC-
SHA256&X-AMZ-Content-Sha256=UNSIGNED-PAYLOAD&X-Amz-
Credential=ASIAWRGBDBV3LGD5ORE6%2F20190425%
Comutator CRM. (2013). O scurtă istorie a managementului relațiilor cu clienții. Adus de la CRM Switch:
https://www.crmswitch.com/crm-industry/crm-industry-history/
Ziua, T. (2013). Succes în scrierea academică. Palgrave.
Eadicicco, L. (2015, 12). Americanii își verifică telefoanele de 8 miliarde de ori pe zi. Adus din Time:
http://time.com/4147614/smartphone-usage-us-2015/
Edosomwan, S., Kalangot Prakasan, S., Kouame, D., Watson, J. și Seymour, T. (2011). Istoria social media și impactul acesteia
asupra afacerilor. Jurnalul de Management Aplicat și Antreprenoriat, 79-91.
Edwards, J. (2014, 08, 28). Twitter vă arată acum exact câți oameni vă văd tweet-urile - și este fascinant. Adus de la Business
Insider: https://www.businessinsider.com/twitter- analytics-dashboard-launched-2014-8?r=US&IR=T
Emojitracker. (2019, 4 3). Tracker Emoji. Adus de la Emoji Tracker: http://emojitracker.com
Fingas, J. (2018, 09 09). Comenzile rapide emoji Instagram vă ajută să comentați în timp record. Adus de la Engadget:
https://www.engadget.com/2018/09/09/instagram-emoji-
scurtături/?guccounter=1&guce_referrer_us=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce
_referrer_cs=LoLm0cHSgd1SMKMPFZcxtQ
Fortin, J. (2018, 1, 13). H&M închide magazinele din Africa de Sud pe fondul protestelor legate de tricoul "maimuță". Preluat din
The New York Times: https://www.nytimes.com/2018/01/13/world/africa/hm-south-africa- protest.html
Gates, B. (1999). Afaceri cu viteza gândului: utilizarea unui sistem nervos digital. Pinguin.
Google Trends. (2008). Tendința "Crăciunul John Lewis". Adus de la Google:
https://trends.google.com/trends/explore?geo=GB&q=John%20Lewis%20christmas

43
Gov.uk. (2018). Protecția datelor. Adus de la GOV.UK: https://www.gov.uk/data-protection
Huddy, G. (2017, 10, 19). Cum funcționează analiza textului pentru rețelele sociale. Adus din Crimson Hexagon:
https://www.crimsonhexagon.com/blog/how-text-analytics-works-for-social-media/
Iliashov, A. (2015). Iată cum brandurile de lux fac social media foarte greșit (și puținii care sparg tiparul). Adus de la
https://www.refinery29.com/en-us/2015/10/95018/luxury-fashion- brands-social-media
Irish Times. (2019, 3). Adus de la https://www.irishtimes.com/business/retail-and-services/h-m- profit-scade-mai putin decat se
astepta-dupa-la-reduceri-1.3842804
Joseph, S. (2017). Modul în care Nike utilizează canalele digitale pentru a stimula vânzările. Adus de la Digiday UK:
https://digiday.com/marketing/nike-using-digital-channels-drive-sales/
Kinder, T. (2019, 4, 25). Instagram îl ajută pe Boohoo să obțină o creștere a vânzărilor. Adus din The Times:
https://www.thetimes.co.uk/article/instagram-set-helps-boohoo-to-snap-up-a-sales-increase- 5ffdssrbh
Lim, K. H. (2018, 04). Emoji-uri pozitive și negative utilizate pentru analiza sentimentelor. Adus din
ResearchGate: https://www.researchgate.net/figure/Positive-and-negative-emojis-used-for-the- sentiment-
analysis_fig3_324639092
Săptămâna de marketing. (2018, 9 13). Cum a schimbat o campanie Facebook abordarea M&M față de reclamele pe mobil.
Preluat din Marketing Week: https://www.marketingweek.com/2018/09/13/facebook- mms-mobile-ads/
McIntyre, H. (2016, 7). Milenialii nu mai sunt foarte interesați de radioul tradițional. Adus de la Forbes:
https://www.forbes.com/sites/hughmcintyre/2016/07/12/millennials-nu-sunt-foarte-interesați-de-radioul-tradițional-orice-
mai/#b7e7bf37c4e4
Nazir, S. (2019, 1). Missguided raportează pierderi de 46,7 milioane de lire sterline. Preluat din Retail Gazette:
https://www.retailgazette.co.uk/blog/2019/01/missguided-reports-46-7m-loss/
Novak, P. K., Smailovic, J., Sluban, B. și Mozetic, I. (2015). Sentimentul emoji-urilor. Plos Unu.
O'flynn, R. (2017, 7, 17). Modul în care cookie-ul social se prăbușește: geniul marketingului social media al Oreo.
Adus din 201digital: https://www.201digital.co.uk/way-social-cookie-crumbles-genius- oreos-social-media-marketing-can-
learn/
Pak, A. și Paroubek, P. (2010). Twitter ca un corpus pentru analiza sentimentelor și extragerea opiniilor. LREc, 1320-1326.
Portocarrero, J. M., Delicato, F. C., Pires, P. F., Gámez, N., Fuentes, L., Ludovino, D. și Ferreira, P. (2014). Rețele autonome de
senzori fără fir: o revizuire sistematică a literaturii de specialitate. Jurnalul senzorilor.
Bănuț roșu fierbinte. (2018, 16 august). Social Scorecard - Modă și accesorii 2018. Adus noiembrie
8, 2018, din https://www.redhotpenny.com/social-scorecard-fashion-accessories- 2018/#wpcf7-F4557-P4549-O1
Ritvikmath. (2018, 6 18). Răzuirea datelor. Adus de pe github:
https://github.com/ritvikmath/ScrapingData/blob/master/Scraping%20Twitter%20Data.ipyn b
Roberts, M. (2018, 6, 12). Cel mai bun lanț de restaurante Twitter reacții la IHOP schimbându-și numele în "IHOb".
Adus de la People: https://people.com/food/ihop-name-change-ihob-twitter-reactions/
Roth, Y. (2018, 7). Noi cerințe pentru dezvoltatori pentru a ne proteja platforma. Adus de pe Twitter:
https://blog.twitter.com/developer/en_us/topics/tools/2018/new-developer-requirements-to- protejați-ne-platforma.html
Rouse, M. (2017, 9). Definiție: CRM social. Adus de la WhatIs.com:
https://searchcrm.techtarget.com/definition/social-CRM
Rudestam, K. E. și Newton, R. R. (2007). Supraviețuirea disertației dvs.: un ghid cuprinzător pentru conținut și
Procesul (ed. a 3-a). SALVIE.
Thiagarajan, S. (2018, 11). Facebook, Instagram sau Twitter? Strategia de social media pe care ar trebui să o urmați. Adus din
Economic Times: https://economictimes.indiatimes.com/small-biz/marketing- branding/marketing/facebook-instagram-or-
twitter-social-media-strategy-that-you-should- follow/articleshow/66471776.cms
Thomas, A. (2018, 2). Raportul secret care dovedește de ce recenziile clienților sunt atât de importante. Adus de la Inc.:
https://www.inc.com/andrew-thomas/the-hidden-ratio-that-could-make-or-break-your- companie.html
Tobin, B. (2018, 7, 10). IHOP își schimbă numele înapoi din IHOB. Adus de la USA Today:
https://eu.usatoday.com/story/money/2018/07/09/ihop-changes-name-back- ihob/769310002/
Y, E. (2019, 01 30). 5 lucruri pe care trebuie să le știți înainte de a extrage date de pe Facebook. Adus din Octoparse:
https://www.octoparse.com/blog/5-things-you-need-to-know-before-scraping- data-from-facebook
YPulse. (2018, 6). CELE 10 BRANDURI ÎN CARE GENERAȚIA Z ȘI MILENIALII AU CEA MAI MARE ÎNCREDERE. Adus din
YPULSE: https://www.ypulse.com/post/view/the-10-brands-gen-z-millennials-trust-most

44
12 Apendice

12.1 Apendicele A: Cifre

Figura 1.
YPulse. (2018, 6). CELE 10 BRANDURI ÎN CARE GENERAȚIA Z ȘI MILENIALII AU CEA MAI
MARE ÎNCREDERE. Adus din
YPULSE: https://www.ypulse.com/post/view/the-10-brands-gen-z-millennials-trust-most

Figura 2.
Google Trends (2019) GOOGLE TRENDS SOCIAL CRM. Preluat din Google Trends:
https://trends.google.com/trends/explore?date=all&q=Social%20CRM

Figura 3 și 4.
Twitter (2019) Cont Twitter Marks &; Spencer. Adus de pe Twitter:
https://twitter.com/marksandspencer/with_replies
Figure 5.
Smith, M (2018) Cât de bun este "bun"? Adus de la YouGov:
https://yougov.co.uk/topics/lifestyle/articles-reports/2018/10/02/how-good-good

Figure 6.
Twitter Analytics (2018) Cum se utilizează Twitter Analytics. Adus de la Business Twitter:
https://business.twitter.com/en/analytics.html

Figure 7.
Hootsuite (2018) Instrumente de analiză a sentimentelor pentru specialiștii în marketing social media. Adus
de la Blog.Hootsuite:
https://blog.hootsuite.com/social-media-sentiment-analysis-tools/

Figure 8.
Lexalytics (2018) Semantria pentru Excel. Adus din Lexalytics:
https://www.lexalytics.com/semantria/excel
Figure 9.
Draw.io (2019) Diagramă creată de dezvoltator. Dezvoltat și descărcat de la Draw.io: draw.io

Figure 10.
Twitter Developer (2019) Detaliile aplicației. Adus de pe Twitter:
https://developer.twitter.com/en/apps/16124184

Figure 11.
Twitter Developer (2019) Chei și jetoane. Adus de pe Twitter:
https://developer.twitter.com/en/apps/16124184

Figure 12.
"Date -0 evaluări.xlsx"

Figure 13.
"Date -0 evaluări.xlsx"

Figure 14.
"Date -0 evaluări.xlsx"

Figure 15.

45
Tableau, "Data Visualisations.twb"

Figure 16.
Tableau, "Data Visualisations.twb"

Figure 17.
Tableau, "Data Visualisations.twb"

Figure 18.
Contul Twitter Missguided (aprilie, 2019) Twitter. Adus de pe Twitter:
https://twitter.com/Missguided/status/1120779470191955970

Figure 19.
"Date -0 evaluări.xlsx"

Figure 20.
Tableau, "Data Visualisations.twb"

Figure 21.
Tableau, "Data Visualisations.twb"

12.2 Anexa B: Raport contextual

"Scopuri și obiective

Pentru a investiga acest lucru, proiectul va colecta date de la trei dintre cele mai populare rețele sociale
(Twitter, Facebook și Instagram) pentru mai multe companii de retail și va indexa rezultatele în funcție de cât
de pozitive / negative sunt cuvintele / expresia. Aceste informații vor fi apoi afișate printr-un software de
vizualizare a datelor și comparate cu profiturile anuale pentru fiecare dintre întreprinderi pentru a determina
dacă există o legătură între cât de activă este o companie pe Social Media și valoarea profiturilor pe care le
realizează pe an.

[n] = zile

1.1 Raport de cercetare


1.1.1 Scrieți un raport contextual cu privire la proiect, care va descrie o schiță a ceea ce proiectul
speră să creeze și cronologia modului în care urmează să fie creat, pentru a permite o mai bună înțelegere.
1.1.2 Introducere scriere [2.0]
1.1.3 Scrieți o recenzie a literaturii [6.0]
1.1.4 Scriere cercetare produs [10.0]
1.1.5 Scrieți planul pentru termenul 2 [6.0]

1.2 Documentație de proiectare


1.2.1 Scrieți o documentație de proiectare pentru a furniza informații despre proiectul proiectat și
procesul utilizat.
1.2.2 Specificație cerințe de scriere [4.0]
1.2.3 Descrieți soluția curentă, precum și soluția propusă [2.0]
1.2.4 Crearea designului de date [2.0]
1.2.5 Crearea designului arhitectural [3.0]
1.2.6 Crearea designului interfeței [5.0]
1.2.7 Crearea designului procedural [3.0]

1.3 Implementarea
1.3.1 Colectați și stocați date de pe rețelele sociale
1.3.1.1 Datele din diverse rețele sociale vor fi extrase de pe site-uri folosind scripturi

46
Python. Acest lucru va permite analizarea lor ulterioară.
1.3.1.2 Răzuiți date de pe Twitter. [10.0]
1.3.1.3 Răzuiți date de pe Instagram. [10.0]
1.3.1.4 Extrageți date de pe Facebook. [10.0]
1.3.2 Colectați și stocați referințe de indexare.
1.3.2.1 Stocați diverse cuvinte și fraze într-un document și indexați-le în funcție de cât de
pozitive sau negative apar cuvintele printr-o combinație de cercetare (80%) și presupuneri personale bazate pe
relevanța vârstei dezvoltatorului (20%).
1.3.2.2 Cercetați și adunați cuvinte și fraze pentru un raport de pozitivitate.
[5.0]
1.3.2.3 Introduceți-le într-un document și stabiliți rapoartele pentru fiecare
intrare de date. [5.0]
1.3.3 Crearea unei reprezentări vizuale a datelor
1.3.3.1 Folosind un sistem de tablou de bord, cum ar fi Tableau, creați o vizualizare fizică a
rezultatelor cercetării pentru a le arăta clientului.
1.3.3.2 Importați date în sistemul tabloului de bord. [1.0]
1.3.3.3 Afișați datele din sistem utilizând diverse diagrame și grafice pentru a facilita
vizualizarea de către Client. [10.0]

1.4 Raport de evaluare


1.4.1 Scrieți un raport de evaluare a proiectului pentru a evalua rezultatele pozitive și negative,
precum și pentru a stabili dacă investigația inițială a fost un succes.
1.4.2 Scrieți rezumatul executiv. [1.0]
1.4.3 Scrieți introducere în proiect. [2.0]
1.4.4 Scrieți scopul și obiectivele evaluării. [5.0]
1.4.5 Scrieți o evaluare a metodologiei. [4.0]
1.4.6 Evaluarea rezultatelor proiectului [10.0]
1.4.7 Evaluarea domeniilor de îmbunătățire [2.0]
1.4.8 Scrieți concluzii și recomandări pentru afacere [3.0]"

12.3 Anexa C: Codul notebook-ului Python Jupyter


Importați Tweepy
access_token = '312899257-
ZjXYlHt8PQSXuUrNc2HunsANmP7eUi9Htt7crV1T'
access_token_secret =
"Otko0azkxW46bAki1ph1OPOWX4NhII7yi3ng41e5HGNdR"
consumer_key = 'iXsoJx26WfBePQscEMPMCaabg' consumer_secret =
"fK0TWiME7CSRSV8CaoOIyUXwQ3VlRlP4NsAHcx2OCU86HyWm6B"
# Crearea obiectului de autentificare
Auth = Tweepy. OAuthHandler(consumer_key, consumer_secret)
# Setarea tokenului de acces și a secretului
auth.set_access_token(access_token, access_token_secret)
# Crearea obiectului API în timp ce treceți în auth information api
= tweepy. API(auth)
# Utilizarea obiectului API pentru a obține tweet-uri din
cronologia dvs. și stocarea acestuia într-o variabilă numită
public_tweets public_tweets = api.home_timeline()
# pentru fiecare prin toate tweet-urile trase
Pentru tweet în public_tweets:
# imprimarea textului stocat în interiorul obiectului tweet
imprimare(tweet.user.screen_name)
imprimare (tweet.text)
imprimare (tweet.user.location)
imprimare()

47
# Crearea obiectului API în timp ce treceți în auth information api
= tweepy. API(auth)
# termenul de căutare pe care doriți să îl găsiți
interogare = "Universitatea din Greenwich"
# Codul limbii (respectă standardele ISO 639-1) language = "en"
# Apelarea funcției user_timeline cu parametrii noștri rezultate =
api.search(q = interogare, lang = limbă, număr = 100)
# pentru fiecare prin toate tweet-urile trase
Pentru Tweet în rezultate:
dacă (nu tweet.retweeted) și ("RT @" nu este în tweet.text):
# imprimarea textului stocat în interiorul obiectului tweet
print(tweet.user.screen_name,"Tweeted:",tweet.text)
print()
Importul CSV
# Crearea obiectului API în timp ce treceți în auth information api
= tweepy. API(auth)
# Deschideți/creați un fișier pentru a adăuga date
csvFile = deschis('asos3.csv', 'a')
#Use csv Writer csvWriter = csv.writer(csvFile)
# Apelarea funcției user_timeline cu parametrii noștri rezultate =
api.search(q=query, lang=language, count=500)
Pentru Tweet în rezultate:
dacă (nu tweet.retweeted) și ("RT @" nu este în tweet.text):
#Write un rând la fișierul csv / folosesc encode utf-8
csvWriter.writerow([tweet.created_at,
tweet.user.screen_name, tweet.text])

csvFile.close()

12.4 Anexa D: Codul analizei semantice


Importul CSV
# Crearea obiectului API în timp ce treceți în auth information api
= tweepy. API(auth)
# Deschideți/creați un fișier pentru a adăuga date
csvFile = open('zara 10th april 23 00.csv', 'a')
# Utilizarea CSV Writer
csvWriter = csv.writer(csvFile)
# Apelarea funcției user_timeline cu parametrii noștri
rezultate = api.search(q=query, lang=language, count=100)
evaluare = 0
contor = 0
finalEvaluare = 0

48
Pentru Tweet în rezultate:
dacă (nu tweet.retweeted) și ("RT @" nu este în tweet.text):
#Write unui rând în fișierul CSV
dacă este "abisal" în tweet.text sau "îngrozitor"
în tweet.text sau "îngrozitor" în tweet.text sau "îngrozitor" în
tweet.text sau "teribil" în tweet.text sau "foarte rău" în
tweet.text sau "foarte rău" în tweet.text sau "foarte rău" în
tweet.text sau " 3 " în tweet.text sau "6)" în tweet.text sau
în tweet.text sau "cel mai rău" în tweet.text sau "indignat"
în tweet.text sau "dezgustat" în tweet.text sau "ură" în
tweet.text: rating = rating + 1
contor += 1
dacă "gunoi" în tweet.text sau "nesatisfăcător" în
tweet.text sau "rău" în tweet.text sau "slab" în tweet.text sau "6"
în tweet.text sau "2" în tweet.text sau ":(" în tweet.text sau "):"
în tweet.text sau "• " în tweet.text sau "enervare" în tweet.text
sau

"piss" în tweet.text sau "greșit" în tweet.text sau "ridicol" în


tweet.text sau "sucks" în tweet.text sau "așteptând" în tweet.text:
evaluare = evaluare + 2 contor += 1
dacă "destul de rău" în tweet.text sau "destul de
rău" în tweet.text sau "oarecum rău" în tweet.text sau "sub medie"
în tweet.text sau "W" în tweet.text sau "63" în tweet.text sau "3"
în tweet.text sau "3" în tweet.text sau "întârziere" în tweet.text
sau "întârziat" în tweet.text sau "întârziat" în tweet.text sau
"ridicol" © în tweet.text:
evaluare = evaluare + 3 contor += 1
dacă este "mediocru" în tweet.text sau în
tweet.text sau "SP" în tweet.text sau "G" în tweet.text sau "0" în
tweet.text sau "$" în tweet.text sau "nu este șocat" în tweet.text
sau "nu este șocat" în tweet.text sau " " în tweet.text:
evaluare = evaluare + 4 contor += 1
dacă "mediu" în tweet.text sau "nu este rău" în
tweet.text sau "corect" în tweet.text sau "bine" în tweet.text sau
"ok" în tweet.text sau "bine" în tweet.text sau "satisfăcător" în
tweet.text sau "bine" în tweet.text sau "oarecum bun" în tweet.text
sau "oarecum bun" în tweet.text sau ‘6’ în tweet.text sau 't
' în tweet.text sau '(' în
tweet.text sau ‘6’ în tweet.text sau "60 " în tweet.text sau "S"
în
tweet.text sau în tweet.text sau "OMG" în tweet.text sau "dar"
în
tweet.text sau "rambursare" în tweet.text:
evaluare = evaluare + 5 contor += 1
dacă "destul de bun" în tweet.text sau "decent" în
tweet.text sau "peste medie" în tweet.text sau "destul de bun" în
tweet.text sau "bun" în tweet.text sau "6" în tweet.text sau "L" în
tweet.text sau în tweet.text sau "5" în tweet.text sau "U" în
tweet.text sau "like" în tweet.text:
evaluare = evaluare + 6 contor += 1
dacă este "grozav" în tweet.text sau "gr8" în
tweet.text sau "foarte bun" în tweet.text sau "foarte bun" în

49
tweet.text sau "foarte bun" în tweet.text sau "v bun" în tweet.text
sau " 9" în tweet.text sau‘6’ în tweet.textsau "C9" în tweet.text
sau "O" întweet.text
sau "de" în tweet.text sau ‘5’ întweet.text sau "W
în tweet.text
sau ":)" în tweet.text sau "(:" în tweet.text sau "*" în tweet.text
sau ‘%‘ în tweet.text sau ‘6’ întweet.text sau
‘%‘ în tweet.text
sau ‘0‘ în tweet.text sau "G" în tweet.text:
evaluare = evaluare + 7 contor += 1
<7X UNIVERSITATEA DIN 49 GREENWICH 1
Cuprins 3
1 Secțiunea 1: Introducere 5
2 Secțiunea 2: Analiza literaturii de specialitate 6
Cât de bun este "bun"? Acum cu și mai multe cuvinte! 12
YouGov 13
3 Secțiunea 3: Cercetare de produs 15
3.4 Model de notare ponderat 18
4 Secțiunea 4: Aspecte și considerații juridice, sociale, etice și profesionale 19
5 Secțiunea 5: Cerințe și metodologie 20
5.5 Metodologie 21
5.6 Justificarea caracterului adecvat al unei metodologii sau al unui cadru urmat 23
6 Design 23
6.1 Diagrama cazului de utilizare UML 23
7 Procesul de dezvoltare 25
7.1 Etapa 1: Preluarea inițială a codului Python 25
7.2 Etapa 2: Implementarea analizei semantice 29
7.2.1 Iterația 1 29
7.2.2 Iterația 2 29
7.2.3 Iterația 3 29
7.3 Etapa 3: Colaționarea datelor în Excel 30
7.4 Etapa 4: Crearea vizualizărilor de date 31
7.5 Cutie de timp 34
7.6 Posibile abordări alternative 34
8 Testare 35
9 Evaluare 36
9.1 Evaluarea produsului 36
9.2 Autoevaluare 37
10 concluzie 39
10.1 Constatări privind reputația 39
10.2 Constatări privind rentabilitatea 42

50
11 Bibliografie 43
12 Apendice 45
12.1 Apendicele A: Cifre 45
12.2 Anexa B: Raport contextual 46
12.3 Anexa C: Codul notebook-ului Python Jupyter 47
12.4 Anexa D: Codul analizei semantice 48
12.5 Anexa E: Formule de calcul tabelar Excel 51
12.6 Apendicele F: Vizualizări de date Tableau 53
:o 54
12.7 Apendicele G: Încercări 57

evaluare = evaluare + 8 contor += 1


dacă este "superb" în tweet.text sau "genial" în
tweet.text sau "incredibil" în tweet.text sau "excelent" în
tweet.text sau "remarcabil" în tweet.text sau în tweet.text sau
în tweet.text sau "O" în tweet.text sau "1" în tweet.text sau
"love " în tweet.text:
evaluare = evaluare + 9
contor += 1
Dacă este "perfect" în tweet.text: rating =
evaluare + 10 contor += 1
dacă contor == 0: evaluare = 0 altfel:
finalRating = evaluare/contor
csvWriter.writerow([interogare, tweet.created_at,
tweet.user.screen_name, tweet.text, finalRating])
evaluare = 0 contor = 0 finalEvaluare = 0
csvFile.close()

12.5 Anexa E: Formule de calcul tabelar Excel

G H Eu J

NUMELE COMPANIEI NU. DE TWEET-URI SUMA TWEET-URILOR MEDIE

ASOS =COUNTIF(A1:A485;"ASOS") =SUMIF(A1:A485;"ASOS";E1:E485) =I2/H2

BOOHOO =COUNTIF(A1:A485;"Boohoo") =SUMIF(A1:A485;"Boohoo";E1:E485) =I3/H3

H&M =COUNTIF(A1:A485;"H&M") =SUMIF(A1:A485;"H&M";E1:E485) =I4/H4

GHIDAT GREȘIT =COUNTIF(A1:A485;"Ghidat greșit") =SUMIF(A1:A485;"Ghidat greșit";E1:E485) =I5/H5

NASTY GAL =COUNTIF(A1:A485;"Gal urât") =SUMIF(Al:A485;"Gal urât";El:E485) =I6/H6

ZARA =COUNTIF(Al:A485;"Zara") =SUM IF (A 1:A485;"Zara";E 1:E485) =17/H7

51
NUMELE COMPANIEI NQ. QF5EMANTJC Tiff£EIS£I EȘANTION

ASOS =COUNTIF(A1:A485;"ASOS")

BOOHOO =COUNTIF(Al:A484;"Boohoo")

H&M =COUNTIF(A1:A485;"H&M")

GHIDAT GREȘIT =COUNTIF(Al:A484;"Ghidat greșit")

NASTY GAL =COUNTIF(Al:A485;"Urât Gal")

ZARA =COUNTIF(Al:A485;"Zara")

Total: =SUM(P2:P7)

R S

ORĂ TWEETS PE ORĂ

0.0416666666666667 =COUNTIFS(B2:B485;">=01:00";B2:B485;"<02:00")

0.0833333333333333 =COUNTIFS(B2:B485;">=02:00";B2:B485;"<03:00")

0.125 =COUNTIFS(B2:B485;">=03:00";B2:B485;"<04:00")

0.166666666666667 =COUNTIFS(B2:B485;">=04:00";B2:B485;"<05:00")

0.208333333333333 =COUNTIFS(B2:B485;">=05:00";B2:B485;"<06:00")

0.25 =COUNTIFS(B2:B485;">=06:00";B2:B485;"<07:00")

0.291666666666667 =COUNTIFS(B2:B485;">=07:00";B2:B485;"<08:00")

0.333333333333333 =COUNTIFS(B2:B485;">=08:00";B2:B485;"<09:00")

0.375 =COUNTIFS(B2:B485;">=09:00";B2:B485;"<10:00")

0.416666666666667 =COUNTIFS(B2:B485;">=10:00";B2:B485;"<11:OO")

0.458333333333333 =COUNTIFS(B2:B485;">=11:00";B2:B485;"<12:00")

0.5 =COUNTIFS(B2:B485;">=12:00";B2:B485;"<13:00")

0.541666666666667 =COUNTIFS(B2:B485;">=13:00";B2:B485;"<14:00")

0.583333333333333 =COUNTIFS(B2:B485;">= 14:00";B2:B485;"<15:00")

0.625 =COUNTIFS(B2:B485, ">=15:00";B2:B485;"<16:00")

0.666666666666667 =C0UNTIFS(B2:B485;">=16:00";B2:B485;"<17:00")

0.708333333333333 =COUNTIFS(B2:B485;">=17:00";B2:B485;"<18:00")

0.75 =COUNTIFS(B2:B485;">=18:00";B2:B485;"<19:00")

0.791666666666667 =COUNTIFS(B2:B485;">=19:00";B2:B485;"<20:00")

0.833333333333333 =COUNTIFS(B2:B485;">=20:00";B2:B485;"<21:00")

0.875 =COUNTIFS(B2:B485, ">=21:00";B2:B485;"<22:00")

0.916666666666667 =COUNTIFS(B2:B485;">=22:OO";B2:B485;"<23:OO")

0.958333333333333 =COUNTIFS(B2:B485;">=23:00";B2:B485;"<=23:59")

0 =COUNTIFS(B2:B485;">=00:00";B2:B485;"<01:00")

52
Număr ASOS

1 =COU NTI FS(A1:A485;"ASOS", El: E485;1)

2 =COUNTIFS(A1:A485;"ASOS";E1:E485;2)

3 =COUNTIFS(Al:A485;"ASOS"/El:E485;">=3",El:E485 /'<=3.9")

4 =COUNTIFS(A1:A485;"ASOS"/E1:E485/">=4";E1:E485,"<=4.9")

5 =COUNTIFS(A1:A485;"ASOS",E1:E485,">=5"/E1:E485,"<=5.9")

6 =COUNTIFS(Al:A485;"ASOS",El:E485/">=6"/El:E485,"<=6.9")

7 =COUNTIFS(A1:A485;"ASOS"/E1:E485;">=7";E1:E485,"<=7.9")

8 =COUNTIFS(A1:A485;"ASOS";E1:E485,">=8";E1:E485,"<=8.9")

9 =COUNTIFS(A1:A485;"ASOS";E1:E485,">=9";E1:E485,"<=9.9")

10 =COUNTIFS(A1:A485;"ASOS"/E1:E485;10)

12.6 Apendicele F: Vizualizări de date Tableau

53
Filtre Nume companie implicit
Evaluarea semantică medie pe ■ ASOS
companie
Societatea N.. ■ Boohoo
■ H&M
H&M Zara 6.232
■ Ghidat greșit
Mărci ghidat greșit
m 6.174 m 6.111 ■ Urât Gal
000 Automat- Boohoo
5.948 ■ Zara

:o
Culoare Etichetă de mărime
Urât Gal ASOS
I 5.435
5.117

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5
Amănunt Sfat ecran
Avg. Evaluare semantică =

Compania Nam..
AVG(Semantic..

54
55
Pagini Coloane lii Numele companiei
fo..
:= r MEDIAN(Nr. total. De..
Rânduri

Filtre Numele companiei pentru


Nr. total. De tweet-uri pe pagina de Twitter a tot...
Numele companiei ■ ASOS
pentru T.. companiei ■ BOOHOO
■ H&M
Mărci
1400K ■ GHIDAT GREȘIT
■ NASTY GAL
Oo0 Automat
■ ZARA

1200K

Q
Sfat
ecran

Compania Nam.. 1O00K


L
2

80OK

600K

400K

ZOOK

ASOS BOOHOO MISSGUI.. H&M ZARA NASTY


GAL

Statistici de bază privind datele


colectate
Nr. total. De tweet-uri pe pagina de Twitter a Raportul dintre tweet-urile semantice pe
companiei Numele companiei pentru numărul total de
companie
tweet-uri

1000K

CARTE
36
ZARA
128
72 GAL
ASOS
NASTY

ASOS BOOHOO GHIDAT GREȘIT H&M ZARA NASTY GAL

Tweets pe oră

97 GHIDAT
GREȘIT
103

2324 67g
BOOHOO

48
I //>9
1
H&M

//10

Analiza semantică a
statisticilor

56
Analiza datelor colectate

12.7 Apendicele G: Încercări

Testa Vizualizare Testul efectuat Rezultatul așteptat Rezultatul real Admis/


Număr Respin
s?
1 Cloud de cuvinte Asigurați-vă că Cuvântul "drăguț" ar Cuvântul "drăguț" apare Trece
datele sunt afișate trebui să apară de 8 ori de 8 ori, 10 dacă
corect dacă este introdus în includeți Tweet-uri
foaia de calcul Excel duplicate, pe care
Tableau le neagă atunci
când importă datele
2 Cloud de cuvinte Faceți clic pe un Rezultatul așteptat Trece
cuvânt Cuvântul ar trebui să
apară evidențiat de câte
ori apare, restul
cuvintelor sunt gri
3 Cloud de cuvinte Selectarea mai Rezultatul așteptat Trece
multor cuvinte
Cuvintele ar trebui să
apară evidențiate de câte
ori apar, restul cuvintelor
fiind gri

57
4 Cloud de cuvinte Asigurarea trecerii Rezultatul așteptat Trece
cu mouse-ul peste Trecerea mouse-ului
lucrări de peste cuvânt arată de câte
caracteristici ori este menționat în
setul de date
5 Evaluarea Asigurați-vă că Verificați dacă Rezultatul așteptat Trece
semantică medie datele sunt afișate rezultatele se corelează
corect cu "Tabelul mediilor" din
foaia de calcul
6 Evaluarea Faceți clic pe o bară Rezultatul așteptat Trece
semantică medie Bara ar trebui să apară
evidențiată, în timp ce
restul graficului este gri
7 Evaluarea Selectarea mai Rezultatul așteptat Trece
semantică medie multor bare Barele trebuie să apară
evidențiate, în timp ce
restul graficului este gri
8 Evaluarea Asigurarea trecerii Trecerea mouse-ului Rezultatul așteptat Trece
semantică medie cu mouse-ul peste peste o bară arată
lucrări de evaluarea semantică
caracteristici medie pentru compania
9 Tweets pe oră Asigurați-vă că Verificați ora 11am Sortarea și filtrarea foilor Eșua
Diagramă datele sunt afișate pentru a vedea dacă foaia de calcul oferă 39
circulară corect de calcul oferă și un
10 Tweets pe oră Asigurați-vă că rezultat deora
Verificați 38 11am Rezultatul așteptat Trece
Diagramă datele sunt afișate pentru a vedea dacă foaia
circulară corect (v2) de calcul oferă și un
11 Tweets pe oră Dați clic pe un Segmentul ar trebui să Rezultatul așteptat Trece
Diagramă segment apară evidențiat, în timp
circulară ce restul diagramei
radiale este estompat
12 Tweets pe oră Selectarea mai Segmentele ar trebui să Rezultatul așteptat Trece
Diagramă multor segmente apară evidențiate, în timp
circulară ce restul diagramei
radiale este estompat
13 Tweets pe oră Asigurarea trecerii Rezultatul așteptat Trece
Diagramă cu mouse-ul peste Trecerea mouse-ului
circulară lucrări de peste un segment arată
caracteristici numărul de Tweets
corespunzător acelei ore
14 Tweet-uri Asigurați-vă că Verificați dacă "ASOS" Rezultatul așteptat Trece
semantice pe datele sunt afișate sub filtru în foaia de
companie corect calcul Excel este egal cu
15 Tweet-uri Dați clic pe un Segmentul ar trebui să Rezultatul așteptat Trece
semantice pe segment apară evidențiat, în timp
companie ce restul diagramei
radiale este estompat
16 Tweet-uri Selectarea mai Segmentele ar trebui să Rezultatul așteptat Trece
semantice pe multor segmente apară evidențiate, în timp
companie ce restul diagramei
radiale este estompat
17 Tweet-uri Asigurarea trecerii Trecerea mouse-ului Rezultatul așteptat Trece
semantice pe cu mouse-ul peste peste un segment arată
companie lucrări de numărul de Tweet-uri
caracteristici pentru acea companie din
setul de date

58
18 Tweets pe Asigurați-vă că Verificați dacă există 5 Rezultatul așteptat Trece
evaluare pe datele sunt afișate tweets pentru
companie corect Missguided cu un rating
între 3-3.9
19 Tweets pe Faceți clic pe o bară Rezultatul așteptat Trece
evaluare pe Bara ar trebui să apară
companie evidențiată, în timp ce
restul graficului este gri
20 Tweets pe Selectarea mai Rezultatul așteptat Trece
evaluare pe multor bare Barele trebuie să apară
companie evidențiate, în timp ce
restul graficului este gri
21 Tweets pe Asigurarea trecerii Trecerea mouse-ului Rezultatul așteptat Trece
evaluare pe cu mouse-ul peste peste o bară arată
companie lucrări de numărul de Tweets
caracteristici pentru acea evaluare și
22 Numărul total de Faceți clic pe o bară Rezultatul așteptat Trece
tweet-uri pe Bara ar trebui să apară
pagina Twitter a evidențiată, în timp ce
companiei restul graficului este gri
23 Numărul total de Selectarea mai Rezultatul așteptat Trece
tweet-uri pe multor bare Barele trebuie să apară
pagina Twitter a evidențiate, în timp ce
companiei restul graficului este gri
24 Numărul total de Asigurarea trecerii Trecerea mouse-ului Rezultatul așteptat Trece
tweet-uri pe cu mouse-ul peste peste o bară arată
pagina Twitter a lucrări de numărul de tweet-uri
companiei caracteristici pentru paginile Twitter
ale companiei respective
25 Tabloul de bord Intrarea în modul Rezultatul așteptat Trece
pentru colectarea Asigurați-vă că Prezentare și apăsarea
statisticilor legarea butonului la butonului ar trebui să
Analiza statisticilor transfere utilizatorul în
funcționează în tabloul de bord Analiza
modul de prezentare statisticilor
26 Analiza tabloului Asigurați-vă că Intrarea în modul Rezultatul așteptat Trece
de bord al legarea butonului la Prezentare și butonul de
statisticilor Colectarea clic ar trebui să transfere
statisticilor utilizatorul în tabloul de
funcționează în bord Colectarea
modul Prezentare statisticilor
27 Tabloul de bord Asigura conectarea Daca apasati butonul in Rezultatul așteptat Trece
pentru colectarea butonului la timp ce va aflati pe
statisticilor lucrarile de Analiza Tableau, versiunea
Statisticii pe publica a registrului de
Tableau Public lucru ar trebui sa
transfere utilizatorul in
28 Analiza tabloului Asigurati-va ca Dacă faceți clic pe Rezultatul așteptat Trece
de bord al butonul de legare la butonul în timp ce vă
statisticilor Colectarea aflați pe Tableau,
statisticilor versiunea publică a
functioneaza pe registrului de lucru ar
Tableau Public trebui să transfere
utilizatorul în tabloul de

59

S-ar putea să vă placă și