Sunteți pe pagina 1din 7

ACADEMIA DE STUDII ECONOMICE DIN MOLDOVA

Facultatea Tehnologii Informaționale și Statistică Economică

Disciplina TPI

Tema : motorul de căutare Google! (Algoritm)

Student:

Tacic Vasile
Grupa: TI-181

Chişinău 2020
Cum funcționează algoritmul
de căutare
Din cauza volumului de informații disponibile pe web, ar fi aproape imposibil
să găsiți ceea ce căutați fără ajutor pentru a le sorta. Sistemele de
poziționare Google sunt concepute pentru a vă oferi acest ajutor prin
sortarea a sute de miliarde de pagini web în indexul Căutării Google pentru
a găsi cele mai relevante și mai utile rezultate într-o fracțiune de secundă și
a le afișa astfel încât să găsiți ceea ce căutați.

Aceste sisteme de poziționare sunt alcătuite dintr-o întreagă serie de


algoritmi. Pentru a vă oferi cele mai utile informații, algoritmii Căutării
Google analizează mai mulți factori, inclusiv cuvintele cuprinse în termenul
de căutare, relevanța și ușurința în utilizare a paginilor, competența surselor
și locația și setările dvs. Importanța acordată fiecărui factor variază în
funcție de natura termenului de căutare. De exemplu, actualitatea
conținutului joacă un rol mai important decât definițiile din dicționar în
afișarea rezultatelor pentru termenii de căutare privind subiectele de știri
actuale.

Pentru a ne asigura că algoritmii Căutării Google îndeplinesc standardele


înalte de relevanță și calitate, avem un proces riguros care presupune teste
live și mii de Evaluatori ai calității Căutării Google externi, calificați, din
întreaga lume. Acești Evaluatori ai calității Căutării respectă reguli stricte
care definesc obiectivele noastre privind algoritmii Căutării și sunt
disponibile public pentru toată lumea.
Analizarea cuvintelor dvs.

Pentru a afișa rezultatele potrivite, este esențial să înțelegem sensul


căutării dvs. De aceea, pentru a găsi pagini cu informații relevante, primul
pas este să analizăm ce înseamnă cuvintele din interogarea dvs. Creăm
modele de limbă încercând să descifrăm ce șiruri de cuvinte trebuie să
căutăm în index.

Aici sunt implicate măsuri aparent simple, cum ar fi interpretarea erorilor de


ortografie și se ajunge până la încercarea de a înțelege ce tip de interogare
ați introdus, aplicând unele dintre cele mai recente cercetări privind
înțelegerea limbajului natural. De exemplu, sistemul nostru de sinonime
ajută Căutarea Google să înțeleagă la ce vă referiți, chiar dacă un cuvânt
are mai multe sensuri. A fost nevoie de peste cinci ani pentru a dezvolta
acest sistem și pentru a-i îmbunătăți vizibil rezultatele în peste 30% din
căutările în diferite limbi.
De asemenea, încercăm să înțelegem ce categorie de informații căutați.
Este o căutare foarte exactă sau o interogare amplă? Sunt incluse cuvinte
ca „recenzie” sau „imagini” sau „program de lucru” care indică o anumită
necesitate de informații care motivează căutarea? Căutați cuvinte cheie
populare care arată că vă interesează conținut publicat în ziua respectivă?
Sau căutați o companie din apropiere și doriți informații locale?

Un parametru deosebit de important al acestei clasificări a termenilor de


căutare este analiza noastră care arată dacă termenul caută conținut
recent. În cazul în care căutați cuvinte cheie populare, algoritmii noștri de
noutate vor interpreta acest lucru ca pe un semnal că informațiile
actualizate pot fi mai utile decât paginile mai vechi. Aceasta înseamnă că,
atunci când căutați cele mai recente „scoruri NFL”, rezultatele de la „dansez
pentru tine” sau „câștiguri exxon”, veți vedea cele mai recente informații.

Motorul de cautarea Google are trei scripturi definite si anume:


1. Google – Bot (acesta are rolul unui bibliotecar de a aranja, gasi si colecta
paginile web)
2. Google – Indexer (acesta stocheaza paginile colectate de Google bot
intr-o baza de date imensa)
3. Query Processor ( foloseste cuvintele introduse in caseta de cautare
Google si extrage din baza de date link-urile, urmand ca apoi sa afiseze
site-urile vazute de toata lumea)

GOOGLE-BOT – Google scaneaza site-ul din aproape in aproape in functie


de cat de des este actulizat site-ul, urmarind fiecare link pe care il ai pus pe
site. De la prima pagina la categorii, apoi la subcategorii pana cand toata
schema site-ului este copiata si trimisa mai departe scriptului ce indexeaza
si colectioneaza informatia.

GOOGLE-INDEXER – Dupa ce primul script a scanat site-ul, l-a aranjat si


colectionat intr-o baza de date, Google se va folosi de toate tehnicile de
promovare SEO pentru “a muta cartea din raftul 5 in raftul 2″, deoarece are
mai multa informatie de calitate, este mai apreciata decat celelalte. Fisierele
media (filmele, site-urile flash, textele din imagini) neputand fi indexate nu
for fi luate in calcul, decat daca au atributele necesare pentru a putea
specifica motorului de cautare despre ce este vorba. Fiecare termen sau
cuvant cheie este stocat impreuna cu pozitia in pagina a afisarii pentru a
permite cat mai rapid accesul la pagina respectiva atunci cand cuvantul
este scris in casuta de cautare. Ex: (Cuvantului cheie “Casa” ii corespunde
lista cu 200 de site-uri din care care site-ul 56 este al meu pozitionat in
pagina 3).

QUERY PROCESSOR – Dupa ce primul pas si al doilea este realizat in


functie de cautare google va afisa din marea sa biblioteca site-ul care este
cel mai aproape de cuvantul dorit spre a fi cautat.

In momentul in care realizam un site practic Google nu stie de exista lui,


este necunoscut si neindexat, si nu figureaza in marea biblioteca Google.
Trebuie doar sa anuntam Google ca avem un site nou si ii cerem ajutorul
pentru a-l indexa cat mai repede utilizand Google Webmaster.
Asadar acesta este start-ul de care avem nevoie pentru promovare si
primul pas de a-l pune pe Google la treaba.
Rezultatele căutării, cum ar fi fursecurile calde ieșite din cuptor sau fructele
răcoritoare răcoritoare într-o zi fierbinte de vară, sunt cele mai bune atunci
când sunt proaspete. Chiar dacă nu îl specificați în căutare, probabil că
doriți rezultate de căutare relevante și recente.
Dacă caut [olimpiadele], probabil că vreau informații despre viitoarele Jocuri
Olimpice din vara viitoare, nu despre Jocurile Olimpice de vară din 1900
(singura dată când s-a jucat sportul meu preferat, cricketul). Căutarea
Google folosește un algoritm de prospețime, conceput pentru a vă oferi cele
mai actualizate rezultate, astfel încât chiar și atunci când introduc
[olimpiadele] fără să specific 2012, tot găsesc ceea ce caut.
Având în vedere ritmul incredibil de rapid în care se mișcă informațiile în
lumea de astăzi, cele mai recente informații pot fi din ultima săptămână, din
zi sau chiar din minut și, în funcție de termenii de căutare, algoritmul trebuie
să poată afla dacă rezultatul unei acum o săptămână despre o emisiune TV
este recentă sau dacă un rezultat de acum o săptămână despre știrile de
ultimă oră este prea vechi.
Am finalizat anul trecut sistemul nostru de indexare a cofeinei, care ne
permite să accesăm cu crawlere și să indexăm rapid conținutul proaspăt pe
o scară enormă. Bazându-ne pe impulsul de la cafeină, astăzi facem o
îmbunătățire semnificativă a algoritmului nostru de clasare, care afectează
aproximativ 35% din căutări și determină mai bine când să vă oferim
rezultate relevante mai actualizate pentru aceste grade variate de
prospețime.
Evenimente recente sau subiecte fierbinți. Pentru evenimente recente sau
subiecte fierbinți care încep să fie în tendințe pe web, doriți să găsiți imediat
cele mai recente informații. Acum, când căutați evenimente curente, cum ar
fi [ocupați protestul din Oakland], sau pentru ultimele știri despre [blocarea
nba], veți vedea mai multe pagini de înaltă calitate, care ar putea avea doar
câteva minute.

Evenimente recurente în mod regulat. Unele evenimente au loc în mod


periodic, precum conferințe anuale precum [ICALP] sau un eveniment
precum [alegerile prezidențiale]. Fără a specifica cu cuvintele dvs. cheie, se
presupune că vă așteptați să vedeți cel mai recent eveniment și nu unul de
acum 50 de ani. Există, de asemenea, lucruri care se repetă mai frecvent,
așa că atunci când căutați cele mai recente rezultate [scorurile NFL],
[dansând cu stelele] sau [câștigurile exxon], veți vedea cele mai recente
informații.
Actualizări frecvente. Există, de asemenea, căutări de informații care se
schimbă des, dar nu reprezintă un subiect fierbinte sau un eveniment
recurent. De exemplu, dacă căutați [cele mai bune camere SLR] sau sunteți
pe piață pentru o mașină nouă și doriți [recenzii subaru impreza], probabil
că doriți cele mai recente informații.
Există o mulțime de cazuri în care rezultatele vechi de câțiva ani ar putea fi
utile pentru dvs. [rețeta rapidă de sos de roșii] m-a salvat cu siguranță după
ce un telefon de la soția mea mi-a amintit că m-am oferit voluntar să iau
cina! Pe de altă parte, atunci când caut pentru [scorul 49ers], un rezultat
vechi de o săptămână ar putea fi prea vechi.
Căutările diferite au nevoi de prospețime diferite. Această îmbunătățire
algoritmică este concepută pentru a înțelege mai bine cum să diferențiem
aceste tipuri de căutări și nivelul de prospețime de care aveți nevoie și
pentru a vă asigura că obțineți cele mai multe răspunsuri minime.
Actualizare 07.11.11: Pentru a clarifica, atunci când spunem că acest
algoritm a afectat 35% din căutări, înseamnă că cel puțin un rezultat de pe
pagină a fost afectat, spre deosebire de când am spus că a fost afectat în
mod vizibil în trecut, ceea ce înseamnă schimbări care sunt suficient de
semnificative încât un utilizator mediu ar observa. Folosind aceeași scară,
această modificare afectează în mod vizibil 6-10% din căutări, în funcție de
limba și domeniul în care căutați.
Aproximativ 80% din informatia din acest referat este publiata de catre
insasi compania Google

S-ar putea să vă placă și