Sunteți pe pagina 1din 6

Proiect cofinanat din Fondul Social European prin Programul Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013

Investete n oameni!

2.4 Motoare de cautare


Conf.univ.dr.ing. Catalin Gheorghe Amza
2.4 Motoare de cutare (Search Engines)
Motoarele sau instrumentele de cutare sunt programe specializate n obinerea de
informaii. Cteva dintre acestea sunt menionate n Tabelul 2.2.
n vederea explicrii felului n care se pot folosi motoarele de cutare, trebuie
explicat procesul de creare a respectivului motor de cutare. n principal, acesta este
constituit dintr-una sau mai multe baze de date i de mecanisme de consultare a
acestora. Baza de date nu este constituit prin consultarea periodic a Internetului i a
adugrii n aceasta a paginilor web nou create, proces practic imposibil din punct de
vedere al diversitii i al numrului mare de pagini de web existente. Astfel, fiecare
proprietar al unei pagini de web are posibilitatea s trimit adresa paginii sale de web
mpreun cu nite cuvinte cheie care o caracterizeaz i cu o scurt descriere ctre
motorul de cutare respectiv. Acesta analizeaz pagina respectiv i o include sau nu
n baza sa de date n funcie de tipul, corectitudinea i calitatea acesteia.

Tabelul 2.2 Motoare de cutare


Adresa
Numele
http//www.yahoo.com Yahoo
http//www.google.com Google
http//www.bing.com bing
http//www.altavista.com Altavista
http//www.lycos.com Lycos
http//www.msnsearch.com MSN Search
http//www.askjeeves.com Ask Jeeves
http//www.search.com Cnet Search.com

Aceasta este singura modalitate prin care o pagin de web poate fi inclus n baza
de date a unui motor de cutare.
Pentru obinerea de informaii, utilizatorul trebuie s introduc nite cuvinte care
pot s fie cuvinte cheie sau nu. Motorul de cutare realizeaz apoi o cutare n bazele
sale de date, iar lista cu paginile de web care cuprind respectivele cuvinte cheie sau se
aproprie de acestea sunt afiate pe ecran. Acest proces de cutare este dependent de
modul n care paginile de web sunt indexate. Exist astfel:
- indexarea dup cuvinte cheie care se face n funcie de localizarea
(titlu, rezumat etc.) i frecvena de apariie a acestora n document;
- indexarea total care se face prin includerea fiecrui cuvnt din pagina
de web respectiv ntr-o baza de date;
- indexarea uman n care anumite persoane examineaz paginile i
selecteaz cele mai potrivite cuvinte cheie i fraze care le caracterizeaz,
plasndu-le astfel n baza de date corespunztoare.
Cutarea poate fi la rndul ei realizat n mai multe moduri:
- cutare arborescent n care se pornete de la un domeniu general i se
continu cutarea ntr-o succesiune de alte subdomenii. De exemplu,
motorul de cutare Yahoo are baza de date mprit n domenii, fiecare cu
alte subdomenii, aa cum se vede din Figura 2.51;
- cutare dup cuvinte cheie cutarea se realizeaz
cercetndu-se baza de date folosindu-se cuvinte cheie;
- combinaie ntre cele dou metode de cutare prezentate anterior n
care la fiecare nivel (domeniu sau subdomeniu) se poate realiza o cutare
dup cuvinte cheie (Figura 2.51).
Paginile principale ale ctorva motoare de cutare sunt prezentate n figurile
2.49, 2.50, 2.51 i 2.52.
Se poate observa c toate acestea au n comun o caset de text n care
utilizatorul poate introduce textul dup care se face cutarea. Acest text poate fi
format din cuvinte cheie sau fraze. n general, cutarea se realizeaz cu ajutorul
cuvintelor cheie. Pentru aceasta, utilizatorul poate folosi urmtoarea convenie:
- semnul + n faa unui cuvnt cheie nseamn c acesta trebuie s fie
inclus n pagina web cutat;
- semnul - n faa unui cuvnt cheie nseamn c acesta nu trebuie s
apar n textul paginii cutate;
- folosirea ghilimelelor presupune gsirea unui text n acelai format cu cel
specificat n interiorul ghilimelelor.
De exemplu, cutarea specificat prin:

Ziarul Adevarul

va genera ca rezultat o list a paginilor web care conin cuvintele ziarul i Adevarul, a
paginilor web care conin doar cuvntul ziarul i a paginilor web care conin doar
cuvntul Adevarul.
Cutarea specificat prin:

+ziarul +adevarul

va genera o list a paginilor care conin cuvintele ziarul i adevarul.


De asemenea, cutarea specificat prin:

+ziarul Adevarul +cotidian

va genera o list a paginilor care conin fraza ziarul Adevarul i cuvntul cotidian.
Figura 2.49 Pagina principal a motorului de cutare Altavista

Figura 2.50 Pagina principal a motorului de cutare Yahoo


Figura 2.51 Domeniile din motorul de cutare Yahoo

Figura 2.52 Pagina principal a motorului de cutare Google

Un motor de cutare afieaz o list a paginilor care se potrivesc cu criteriile


de cutare, list ce conine legturi ctre paginile corespunztoare. Paginile sunt listate
n funcie de probabilitatea cu care coninutul acestora coincide cu criteriile de
cutare. Astfel, adresele cu probabilitatea cea mai mare sunt plasate primele n list,
dar aceasta poate conine i link-uri ctre pagini care nu au legtur cu subiectul
cutat.
Astfel, procesul de cutare folosind un motor de cutare este dependent n
mare msur de persoana aflat n faa calculatorului, de modul n care aceasta
reusete s exprime clar i concis ceea ce caut, de experiena acestuia i de motorul
de cutare ales.
De exemplu, s presupunem c se caut paginile care conin poezii ale lui
Mihai Eminescu. Cineva fr experien ar putea s fac cutarea folosind cuvintele
cheie Mihai Eminescu. ns aceasta va genera o list imens, care cuprinde toate
paginile de web care conin vreo referire la Mihai, Eminescu sau Mihai Eminescu.
Nici cutarea specificat prin +Mihai +Eminescu nu ar duce la rezultatul dorit pentru
c lista generat va conine toate paginile de web care fac vreo referire la Mihai
Eminescu i nu neaprat la poeziile acestuia. De aceea, o cutare optim ar putea fi
specificat astfel (Figura 2.53): +Mihai Eminescu +poezii
Bineneles, rezultatele obinute difer n funcie de motorul de cutare ales.

Figura 2.53 Rezultatele cutrii pentru motorul de cutare Google

S-ar putea să vă placă și