Sunteți pe pagina 1din 70

Tehnici de cutare i regsire a

informaiei n Internet -
Motoare de cutare

Curs:
Tehnologia informaiei
n cercetare

Mat. Gabriela MAILAT


Ing. Corina POP
Prof.dr.ing. Elena HELEREA
1
CUPRINS

1. Introducere
2. Ce este o baz de date Web
3. Metode de indexare
4. Programe de selectare
5. Tehnici de cutare a informaiei
in Internet
6. Concluzii
2
Introducere

 World Wide Web (www) - cea mai important


component a Internetului.
 www - interfa multimedia care presupune
posibilitatea accesului la surse ce includ
grafice i figuri, imagini, sunete i filme
bazate pe tehnologia hypertext.
 www - leag documentele ntre ele prin
conexiuni, formnd un pienjeni (web).
3
Introducere

 Regsirea documentelor pe Web este


dificil:
nu exist un format standard de descriere
a resurselor din Internet
exist diferite instrumente de cutare care
opereaz n moduri diferite
nu este o metod indicat pentru
regsirea informaiilor referitoare la un
anumit subiect.
4
Introducere

 Metode de regsire a informaiilor:


cutarea dup cuvinte cheie sau expresii,
mecanismele booleene,
proximitatea,
trunchierea etc.

OBS. Regsirea unei resurse folosind adresa (URL)


este util i rapid dar exist posibilitatea modificrii
URL-ului datorit caracterului dinamic al Internet-
ului.

5
Ce este o baz de date Web
(Web database) ?

O baz de date Web este


- o list organizat de pagini web din internet,
un gigantic repertoar ce conine o copie a
fiecrei pagini nregistrate n list (practic
pri mici din acea pagin, cum ar fi titlul,
antetul etc).

6
Ce este o baz de date Web
(Web database) ?

Pentru utilizatorul final, baza de date web


furnizeaz o interfa ce are ca i
caracteristic
 un cmp special n care utilizatorul tasteaz
cuvintele dup care va efectua cutarea
(vezi interfaa cu utilizatorul de la Google),
 o list cu directoare din care utilizatorul
poate alege legtura dorit (vezi Yahoo
directories).
7
Metode de indexare

Crearea listei cu copiile paginilor poart numele de


indexare i fiecare baz de date web o realizeaz n
stilul su caracteristic.

Exist dou modaliti mai importante de indexare a


informaiei n timpul generrii bazelor de date web:
indexarea full-text
indexarea manual.

8
Metode de indexare

Indexarea full-text
- include toate cuvintele dintr-o pagin n baza
de date pentru cutare, cu ajutorul unor
programe speciale de calculator numite
pianjeni sau roboi (spiders sau robots).

Altavista i Google folosesc pe scar larg


aceast tehnic de indexare.
Indexarea full-text permite s regsim toate
referirile la un anumit termen din documentul
indexat.
9
Metode de indexare

Indexarea manual
- o persoan examineaz paginile ce urmeaz a
fi indexate i decide asupra ctorva cuvinte
(fraze) cheie ce descriu cel mai bine informaia
coninut n respectiva pagin. Ex. (Yahoo
directories sau Magellan).
Avantaj:
- permite utilizatorului s regseasc mai multe
legturi utile n urma cutrii, tocmai pentru c
un om i nu o main a ales cuvintele cheie ce
au fost incluse n indexul bazei de date.
10
Programe de cautare

Foarte multe servicii de cutare folosesc


programe automate, numite "spiders" sau
"robots" (pianjeni sau roboi), ce cltoresc
de la site la site ( coleci de pagini web)
cutnd pagini www nou aprute sau
modificate substanial.

11
Programe de cautare

Exist trei clase de baze de date web:


 baze de date ce gestioneaz TOATE categoriile de
pagini WWW ;
 baze de date ce gestioneaz NUMAI paginile WWW
considerate populare (n principiu cele cu numr
mare de vizitatori);
 baze de date ce gestioneaz NUMAI paginile WWW
ce ndeplinesc anumite criterii (legate fie de calitatea
informaiei furnizate, fie de tipul de informaie urmrit
ex. medical, tiinific, tiri etc).
12
Tehnici de cutare a informaiei pe
Internet

i. Motoare de cutare
ii. Directoare web (anuare online, repertoare
tematice)
iii. Biblioteci virtuale
iv. Invisible (deep) Web
v. Motoare de meta-cutare (metasearch engine)
vi. Utilitare de cutare de tip desktop

13
Tehnici de cutare a informaiei pe
Internet

i. Motoare de cutare
Este definit ca un serviciu de regsire a
informaiilor stocate n bazele de date, care
descrie principalele resurse din Web.

14
Tehnici de cutare a informaiei pe
Internet

Motoare de cutare
Este o baz de date coninnd pagini Web ce
pot fi regsite pe baza unor cuvinte cheie i
care continu s scaneze Internetul, cu
ajutorul unor programe automate (spiders,
robots) n cutare de pagini noi. Informaia
rezultat n urma activitii roboilor este apoi
indexat i stocat n baza de date.

15
Tehnici de cutare a informaiei pe
Internet

Motoare de cutare
 La lansarea unei cutri se exploreaz de
fapt coninutul bazelor de date, n care sunt
stocate informaii colectate automat de roboi
i nu Web-ul n mod direct.
 Se recomand utilizarea a cel puin dou
utilitare pentru aceeai cerere formulat
datorit modului propriu de funcionare a
fiecrui motor de cutare i a paginilor web
existente (diferite de la un utilitar la altul).
16
Tehnici de cutare a informaiei pe
Internet

Motoare de cutare
Instrumentele de cutare sunt programe destinate
obinerii de informaii. Metodele de cutare pot fi
diferite:
 arborescent sau de tip director (directory ex.
LookSmart),
 mecanism de cutare (search engine ex. Alta
Vista),
 o combinatie ntre tipurile arborescent i mecanism
de cutare (directory/search engine ex. Excite,
Yahoo) i
 multi-mecanism (multiengine ex. All-In-One,
17 Metacrawler).
Tehnici de cutare a informaiei pe
Internet

Motoare de cutare

1. Motoare care funcioneaz dup modelul


directorului (arborelui de subiecte), de fapt
dup un ghid web n care locaiile sunt
organizate pe subiecte i subsubiecte, ntr-o
structur ierarhic, pornind de la un subiect
general i ajungnd la subiecte cu caracter
din ce n ce mai specifice.
18
Tehnici de cutare a informaiei pe
Internet

Motoare de cutare
2. Motoare care funcioneaz dup modelul
indexului de cutare, n cazul crora soft-urile sunt
cale care efectueaz cutarea dup cuvinte cheie,
bazndu-se pe tehnici de indexare computeriate,
rezultatele obinute fiind prezentate ntr-una sau
mai multe pagini web, care ofer o list de locaii
aranjat n ordinea probabilitii de potrivire a ceea
ce se caut (Alta Vista, Google etc.)

19
Tehnici de cutare a informaiei pe
Internet

Motoare de cutare

3. A treia metod de cutare este o metod


combinat: directory/search engine.
- folosesc ambele metode descrise mai sus, i se
bazeaz pe un sistem de cutare ierarhic, la fiecare
pas putndu-se accesa un mecanism de cutare,
efectundu-se apoi, dac se dorete, o cutare dup
cuvinte-cheie. Aceste utilitare de cutare adaug
selectiv materiale la baza de date i revizuiesc site-
20 urile bazate pe coninut.
Tehnici de cutare a informaiei pe
Internet

Ele pot exclude site-urile ce conin materiale


inacceptabile, sau pot accepta doar acele
site-uri, pe care le consider potrivite. Se
folosesc de o varietate de criterii pentru a
evalua site-urile posibile, incluznd calitatea
materialului i cantitatea materialului.
Exemplu de utilitar de cutare specific:
Magellan.

21
Tehnici de cutare a informaiei pe
Internet

Motoare de cutare

4. A patra metod multi-mecanism (multi-


engine ex. All-In-One, Metacrawler,
Mamma etc.) face referire la acele motoare
de cutare care analizeaz coninutul tuturor
celorlalte categorii de motoare. Nu totdeauna
aceste motoare de cutare sunt i cele mai
practice din cauza numrului foarte mare de
rezultate afiate.
22
Tehnici de cutare a informaiei pe
Internet

Motoare de cutare

Dac n urma unei cutri, dup cuvnt-


cheie, rezultatele cercetrii pentru cuvntul
respectiv sunt pe ultima pagina a motorului
de cutare utilizat, atunci se reformuleaz
interogaia sau se schimb motorul de
cutare.

23
Tehnici de cutare a informaiei pe
Internet

Motoare de cutare

Motoarele de cutare funcioneaz autonom i pot fi


identificate adrese diferite utiliznd aceeai
interogaie pe motoare de cutare diferite, sau s fie
identificate aceleai adrese utiliznd ns interogaii
diferite pe acelai motor de cutare. Cteva reguli
generale care pot ajuta la cutarea informaiei n
Internet vor fi prezentate n continuare.

24
Tehnici de cutare a informaiei pe
Internet

1. Formulai
interogaii ct mai scurte i utilizai
cuvinte-cheie.
Este necesar s reinei faptul c un calculator,
nu o persoan, va analiza ceea ce a fost supus
examinrii/cercetrii. Supunnd cercetrii
interogaii lungi precum A vrea sa tiu cine a
fost Einstein va ngreuna munca motorului de
cutare i va duce la rezultate nerelevante. O
formulare mult mai adecvat poate fi simpla
introducere a numelui lui Einstein i eventual a
domeniului fizic.
25
Tehnici de cutare a informaiei pe
Internet

2.Utilizai operatori logici pentru a va formula interogaia


Operatorii sunt reguli sau instruciuni speciale
folosite ntr-o cutare pe baz de cuvinte cheie,
pentru a formula ntrebri sau cereri. Cutarea pe
baz de cuvinte cheie se ncepe prin scrierea unui
cuvnt n caseta "search box" a paginii "home" a
motorului de cutare. Pentru a construi o cerere, se
pot folosi operatorii adecvai din motorul de cutare
n care se desfoar sesiunea de lucru. n timp ce
fiecare motor de cutare are operatori proprii, exist
civa comuni pentru toate utilitarele de cutare:
26
Tehnici de cutare a informaiei pe
Internet

a) OperatoriiAND, OR, NEAR si NOT pot fi folosii pentru


a conecta cuvinte i termeni n cadrul unei cereri, cu
sensurile lor logice:
AND nseamn c ambele cuvinte sunt prezente n
cadrul documentelor.

27
Tehnici de cutare a informaiei pe
Internet

NEAR nseamn c un termen trebuie s fie gsit n


cadrul unui numr specificat de cuvinte. OR nseamn
c cel puin un termen este prezent, iar NOT exclude
prezena unui termen.

28
Tehnici de cutare a informaiei pe
Internet

b) Cnd folosii aceti operatori, nu uitai s-i scriei cu litere


mari, fr s lsai un spaiu ntre operator i termenii
care i urmeaz.
c) Semnele + i -;
+ naintea unui termen (fr spaii) ajut la regsirea doar
a documentelor coninnd acel termen i este similar cu
AND;
- este similar lui NOT, regsind documentele care nu
conin respectivul termen.
d) Apostrofurile () sau ghilimelele () marcheaz cuvinte
care trebuie tratate exact cum sunt. Aceste semne sunt
similare cu operatorul NEAR.
29
Tehnici de cutare a informaiei pe
Internet

e) Parantezele sunt utilizate ca i semnele de la c), dar cuvntul


dintre paranteze este considerat o singur entitate.
f) Cuvintele scrise cu majuscule sunt tratate ca un nume propriu.
Virgulele separ numele proprii.
g) Un asterisc ndeplinete funcia de lrgire a rdcinilor.
Plasai un asterisc * la sfritul cuvntului pentru a gsi
toate cuvintele ce ncep cu literele tiprite. Spre exemplu,
cutnd istorie, el creeaz legturi cu paginile Web cu
cuvintele istorie, istorici, istoriografie.
h) Utilizai operatorul logic ADJ (adiacent) dac dorii s gsii
documente n care termenii apar unul lng altul, n orice
ordine.
30
Tehnici de cutare a informaiei pe
Internet

i) Operatorul FAR (departe) este opus operatorului


NEAR. Cnd utilizai FAR, vor fi gsite documentele n
care termenii se afl la o distan mai mare de 25 de
cuvinte unul de altul. (expl.: Lycos). FAR se utilizeaz
foarte des mpreun cu alte expresii. De exemplu, putei
s cutai istorie FAR antic NOT "istorie antic" i vei
gsi pagini ce conin ambele cuvinte dar nu istorie antic.
j) Operatorul BEFORE (nainte) funcioneaz foarte
asemntor cu AND. Unica deosebire este c termenii
trebuie s apar n ordinea pe care o specificai, dar pot
s se afle la orice distan n acelai document.
31
Tehnici de cutare a informaiei pe
Internet

Observaii
1). Marcai cu Bookmark (sau Favorites), fiecare
instrument de cutare preferat, pentru a facilita
utilizarea ulterioar. De asemenea, marcai i unele
"home pages" folosite des i care au nume lungi i
complicate.
2). Unele instrumente de cutare ofer opiuni de
cutare n diferite domenii i categorii, care ajut la
limitarea focalizrii n cutarea d-voastr. Selectnd
una sau mai multe dintre aceste opiuni, putei s
mrii relevana potrivirilor din cutare. Aceste
opiuni sunt scrise, de obicei, lng casetele de
cutare.
32
Tehnici de cutare a informaiei pe
Internet

3). Pot fi cazuri cnd un instrument de cutare nu se


conecteaz la o locaie Web, dintr-un anumit motiv:
- ai uitat s scriei sau ai scris greit un cuvnt n
adres, aa c verificai!
- exist probleme la accesarea locaiei, ori chiar locaia
este deconectat, din diverse motive. n astfel de
cazuri, revenii mai trziu.
- locaia a fost deconectat definitiv, dar s-au pstrat
anumite legturi. Uneori exist trimiteri ctre noua
locaie a documentului.
4). Folosii seciunea de Help a mecanismelor de cutare
pe care le utilizai cel mai des.
33
Tehnici de cutare a informaiei pe
Internet

5). La cutrile pe baz de cuvinte cheie, cel mai bine


este s formulai cereri n concordan cu
mecanismul de cutare particular pe care l utilizai.
Aceasta presupune o bun cunoatere i nelegere
a regulilor de formulare a cererilor. O cerere bine
formulat este hotrtoare pentru relevana
rspunsurilor i reduce numrul de potriviri
necorespunztoare.
6). Un numr extraordinar de mare de potriviri se
datoreaz unei cereri de cutare pe baz de cuvinte
individuale, de aceea este bine s folosii cuvinte
legate ntre ele, ca un cuplu de cuvinte.
34
Tehnici de cutare a informaiei pe
Internet

7). Unele locaii Web conin multe elemente grafice pe


care nu le putei omite. n cazul n care calculatorul
vostru efectueaz transferul prea ncet, este mai
bine s folosii instrumente de cutare care nu au
prea multe elemente grafice. Printre acestea sunt:
Hotbot, Infoseek i Mamma. Cu multe imagini
grafice sunt LookSmart i OneKey.
8). Cnd formulai o cerere, ncercai s folosii cuvinte
obinuite, exceptnd cazurile n care trebuie s
apar cuvinte sau sintagme speciale. Altfel, vei
obine un numr enorm de potriviri.
35
Tehnici de cutare a informaiei pe
Internet

Motoare de cutare renumite:


Google (www.google.com)
AlltheWeb (www.alltheweb.com)
MSN (www.msn.com)
Teoma (www.teoma.com)
AltaVista (www.altavista.com)
WiseNut (www.wisenut.com)

36
Tehnici de cutare a informaiei pe
Internet

ii. Directoare web (anuare online, repertoare


tematice)

Un serviciu de directoare web este o colecie de


pagini Web selecionate i organizate ierarhic n
categorii de subiecte de ctre un editor uman.
Un concept mai selectiv este cel de bibliotec
virtual, care este un director web ce include legturi
spre pagini cu informaie de nalt specializare, pe
domenii alese de editor.
37
Tehnici de cutare a informaiei pe
Internet

Serviciile de directoare acoper i indexeaz


o poriune mult mai mic din paginile WEB
existente, comparativ cu motoarele de
cutare. Dar folosirea lor poate duce la
regsirea unor rezultate ale cutrii mult mai
relevante pentru utilizator.

38
Tehnici de cutare a informaiei pe
Internet

Cele mai extinse servicii de directoare web


indexeaz cel mult cteva milioane de
pagini, comparativ cu cele cteva miliarde
indexate de ctre motoarele de cutare mai
importante. Serviciile de directoare NU
interogheaz direct paginile WEB, ci caut n
interiorul bazei lor de date. Rezultatul cutrii
poate duce la returnarea unor rezultate, care
nu mai au relevan.

39
Tehnici de cutare a informaiei pe
Internet

O serie de motoare de cutare sunt de fapt


unelte hibride, fiind n acelai timp att
motoare de cutare ct i servicii de
directoare (Google, de exemplu, unul
dintre cele mai cunoscute motoare de
cutare, are i un serviciu de directoare,
bazat pe soluia Open Directory Project).

40
Tehnici de cutare a informaiei pe
Internet

Dintre serviciile de directoare web, mai


cunoscute sunt :
Yahoo! (www.yahoo.com)
Google Directory (www.google.com)
Open Directory Project (ODP) (http://dmoz.org)
Zeal (www.zeal.com)
JoeAnt (www.joeant.com)
Gimpsy (www.gimpsy.com)
41
Tehnici de cutare a informaiei pe
Internet

Motoare de cutare versus servicii


de directoare
Cele mai uzuale modaliti de accesare a
paginilor WEB se regsesc n aa numitele
motoare de cutare, respectiv n aa
numitele directoare web.

42
Tehnici de cutare a informaiei pe
Internet

Modaliti de cutare a informaiei

Motoarele de cutare permit utilizatorului s


foloseasc orice termeni de cutare
(combinaie de termeni) dorete, motorul
cutnd aceti termeni n baza de date i
returnnd paginile care conin aceste
combinaii de termeni.

43
Tehnici de cutare a informaiei pe
Internet

Servicii de directoare web

Serviciile de directoare web au paginile


organizate n baza de date pe subiecte.
Paginile cu informaia dorit pot fi
selectate navignd prin acest arbore de
directoare.

44
Tehnici de cutare a informaiei pe
Internet

Navigarea prin structura directoarelor web


poate fi un foarte bun nceput pentru cutarea
informaiei dorite, cu condiia ca topicul ales sa
fie considerat ca subiect pentru o
arborescen de directoare.

45
Tehnici de cutare a informaiei pe
Internet

Site-ul Yahoo include att un motor de


cutare ct i un arbore de directoare web.
Diferena fa de un motor de cutare
obinuit este dat de faptul c motorul de
cutare al Yahoo caut cuvintele cheie doar
n interiorul directoarelor web din baza de
date a Yahoo.
46
Tehnici de cutare a informaiei pe
Internet

Din acest motiv motorul de cutare al site-


ului poate fi folosit cel mult pentru a identifica
zona din arborele de directoare ce conine
informaia dorit.

47
Tehnici de cutare a informaiei pe
Internet

Prezentarea rezultatelor

Odat ce au fost introdui termenii de cutare,


serverul i caut n baza de date web indexat i
returneaz lista cu rezultate.
Din cauza multitudinii de legturi cu informaie
nerelevant pentru utilizatorul ce a efectuat
cutarea, trebuie subliniate dou concepte deosebit
de importante n evaluarea listei cu rezultate ale
cutrii: rata de relevan (relevancy ranking),
respectiv rezumatul (abstract) ce nsoete legtura
48 ctre pagin.
Tehnici de cutare a informaiei pe
Internet

Paginile gsite n urma cutrii sunt


aproape ntotdeauna prezentate n
ordinea relevanei lor, n conformitate cu
termenii dup care s-a efectuat cutarea.

49
Tehnici de cutare a informaiei pe
Internet

n cazul celor mai multe servicii de cutare


web se poate observa c aproape fiecare
legtur spre o pagin considerat relevant
este nsoit de un scurt rezumat al
coninutului, multe servicii recurgnd chiar la
sublinierea (ngoarea) termenilor folosii n
respectivul rezumat.

50
Tehnici de cutare a informaiei pe
Internet

iii. Biblioteci virtuale


a) Biblioteci virtuale de uz general:
Librarians' Index to the Internet (www.lii.org)
INFOMINE (www.infomine.com)
Internet Public Library (www.ipl.org)
The WWW Virtual Library (vlib.org)
Academic Info (www.academicinfo.net)
Internet Scout Project (scout.wisc.edu)
BUBL Link (academic resources) (bubl.ac.uk/link/)
51
Tehnici de cutare a informaiei pe
Internet

b)Biblioteci virtuale de specialitate


(orientate spre anumite domenii):
Project Gutenberg (www.gutenberg.org) - beletristic
National Academies Press (www.nap.edu) - tiin
Free books for doctors (www.fb4d.com) - medicin
The free management library
(www.managementhelp.org) - management

52
Tehnici de cutare a informaiei pe
Internet

iv. Invisible (deep) Web

Reprezint colecii de informaii online


stocate n baze de date accesibile pe Web,
dar care, din diferite motive, nu sunt indexate
de motoarele de cutare tradiionale. Aceste
servicii pot fi ntlnite i sub numele de
servicii speciale de cutare (specially search
engines).
53
Tehnici de cutare a informaiei pe
Internet

ProFusion (www.profusion.com)
Invisible-web (www.invisible-web.net)
Complete Planet (www.completeplanet.com)
Resource Discovery Network
(www.rdn.ac.uk)
Direct Search
(http://www.freepint.com/gary/direct.htm)
http://www.resourceshelf.com/

54
Tehnici de cutare a informaiei pe
Internet

v. Motoare de meta-cutare
(metasearch engine)
Un motor de meta-cutare este o unealt de
cutare care trimite cerea dumneavoastr
simultan ctre mai multe motoare de cutare
clasice, servicii de directoare web i uneori
spre colecii de tip invisible web.

55
Tehnici de cutare a informaiei pe
Internet

Dup colectarea rezultatelor cutrii de la toate


serviciile apelate, motoarele de meta-cutare elimin
legturile aflate n duplicat i, conform unui algoritm
propriu combin rezultatele ntr-o singur list,
acordndu-le i o rat de relevan.
Majoritatea motoarelor de meta-cutare iau n
considerare numai primele 10-20 de legturi din lista
furnizat de fiecare motor de cutare apelat,
rezultatele cutrii vor fi foarte bune, din punctul de
vedere al relevanei.
56
Tehnici de cutare a informaiei pe
Internet

Motoarele de meta-cutare NU au propriile


baze de date web, ci le folosesc pe cele ale
serviciilor apelate.
Motoarele de meta-cutare nu permit
nscrierea manual a unei pagini (site) n baza
de date.

57
Tehnici de cutare a informaiei pe
Internet

Unele dintre cele mai cunoscute motoare de


meta-cutare sunt:
Metasearch (www.metasearch.com)
ez2Find (www.ez2find.com)
Vivisimo (www.vivisimo.com)
MetaCrawler (www.metacrawler.com)
InfoGrid (www.infogrid.com)
Infonetware (www.infonetware.com)
iBoogie (www.iboogie.tv)

58
Tehnici de cutare a informaiei pe
Internet

vi. Utilitare de cutare de tip desktop


Un tip special de motoare de meta-cutare sunt
utilitarele de cutare de tip desktop (client side
search software). Aceste utilitare sunt programe ce
pot fi descrcate de pe Internet i instalate pe
propriul calculator (local). Principiul lor de
funcionare este oarecum similar cu al motoarelor de
meta-cutare.

59
Tehnici de cutare a informaiei pe
Internet

Cteva dintre cele mai utilizate utilitare de acest fel sunt:


Google Desktop (desktop.google.com)
Copernic (www.copernic.com)
Arrow Search (www.rt-software.co.uk/arrow_search/)
WebFerret (www.ferretsoft.com/download.htm)
ProtoSearch
(www.npccenterprises.com/products/protosearch2.shtml)

60
Tehnici de cutare a informaiei pe
Internet

Motoarele de meta-cutare sunt unelte


complementare excelente, ns datorit unor
considerente (numr relativ mic de legturi
luate n considerare de la fiecare serviciu
apelat, imposibilitatea de a folosi eficient
tehnici avansate de cutare etc. ) NU pot
elimina necesitatea folosirii unor motoare de
cutare clasice.

61
Tehnici de cutare a informaiei pe
Internet

CE TEHNICI DE CUTARE SE FOLOSESC ?


1. Dac cunoatei exact ce tip de informaie dorii
s aflai, este recomandat folosirea motoarelor
de cutare.
De exemplu pentru a gsi informaii despre pal sau
wood putei folosi motoarele de cutare, deoarece
informaia nu este suficient de specific pentru a fi
subiectul unui arbore de directoare, dar domeniul
este suficient de bine conturat pentru a nu fi
necesar recurgerea la un motor de meta-cutare.
62
Tehnici de cutare a informaiei pe
Internet

2. Dac vei cuta informaii despre un


anumit termen sau o combinaie de
termeni i dorii o analiz exhaustiv a
temei analizate, este de preferat recurgerea
la motoare de meta-cutare, ce pot apela
simultan mai multe servicii web (10 -12
motoare de cutare sau directoare web).
De exemplu, cutarea dup termenul
composite (vezi composite plates)

63
Tehnici de cutare a informaiei pe
Internet

3. Dac dorii s cutai informaii generale despre


subiecte cu grad ridicat de popularitate, este
indicat folosirea serviciilor de directoare web.
Astfel dac dorii informaii despre industrial plants,
este mult mai indicat s folositi serviciul de
directoare Yahoo, n care putei naviga cu uurin,
informaia este bine organizat i exist i faciliti
de cutare prin arborele de directoare.

64
Tehnici de cutare a informaiei pe
Internet

4. Dac dorii, informaii pertinente legate


de anumite domenii ale literaturii, tiinei
etc. este preferabil folosirea serviciilor tip
bibliotec virtual.

65
Tehnici de cutare a informaiei pe
Internet

5. Dimpotriv, dac dorii informaii n timp


real sau informaii al cror coninut se
schimb dinamic (tiri, prognoze meteo,
mersul trenurilor) folosii baze de date web
specializate (invisible or deep web).

66
Tehnici de cutare a informaiei pe
Internet

Muli dintre deintorii de servicii WEB au


ales s i diversifice activitatea furniznd
mai multe servicii sub aceeai interfa
utilizator.
Astfel s-a cristalizat un nou concept, acela de
PORTAL WEB.

67
Tehnici de cutare a informaiei pe
Internet

Portalul Web
- un site WEB ce ofer o gam larg de
servicii i resurse online, cum ar fi: e-mail,
forumuri de discuii, motoare de cutare,
directoare web, comer electronic etc. (a se
vedea www.yahoo.com, unul dintre cele mai
cunoscute servicii de cutare, transformat
ntr-un portal).

68
Concluzii Motoare de cutare

Motoarele de cutare sunt probabil cea mai utilizat cale


de accesare a informaiei stocate n bazele de date Web.
Principalii pai necesari pentru a utiliza eficient un motor
de cutare sunt urmtorii:
1. Formulai-v atent nevoia de informare. ncercai s
facei aceasta ct mai simplu i specific cu putin;
2. Spargei cererea de mai sus ntr-o serie de termeni
de cutare;
3. Gsii sinonime pentru fiecare termen identificat;

69
Concluzii Motoare de cutare

4. Atunci cnd este posibil, recurgei la fraze (termeni


specificai n ghilimele);
5. Combinai sinonimele termenilor de cutare prin
intermediul operatorului OR i legai aceste combinaii
prin intermediul operatorului AND;
6. Analizai circa 30 de rezultate nainte de a cuta din
nou;
7. Dac este posibil, nainte de a rencepe cutarea,
folosii pagini cu informaie similar celei cutate
pentru a identifica noi termeni de cutare i sinonime
ale acestora.
70

S-ar putea să vă placă și