Sunteți pe pagina 1din 3

Tehnologia informației și comunicațiilor aplicată

Tehnici de cautare a informatiei necesare in sistemele informatice

Tehnicile de căutare în rețeaua internet se realizează în doua moduri: după adresa


paginii sau a site-ului care conține informația, în serviciul de navigare; cea de a doua căutare
în conținutul documentelor folosind cuvinte cheie care definesc subiectul căutat, în serviciul
de căutare automată.
1. Serviciul de navigare
Browserul, programul client al serviciului de navigare, permite găsirea informaţiilor prin
două metode:
 după adresa URL a paginii de Web în care se găseşte informaţia,
 prin urmărirea hiperlegăturilor din documente care conţin referinţe ascunse către alte
documente.
În plus, utilizatorul mai este ajutat de următoarele mecanisme:
 Mecanismul „semnelor de carte“ sau al „favoritelor“. Îi permite utilizatorului să întreţină o
listă cu identificatorii URL favoriţi. De exemplu, să presupunem că un angajat al unei
firme de consultanţă are nevoie mai des să obţină accesul la paginile Web ale altor trei
companii (de exemplu, trei companii client). El poate stabili trei adrese favorite, câte una
pentru fiecare dintre cele trei companii. De îndată ce a fost construită o listă a favoritelor,
un utilizator poate selecta oricare dintre adresele favorite alegând o opţiune de meniu. Un
alt avantaj este acela că favoritele sunt permanente, deoarece lista este păstrată într-un
fişier pe discul calculatorului utilizatorului. Actualizarea listei se face foarte simplu. Când
utilizatorul găseşte un identificator URL interesant, el îi cere browserului să-l adauge la
lista favoritelor, făcând posibilă revenirea rapidă la acea pagină.

 Mecanismul „istoricului“ Browserul întreţine o listă cu paginile de Web vizitate recent, în


sesiunea de lucru curentă sau în sesiunile de lucru anterioare. Folosind adresele URL
înregistrate în această listă, utilizatorul poate reveni oricând la un document pe care l-a mai
vizitat. El mai poate stabili dimensiunea listei sau o poate goli. În plus, prin acest
mecanism se păstrează urma navigării prin hiperlegături. Astfel, la revenirea într-o pagină,
legăturile care au fost vizitate sunt evidenţiate diferit de cele care nu au fost citite.
Dezavantajul folosirii numai a acestei metode este acela că utilizatorul trebuie să cu-noască
adresa URL la care se găseşte documentul. De exemplu, să presupunem că un utilizator vrea să
găsească informaţii despre automobile. În cazul navigării, utilizatorul trebuie să cunoască
numele câtorva companii care construiesc maşini şi identificatorul URL corect al paginii
Web al fiecărei companii.

2. Serviciul de căutare automată


Pentru a ţine pasul cu dezvoltarea reţelei Internet, este nevoie de o căutare automată.
Aceasta înseamnă că este nevoie de un program de calculator care să poată contacta automat
un alt calculator de pe Internet, să caute informaţia specificată şi să prezinte informaţiile. Un
astfel de program este numit motor de căutare, iar serviciul care furni-zează astfel de
programe este numit serviciu de căutare automată.
Serviciul de căutare automată conţine un server care navighează singur pe Internet şi
capturează titluri de pagini, cuvinte cheie şi conţinuturi de pagini din situri. Toate paginile
găsite sunt înregistrate într-o bază de date. Pentru regăsirea informaţiei în baza de date, fiecare
motor de căutare foloseşte propriul mecanism de indexare a informaţiei, adică o clasificare a
informaţiei după un anumit criteriu. Când utilizatorul scrie cuvântul care des-crie subiectul ce
îl interesează (cheie de căutare), motorul de căutare foloseşte meca-nismul de indexare, găseşte
în baza de date lista cu legături către documente Web care conţin cuvântul căutat şi o oferă
utilizatorului. Rezultatele unei căutări automate pot fi folosite imediat sau pot fi păstrate într-
un fişier pe disc pentru a fi folosite mai târziu. Pentru ca recuperarea informaţiei să se facă
rapid şi avantajos, rezultatele căutării sunt returnate sub forma unei pagini Web care are câte o
legătură cu fiecare document care a fost găsit. În acest mod, rezultatele pot fi folosite uşor cu
un browser standard.
Accesul la serviciile de căutare automată se face direct din Web deoarece fiecare serviciu de căutare
automată are un sit Web. Utilizatorul care vrea să folosească serviciul de căutare automată îi va furniza
browserului identificatorul URL al serviciului. Pagina de început a sitului unui motor de căutare
conţine de obicei patru categorii de informaţii:
 identificarea companiei care oferă serviciul,
 descrierea serviciului pe care îl oferă,
 instrucţiuni care arată modul în care trebuie folosit serviciul,
 metoda prin care utilizatorul poate să comunice un subiect pentru căutare.
În general, în pagina Web de început a serviciului de căutare există o casetă de text pentru
introducerea textului de la tastatură şi un buton Search pentru declanşarea operaţiei de căutare. Butoanele dintr-
un astfel de formular sunt de fapt legături către alte pagini (de exemplu butonul AdvancedSearch este o legătură
către o pagină cu un formular format din controalele cu ajutorul cărora se contruieşte criteriul avansat de
căutare).
După ce serviciul de căutare automată găseşte paginile care se potrivesc unei cereri a
utilizatorului, el furnizează rezultatul sub forma unei liste,
ordonată implicit după un criteriu de prioritate. Pentru a stabili ordinea de afişare, serviciul
atribuie fiecărei pagini găsite un punctaj. Criteriul folosit pentru stabilirea punctajului diferă
de la un motor de căutare la altul. În general, în atribuirea punctajului se ţine cont de:
 de câte ori apare cuvântul în pagină, existând însă motoare de căutare care pena-
lizează dacă acel cuvânt apare de foarte multe ori,
 poziţia ocupată în pagină de cuvânt (dacă apare la începutul paginii, punctajul este mai
mare),
 câte cuvinte are pagina,
 dacă apare cuvântul în titlu,
 popularitatea sitului (care este dată de numărul de situri care au legături cu acea
pagină) etc.
Serviciul creează o pagină Web care conţine câte o legătură pentru fiecare element din
listă şi returnează pagina Web către browserul utilizatorului care afişează rezultatele.
Deoarece fiecare motor de căutare foloseşte propriul său criteriu de prioritate şi întreţine
propria sa bază de date folosind propriul său mecanism de indexare (după situri, după pagini
etc.), lista cu rezultate afişată pentru aceeaşi cerere de căutare de informaţii va diferi de la un
motor de căutare la altul, atât din punct de vedere al numărului de rezultate obţinute, cât şi din
punct de vedere al ordinii de afişare a rezultatelor în listă. De asemenea, formatul listei cu
rezultate afişate pe ecranul utilizatorului şi numărul de articole afişate într-o pagină diferă de
la un motor de căutare la altul. În general, în listă pot fi afişate:

 legătura cu pagina de informaţie,


 titlul paginii care conţine informaţia,
 dimensiunea paginii,
 mai multe citate din pagină care arată cum apar termenii căutării în context,
 adresa URL a paginii etc.

Mecanismul de căutare după cheie foloseşte potrivirea de caractere atunci când selec-
tează paginile Web. Aceasta înseamnă că serviciul caută o potrivire exactă între şirul de
caractere prin care utilizatorul a precizat subiectul şi şirurile de caractere care apar în paginile
Web. Principalul dezavantaj al acestei metode de căutare apare din lipsa seman-ticii. Un
program care foloseşte această metodă nu înţelege sensul cuvintelor şi al expre-siilor şi nu
este capabil să-şi dea seama ce reprezintă acestea pentru utilizator. Deoarece nu are
inteligenţă, un motor de căutare nu poate recunoaşte expresiile obişnuite. În consecinţă
utilizatorul trebuie să aibă în vedere faptul că, dacă nu se specifică altfel, fiecare cuvânt va fi
tratat ca un termen independent după care se va realiza căutarea.

S-ar putea să vă placă și