Sunteți pe pagina 1din 7

Regsirea informaiei multimedia

-Referat-

Student: Camelia Gomotarceanu


Anul: II
Sectia: Inginerie Software

Regsirea informaiei text

Regsirea informaiei este n primul rnd un proces de selectare. n mod succint, prin
sintagma ,,regsirea informaiei nelegem identificarea informaiei dorite dintr-un stoc/colecie
de informaii iar acest proces conine implicit conceptul selectivitii. Deci regsirea informaiei
este n primul rnd un proces de selecie. Recuperarea informaiilor nu nseamn acelai lucru cu
regsirea lor. Activiti ca urmrirea unui program de tiri la televizor sau copierea unui fiier nu
sunt activiti de regsire, deoarece spectatorul sau cel care copiaz fiierul nu are nici un control
asupra coninutului informaiilor pe care le va obine. Regsirea informaiei este un proces de
comunicare indirect ntre autorii unui mesaj, indiferent de forma de prezentare, respectiv ntre
creatorii unor nregistrri (text, imagine, sunet) i utilizatorii informaiilor coninute n acest
mesaj.
Cutarea n Internet poate fi o operaie de durat, enervant pentru un nceptor, volumul
de informaii este enorm i modurile de stocare i de regsire a lor sunt foarte diferite. Procesul
de cutare este ntotdeauna dificil, din cauza numrului mare de instrumente de cutare, a
coninutului lor diferit de informaii i de metode de cutare, precum i din cauza lipsei unor
standarde.
Motorul de cutare este o baz de date continnd pagini Web ce pot fi regsite pe baza
unor cuvinte cheie i care continu s scaneze Internetul, cu ajutorul unor programe automate
(spiders, robots) n cutare de pagini noi. Informaia rezultat n urma activittii robotilor este
apoi indexat i stocat n baza de date.
Instrumentele de cutare sunt programe destinate obinerii de informaii. Metodele de
cutare pot fi diferite: arborescent sau de tip director (LookSmart), mecanism de cutare (Alta
Vista), o combinatie ntre tipurile arborescent i mecanism de cutare (directory/search engine Excite, Yahoo) i multi-mecanism (multiengine - All-In-One, Metacrawler).
a) Un sistem de cutare arborescent folosete subiectul (domeniul) cutrii. Metoda de
cutare este una de tip ierarhic, care ncepe cu domeniul general, apoi urmeaz o succesiune de
alte subdomenii. Se mai numete i cutare dup subiect (subject search). Directoarele siturilor
clasific arborescent, n categorii, siturile din Web. Fiecare categorie, ca de exemplu Istorie,
poate fi divizata n subcategorii precum Istorie regional (Istoria Europei Albania, Austria,
Belgia, Bulgaria, etc. -, Istoria Americii de Nord, Istoria Asiei, etc.), Epoci istorice (Epoca
pietrei, Epoca bronzului, Epoca fierului, Epoca roman, etc.), Domenii istorice (Arheologie i
Antropologie, Studii clasice, Medievistic, Diplomaie, Heraldic, Arhivistic, etc.) Instituii de
istorie (Muzee, Universiti, Societi de istorie, Institute de istorie, Laboratoare de istorie, etc.),
etc. Pentru a v mica n interiorul acestor directoare, trebuie s apsai pe legturile dintre
fiecare categorie i subcategorie pn cnd vei gsi ceea ce cutai. Sau, putei utiliza cutarea

cu ajutorul cuvntului-cheie pentru a gsi anumite site-uri specifice. n majoritatea cazurilor, cei
care i creeaz propriile site-uri de Web i le nregistreaz cu un director de site. Drept exemple
de directoare de site-uri pot servi: Looksmart, Yahoo, The World Wide Web Virtual Library i
The Argus Clearinhouse.
b) Un mecanism de cutare este un instrument ce acceseaz bazele de date folosind
cuvinte cheie. El rspunde la diferite cereri cu o list de referine; se mai numete i cutare pe
baz de cuvnt cheie (keyword search). Este cel mai utilizat i cel mai complex mecanism de
cutare, astfel nct el va face subiectul unei descrieri amnunite puin mai jos. Exemple: Alta
Vista, Google, etc.
c) A treia metod de cutare este o metod combinat: directory/search engine. Astfel de
instrumente de cutare folosesc ambele metode descrise mai sus, i se bazeaz pe un sistem de
cutare ierarhic, la fiecare pas putndu-se accesa un mecanism de cutare, efectundu-se apoi,
dac se dorete, o cutare dup cuvinte-cheie. Aceste utilitare de cutare adaug selectiv
materiale la baza de date i revizuiesc site-urile bazate pe coninut. Ele pot exclude site-urile ce
conin materiale inacceptabile, sau pot accepta doar acele site-uri, pe care le consider potrivite.
Se folosesc de o varietate de criterii pentru a judeca site-urile posibile, incluznd calitatea
materialului i cantitatea materialului. Exemplu de utilitar de cutare specific: Magellan.
d) A patra metod multi-mecanism (multi-engine - vezi All-In-One, Metacrawler,
Mamma, etc.) face referire la acele motoare de cutare care analizeaz coninutul tuturor
celorlalte categorii de motoare. Nu totdeauna aceste motoare de cutare sunt i cele mai practice
din cauza numrului foarte mare de rezultate afiate.
Cutarea dup cuvnt-cheie
Dac n urma unei cutri, dup cuvnt-cheie, rezultatele cercetrii pentru cuvntul respectiv
sunt pe ultima pagina a motorului de cutare utilizat, atunci se reformuleaz interogaia sau se
schimb motorul de cutare. Motoarele de cutare funcioneaz autonom i putei avea surpriza
s identificai adrese diferite utiliznd aceeai interogaie pe motoare de cutare diferite, sau s
identificai aceleai adrese utiliznd ns interogaii diferite pe acelai motor de cutare. Cteva
reguli generale desfurate mai jos v pot ajuta la cutarea informaiei dumneavoastr n Internet.
1. Formulai interogaii ct mai scurte i utilizai cuvinte-cheie. Este necesar s reinei
faptul c un calculator, nu o persoan, va analiza ceea ce a-i supus examinrii/cercetrii.
Supunnd cercetrii interogaii lungi precum A vrea sa tiu cine a fost Homer va zpci
munca motorului de cutare i va duce la rezultate neplcute. O formulare mult mai adecvat
poate fi simpla introducere a numelui lui Homer i eventual a domeniului istorie antic, pentru c
altfel riscai s primii informaii despre detergentul Homer sau staiunea balneoclimateric
Homer.
2. Utilizai operatori logici pentru a va formula interogaia. Operatorii sunt reguli sau
instruciuni speciale folosite ntr-o cutare pe baz de cuvinte cheie, pentru a formula ntrebri
sau cereri. Cutarea pe baz de cuvinte cheie se ncepe prin scrierea unui cuvnt n caseta "search

box" a paginii "home" a motorului de cutare. Pentru a construi o cerere, se pot folosi operatorii
adecvai din motorul de cutare n care se desfoar sesiunea de lucru.

Alte modaliti performante de cutare avansat


Unele motoare de cutare v ofer posibilitatea de a implementa o cutare avansat prin
intermediul selectrii opiunilor din meniurile existente sau prin clic pe butoanele radio. Aceste
opiuni pot fi foarte uor de folosit, fiindc permit cutarea avansat fr intrarea n operatorii
logici, ba mai mult, motoarele de cutare cer specificarea parametrilor de cercetare i n mod
automat va aplica o mulime din aceti parametri. Deci, putei implementa o cutare avansat
doar lund o serie de decizii bazate pe informaia pe care ncercai s o gsii.
Lycos este un exemplu de motor de cutare care v ofer posibilitatea unei cercetri
performante. Mai jos sunt exemplificate cteva din alternativele de cutare gsite prin
intermediul acestui motor de cutare.
Any of the words (oricare dintre cuvinte): Selectai din meniu "Any of the words" i
introducei unul din termenii care dorii s apar pe paginile Web selectate de motorul de cutare.
Spre exemplu, dac suntei n cutarea "Chico Zeppo", lista rezultatelor cercetrii poate include
documente menionnd doar unul dintre faimoii frai. Vei observa c documentele referitoare la
ambii frai vor fi mai spre sfritul listei.
Natural Language Query (ntrebare natural): Aceast opiune permite adresarea
ntrebrilor ce necesit rspunsul exact aa cum ai dori s-l cptai n urma unei conversaii cu
o alt persoan. De exemplu: Cine este preedintele S.U.A.? Pentru ca Lycos s v ajute n
cutarea paginilor ce ar putea rspunde la ntrebare, vei tipri: Cine este preedintele S.U.A.?
n cutia destinat 6 interogaiilor, iar apoi vei selecta Natural Language Query din meniu.
Exact Phrase (fraz exact): Atunci cnd selectai opiunea "Exact Phrase" din meniu,
cuvintele pe care le specificai trebuie s apar alturat, i n ordinea pe care o dorii. Frazele
exacte se utilizeaz n cazul n care suntei n cutarea numelor proprii. Advanced Options
(Opiuni Avansate)
Look for (Caut). O serie de butoane radio v permite selectarea tipurilor de documente
sau fiiere pe care dorii ca motorul de cutare s vi le afieze. Exist ns posibilitatea ca
motorul s caute orice coninut, ns putei selecta imaginile int, sunetele, reetele, Topul 5%
din listele de coninut Lycos, paginile Web personale sau informaia din Lycos City Guides.
Search the (Caut). O alt cale de a gsi informaii referitoare la o anumit topic,
este aceea de a cuta cuvintele-cheie n zonele specifice ale unei pagini Web sau doar n paginile
unui singur site. n lipsa lor, Lycos va cuta documente ce vor corespunde interogaiilor i va
cuta acele documente n mai multe site-uri Web. Butoanele radio autorizeaz urmtoarele
abordri alternative: Title only (doar titlul): Concentrai-v numai asupra paginilor care conin
frazele voastre n titlul paginii. Aceast abordare funcioneaz bine, deoarece majoritatea
webmaster-ilor se refer la tematica paginilor sau la denumirile documentelor acestora. URLs

only (doar adresa): ceast trstur se potrivete textului din URL-ul documentului. URL-ul
include numele serverului i calea complet spre document. Selected Web site (selectarea unei
anumite pagini Web): V permite s v orientai cutarea spre un anumit site Web, n cazul n
care deja avei idee de tipul informaiei pe care v ateptai s o gsii la destinaie. Aceast
opiune va permite s creai o ntrebare care va examina paginile numai n acel domeniu al
Internetului pe care l specificai. Putei indica fie denumirea complet a site-ului
(www.lycos.com), fie denumirea parial (lycos). Select a language (selectarea limbii): Putei
limita lista rezultatelor, specificnd limba n care dorii s apar documentele.
Sort your results (sortarea rezultatelor): Multe din cutrile din Web v vor returna sute,
chiar mii de rezultate. Pentru a v ajuta s gsii informaia necesar, Lycos v permite s
selectai rezultatele n aa fel, nct s primii informaia cea mai relevant n partea de sus a foii.
Acest lucru poate fi fcut utiliznd opiunea "Relevancy controls".
Match all words (ordonarea clasificat): Dac aceast opiune este setat la High, atunci
ea v asigur c documentele care conin toi termenii cerui de voi vor aprea la nceputul listei
cu rezultate. 7
Frequency of words (frecvena cuvintelor): Aceast opiune compar frecvena unui
cuvnt ntlnit ntr-un anumit document cu numrul mediu de apariii n care acelai cuvnt se
ntlnete n fiecare document gsit de Lycos. De exemplu, dac cuvntul "computer" apare n
medie de 10 ori n toate documentele din catalogul Lycos, atunci documentele n care acelai
cuvnt se ntlnete mai puin de 10 ori vor fi mai puin relevante, pe cnd documentele n care
acest cuvnt se ntlnete mai mult de 10 ori vor fi mai relevante. Prin sporirea importanei
acestei opiuni, paginile care se refer la termenii de cutare pot fi plasate la nceputul listei cu
rezultate.
Near beginning of text (aproape n text): Uneori persoanele care creeaz site-uri Web nu
plaseaz textul important n titlul sau n denumirea documentelor. Totui, este bine ca o pagin
Web dedicat, spre exemplu, Premiilor Oscar, s menioneze numele statuii de aur n primele
aliniate ale textului. Sporind importana acestei opiuni, Lycos nelege c voi dorii ca toate
documentele care corespund termenilor de cutare s apar aproape de nceputul listei cu
rezultate.
Close Together (cuvinte legate): O mulime de site-uri Web dedicate televiziunii pot
conine cuvintele Baywatch i "Star" pe aceeai pagin. Dac suntei ns interesai numai de
"The Stars on Baywatch," cele mai bune rezultate le vei primi dac aceste dou cuvinte se vor
gsi unul lng altul. Ajustarea valorii pentru opiunea dat indic importana pe care o acordai
apropierii termenilor de cutare. Setnd o valoare mai nalt pentru aceast opiune, documentele
corespunztoare vor aprea la nceputul listei cu rezultate. Aceast opiune nu are efect atunci
cnd selectai Exact Phrase din meniu sau cnd cutai numai un singur cuvnt.
Appear in title (apare n titlu): Lycos tie cnd termenii cutrii apar n codul paginii Web
ca titlu. Acesta este textul ce apare deasupra meniului browser-ului d-voastr. Selectnd o
valoare mai mare pentru opiunea dat, Lycos nelege c suntei interesat de paginile Web n care
textul introdus de d-voastr apare n titlu sau denumire.

In Exact Order (n ordinea exact): Aceast opiune caut cuvintele care apar n ordinea
n care le-ai introdus. Ea v poate ajuta s gsii informaia exact pe care o cutai
Lycos este un motor de cutare care permite utilizarea meniurilor i butoanelor radio
pentru a beneficia de opiunile avansate de cutare. Infoseek, Hotbot i Yahoo includ opiuni
avansate de cutare similare.
Seciunile consultative Help a motoarelor de cutare. n general, motoarele de cutare
dispun de seciuni Help care v ofer informaii referitoare la modul de construire a unei
interogaii. Informaia din seciunea Help este, de multe ori, dedicat unor anumite motoare de
cutare i poate sau nu poate fi aplicabil altora.
NOT:
1). Marcai cu Bookmark (sau Favorites), fiecare instrument de cutare preferat, pentru a facilita
utilizarea ulterioar. De asemenea, marcai i unele "home pages" folosite des i care au nume
lungi i complicate.
2). Unele instrumente de cutare ofer opiuni de cutare n diferite domenii i categorii, care v
ajut s limitai focalizrile n cutarea d-voastr. Selectnd una sau mai multe dintre aceste
opiuni, putei s mrii relevana potrivirilor din cutare. Aceste opiuni sunt scrise, de obicei,
lng casetele de cutare.
3). Pot fi cazuri cnd un instrument de cutare nu se conecteaz la o locaie Web, dintr-un anumit
motiv: - ai uitat s scriei sau ai scris greit un cuvnt n adres, aa c verificai! - exist
probleme la accesarea locaiei, ori chiar locaia este deconectat, din diverse motive. n astfel de
cazuri, revenii mai trziu. - locaia a fost deconectat definitiv, dar s-au pstrat anumite legturi.
Uneori exist trimiteri ctre noua locaie a documentului.
4). Folosii seciunea de Help a mecanismelor de cutare pe care le utilizai cel mai des.
5). La cutrile pe baz de cuvinte cheie, cel mai bine este s formulai cereri n concordan cu
mecanismul de cutare particular pe care l utilizai. Aceasta presupune o bun cunoatere i
nelegere a regulilor de formulare a cererilor. O cerere bine formulat este hotrtoare pentru
relevana rspunsurilor i reduce numrul de potriviri necorespunztoare.
6). Un numr extraordinar de mare de potriviri se datoreaz unei cereri de cutare pe baz de
cuvinte individuale, de aceea este bine s folosii cuvinte legate ntre ele, ca un cuplu de cuvinte.
7). Unele locaii Web conin multe elemente grafice pe care nu le putei omite. n cazul n care
calculatorul vostru efectueaz transferul prea ncet, este mai bine s folosii instrumente de
cutare care nu au prea multe elemente grafice. Printre acestea sunt: Hotbot, Infoseek i Mamma.
Cu multe imagini grafice sunt LookSmart i OneKey.
8). Cnd formulai o cerere, ncercai s folosii cuvinte obinuite, exceptnd cazurile n care
trebuie s apar cuvinte sau sintagme speciale. Altfel, vei obine un numr enorm de potriviri.
De exemplu, "soldat" este prea comun, pe cnd "soldat roman" este o sintagm acceptabil.

Motoarele de cutare sunt probabil cea mai utilizat cale de accesare a informatiei stocate
n bazele de date Web. Principalii pai necesari pentru a utiliza eficient un motor de cutare sunt
urmtorii:
1. Formulati-v atent nevoia de informare. ncercati s faceti aceasta ct mai simplu i
specific cu putint;
2. Spargeti cererea de mai sus ntr-o serie de termeni de cutare;
3. Gsiti sinonime pentru fiecare termen identificat;
4. Atunci cnd este posibil, recurgeti la fraze (termeni specificati n ghilimele);
5. Combinati sinonimele termenilor de cutare prin intermediul operatorului OR i legati
aceste combinatii prin intermediul operatorului AND;
6. Analizati circa 30 de rezultate nainte de a cuta din nou;
7. Dac este posibil, nainte de a rencepe cutarea, folositi pagini cu informatie similar
celei cutate pentru a identifica noi termeni de cutare i sinonime ale acestora.

S-ar putea să vă placă și