Sunteți pe pagina 1din 7

Regsirea informa iilor.

Aspecte generale
Lector univ. dr. Rodica Mandeal
Abstract: The article is an attempt to review how does information retival work. The base model of the retrieval process including the User sequence- the users need for information, formulating a search strategy and a query- and the Database producer secquence- selection of the information sources, creation of the content of individuals records, query processing- and also the three primary classes of groups involvd in the process of information retieval are discused. Key-words: Information Retrieval, Information Retrieval System, Databases Producer, Users, Search Strategy, Query, Information Need.

Regsirea informa iei este n primul rnd un proces de selectare. n mod succint, prin sintagma ,,regsirea informa iei n elegem identificarea informa iei dorite dintr-un stoc/colec ie de informa ii iar acest proces con ine implicit conceptul selectivit ii. Deci regsirea informa iei este n primul rnd un proces de selec ie. Recuperarea informa iilor nu nseamn acelai lucru cu regsirea lor. Activit i ca urmrirea unui program de tiri la televizor sau copierea unui fiier nu sunt activit i de regsire, deoarece spectatorul sau cel care copiaz fiierul nu are nici un control asupra con inutului informa iilor pe care le va ob ine. Regsirea informa iei este un proces de comunicare indirect ntre autorii unui mesaj, indiferent de forma de prezentare, respectiv ntre creatorii unor nregistrri (text, imagine, sunet) i utilizatorii informa iilor con inute n acest mesaj. Mesajele transmise de autori ajung la utilizatori dup o perioad relativ lung de timp; ele vor trebui, din aceast cauz, s fie prelucrate pentru o utilizare ulterioar fr a se cunoate a priori cine le va citi i n ce circumstan e. Alturi de cei doi actori principali ai acestui proces de comunicare autorii i utilizatorii sunt implica i direct sau indirect cei care decid ce aspecte ale mesajelor vor fi reprezentate n nregistrri, cei care prelucreaz informa ia pentru a crea nregistrarea, cei care ajut utilizatorul s desfoare o cercetare, cei care proiecteaz i implementeaz programele de calculator, precum i cei care decid ce servicii vor oferite utilizatorilor i n ce condi ii.
66

Cel mai bun exemplu de organiza ie/institu ie conceput pentru a regsi informa ia este un centru de informare (bibliotec sau centru de documentare). Nimeni nu intr ntr-o bibliotec pentru a citi ntreaga colec ie de documente, ci doar pentru a cuta ceva selectiv care de cele mai multe ori va satisface un set de nevoi de informare foarte personalizat. Sintagma regsirea informa iei, aa cum a fost utilizat prima dat n anul 1957, n Anglia era sinonim cu cercetarea literaturii tiin ifice, respectiv a fost definit ca procesul de cutare ntr-o colec ie de documente (termenul document fiind acceptat n sensul cel mai larg) pentru a identifica pe cele care trateaz un anumit subiect sau rspund la o anumit ntrebare; n consecin orice sistem proiectat s faciliteze aceast activitate poate fi numit sistem de regsire a informa iei. Regsirea informa iei nu este o activitate legat strict de calculator. Principiile ei s-au aplicat cu mult nainte de a fi fost inventate calculatoarele i astzi, uneori, aceast activitate se desfoar fr asisten a lor. Cutarea ntr-un index tiprit, ntr-un catalog tradi ional sau ntr-o enciclopedie pot fi considerate tehnologii mai vechi ale aceleiai activit i. Totui sintagma ,,regsirea informa iei este n prezent utilizat pentru a descrie procesul cutrii i identificrii informa iilor care au anumite atribute ntr-o baz de date, proces asistat de calculator, i desfurat ntr-un mod interactiv. Deoarece ini ial fiierele bazelor de date con ineau nregistrri descriptive ale documentelor text, pn n anii 90, problema central a procesului de regsire a informa iei era considerat cea a modului n care documentele erau reprezentate pentru a fi regsite (respectiv problema indexrii i a vocabularului controlat). O dat cu apari ia bazelor de date con innd textul complet al documentelor, precum i a utilizrii crescute a limbajului natural n ecua iile de cutare, punctul cheie al procesului a devenit compararea sau punerea n rela ie a cererii de informare cu textul stocat n baza de date. Totui, dac considerm c ecua ia de cutare nu este altceva dect reprezentarea documentului pe care dorim s-l regsim, putem s apreciem c formularea acesteia rmne o chestiune de importan major n ob inerea rezultatelor dorite de utilizator. Dificult ile pe care le implic procesul de regsire se datoreaz de fapt, ncercrii de a compara nevoile de informare ale utilizatorilor cu mesajele pe care autorii doresc s le transmit. Majoritatea mesajelor sunt transferate sub forma unor texte, iar nevoile de informare sunt reprezentate prin cereri de informare. Procesul cutrii selective a informa iei ntr-o baz de date implic dou abordri diferite:
67

a) Un punct de plecare este utilizatorul sau poten ialul utilizator al informa iei, adic o persoan care are nevoie de informa ii i care utilizeaz un sistem de regsire a informa iei pentru a-i satisface aceast nevoie. b) La cellalt capt, o organiza ie, productorul bazei de date, de exemplu, care ia decizia colectrii, organizrii i stocrii informa iei pentru o regsire ulterioar. Productorul bazei de date creeaz, n acest scop, nregistrrireprezentri ale textelor/documentelor (care pot fi reproduceri exacte, pr i din texte sau alte forme construite de oameni sau computer), le stocheaz i pune la dispozi ie dispozitive, instrumente care permit cutarea n baza de date. n cazul informa iei electronice ,,dispozitivul este un set de programe. Productorul creeaz, de asemenea, i reprezentri ale cererilor de informare naintate de utilizatori pe care le compar apoi cu nregistrrile stocate n baza de date, regsind acele reprezentri ale documentelor care corespund reprezentrii cererilor. Problema care apare de regul const n faptul c documentele pot s nu fie reprezentri perfecte ale mesajelor (ceea ce dei este o problem de comunicare nu intr sub controlul unui sistem de regsire a informa iei), iar reprezentrile acestor documente pot s nu reflecte cu exactitate con inutul documentelor (de exemplu, din cauza indexatorilor sau a limbajelor de indexare). n mod identic cererile de informare sunt rareori reprezentri fidele ale nevoilor de informare, iar ecua iile de cutare pot s nu reflecte univoc i precis, cererile de informare. Etapele procesului de regsire a informa iei nceputul oricrui proces de regsire a informa iei, dar i succesul acestui proces pleac de la recunoaterea de ctre utilizator a unei nevoi de informare, adic lipsa unor date, informa ii, cunoatere. Pentru a-i satisface aceast nevoie, utilizatorul face al doilea pas i i exprim aceast nevoie printr-o cerere de informare, cu ajutorul unui intermediar un specialist n informare- (ntr-o anumit msur aceast func ie poate fi asigurat de un program de calculator). Exprimarea nevoilor de informare este indicat s se fac ntr-un limbaj pe care att intermediarul, ct i utilizatorul l cunosc deci n limbaj natural, pe ct posibil nencrcat de jargoane tehnice i nu n coduri, descriptori sau cuvinte cheie. Dac aceast etap de comunicare interuman nu decurge bine ntregul proces de regsire va fi compromis. A treia etap a procesului de regsire const n elaborarea unei strategii de cutare, adic n stabilirea unui plan general de regsire a
68

informa iei dorite. Strategia de cercetare poate fi elaborat la diferite nivele, ns foarte mul i specialiti subliniaz importan a aspectelor explicite i detaliate ale strategiei de cutare. Urmtoarea etap, formularea ecua iei de cutare, const n exprimarea precis a nevoii de informare n termenii specifici sistemului de regsire. Exist dou aspecte importante ale acestei etape: a) atribuirea de termeni, cuvinte, coduri, utilizate deja n descrierea nregistrrilor existente n baza de date i pe care utilizatorul dorete s le regseasc; b) legarea logic a diferitelor seturi de valori. Formularea ecua iei de cutare const n alegerea termenilor de indexare, reprezentnd con inutul cererii de informare i corelarea lor logic sau, o dat cu dezvoltarea programelor de interogare, poate reprezenta con inutul real i nu ,,tradus al documentului pe care dorim s-l regsim. n concluzie, este important s re inem c atunci cnd ne referim la regsirea informa iei electronice, calculatorul proceseaz ecua ia de cutare i nu exprimarea nevoii de informare (adic cererea de informare) sau nevoia real de informare. n ceea ce privete ieirile dintr-un sistem de regsire a informa iei acestea pot fi diferite: referin e bibliografice (titlul, autorul, sursa, de exemplu) nso ite sau nu de un rezumat sau o list de termeni prin care a fost indexat documentul; informa ii faptice sau aa numitele referin e rapide, date numerice care dau rspunsul direct la o anumit ntrebare; textul ntreg al unui document sau paragrafe ale acestui text n care apar combina ii ale unor cuvinte (frecvent ntlnite n domeniul juridic). Utilizatorii unui sistem de regsire a informa iei Dei n principiu, oricine poate utiliza un sistem de regsire a informa iei, exist 3 categorii de persoane care se implic n procesul regsirii: specialitii n informare, utilizatorii finali i utilizatorii nceptori. a) Specialitii n informare Un specialist n informare n aceast ipostaz, cea de utilizator, este o persoan care ofer un serviciu de informare, respectiv i asist pe al ii s gseasc informa ia de care au nevoie. Mult vreme aceast profesie a fost identificat cu cea de intermediar obligatoriu ntre utilizatori i sistemele de regsire. n aceast categorie intr i brokerii de informa ii, denumire care deriv din faptul c aceti specialiti nu creeaz informa ii pentru clien ii proprii, ci doar le gsesc i eventual le interpreteaz. Indiferent de rolul pe care l joac n procesul regsirii informa iei acest tip de utilizator are, n general, o cunoatere asupra:

69

- tipurilor de informa ii accesibile n disciplina sau specialitatea n care lucreaz (drept, medicin, finan e etc) i a organismelor de informare care le ofer; - terminologiei specifice domeniului pentru care ofer asisten ; - metodelor de comunicare/dialog cu cel cruia i ofer serviciul pentru a eviden ia nevoia de informare i a o exprima; - procedurilor de utilizare a sistemelor de regsire relevante pentru satisfacerea acestor nevoi. b) Utilizatorii finali. Ini ial sistemele de regsire a informa iei au oferit servicii utilizatorilor doar printr-un intermediar. O dat cu rspndirea larg a calculatoarelor personale, utilizatorii finali au nceput s devin importan i pe aceast pia din dou motive: - PC-urile permit utilizatorilor finali s utilizeze direct serviciile on-line de regsire a informa iei; - Centrele de informare ofer servicii de regsire on-line din ce n ce mai diversificate, pia a fiind practic saturat la sfritul anilor 90 (evident ne referim la rile dezvoltate). O prim caracteristic a acestor noi veni i pe pia a serviciilor de informare on-line este aceea c fac parte din profesii, discipline sau industrii foarte dependente de informa ie (arhitec i, medici, avoca i, oameni de afaceri, oameni de tiin sau tehnologi, jurnaliti). Membrii unor astfel de grupuri profesionale au abilit i n interpretarea informa iei din propriul domeniu, de care mul i intermediari sunt lipsi i i anume recunoaterea imediat sau evaluarea unei informa ii noi, precum i capacitatea de a face asocia ii surprinztoare ntre nevoile lor de informare i informa ii aparent fr nici o legtur. O alt caracteristic este aceea c nu to i utilizatorii finali au experien a lucrului cu calculatorul i cunoaterea mecanismelor de cutare i regsire a informa iei. c) Utilizatorii nceptori. Acest grup const n principal din elevi sau studen i n primii ani de studii care nu au grad ridicat de cunoatere a unui domeniu, anume, a mecanismelor de cutare i probabil nici competen e pentru a face evaluri ale informa iei regsite. Componentele unui sistem de regsire a informa iei Sistemele de informare reprezint un complex de metode i echipamente i programe pentru prelucrarea i nmagazinarea informa iilor n scopul regsirii lor ulterioare. Obiectivul unui sistem este deci regsirea informa iilor solicitate de utilizatori n legtur cu diferite subiecte, mai
70

specifice sau mai generice, dintr-un anumit domeniu, sau, cu alte cuvinte, de a efectua cercetri ale literaturii. n urma efecturii unei asemenea cercetri, sistemul pune la dispozi ia utilizatorilor care au adresat cereri de informare, o list de adrese (referin e bibliografice) ale documentelor de interes probabil pentru tema solicitat. Exist i sisteme care furnizeaz chiar documentele ca atare sau diverse forme prescurtate ale acestora (referate) sau informa iile extrase din textul documentelor. n majoritatea acestor sisteme, informa iile sunt analizate i prelucrate pe principiul indexrii coordonate, n care baza intelectual o reprezint bagajul termenilor de specialitate ce constituie terminologia de indexare i regsire. Dat fiind faptul c folosirea limbajului de specialitate aa cum este el utilizat de autori n documente (limbaj natural) ridic multe probleme sistemele folosesc un limbaj normalizat (controlat) pentru a indexa documentele i a formula ecua iile de cutare. Principalele componente ale unui sistem de regsire a informa iilor sunt: - subsistemul de selec ie a documentelor; - subsistemul de indexare; - subsistemul vocabularului; - subsistemul de cutare; - subsistemul de interac iune ntre utilizator i sistem (interfa a utilizator-sistem); - subsistemul de comparare, adic subsistemul care compar reprezen-trile documentelor stocate cu reprezentrile cererilor de informare. n anumite privin e subsistemul de comparare poate fi considerat cel mai pu in important dintre cele ase subsisteme deoarece nu are o influen direct asupra eficacit ii sistemului respectiv, asupra capacit ii de regsire a documentelor care satisfac nevoile de informare ale utilizatorilor. Cu toate acestea, eficien a subsistemului de comparare exercit o influen relativ ridicat asupra aspectelor economice i asupra eficien ei generale ale sistemului, msurate spre exemplu, n timpul de rspuns. n majoritatea sistemelor, calculatorul nu contribuie n mod direct la selectarea documentelor, la controlul selec iei, la indexarea i cutarea documentelor, la pregtirea strategiilor de cutare sau la interac iunea cu utilizatorii sistemului cum ar fi spre exemplu, n cazul ,,negocierii cererii. Acestea sunt activit i intelectuale, care intr n responsabilitatea specialitilor i care determin eficacitatea sistemului. Factorii cei mai importan i care influen eaz eficien a unui sistem de regsire a informa iilor pot fi mpr i i n dou grupe principale: - factori lega i de crearea i actualizarea bazei de date; - factori lega i de exploatarea bazei de date;
71

Principalii factori lega i de crearea bazei de date, care pot fi considera i i ,,factori de intrare sunt: - Politicile i criteriile de selec ie a documentelor ce urmeaz a fi incluse, care implic o bun cunoatere a nevoilor de informare ale utilizatorilor; - Reprezentarea complet i precis, n opera ia de indexare, a con inutului acestor documente; - Vocabularul sistemului, adecvat pentru a reprezenta subiectele tratate de aceste documente. Exist, de asemenea, ,,factori de ieire sau de exploatare a bazei de date: - Personalul sistemului de regsire care trebuie s n eleag nevoile de informare ale utilizatorilor (interac iune utilizator-sistem). - Strategiile de cutare care trebuie s reflecte ct mai bine aceste nevoi; - Vocabularul sistemului adecvat, pentru a reprezenta interesele utilizatorilor sistemului. To i aceti factori contribuie direct la eficien a sistemelor de regsire a informa iilor. De asemenea, ei sunt definitorii ntr-o anumit msur i pentru sistemele de informare propriu-zise. De multe ori, n literatura de specialitate sistemele de regsire sunt considerate ca ,,motorul sistemelor de informare.
BIBLIOGRAFIE BANCIU, D.; MANDEAL, R. Sisteme de informare Sisteme de regsire a informa iei. n: Studii de bibliologie i tiin a informrii, vol. 3 (1997). Bucureti, Editura Universit ii din Bucureti, 2001, p.18-20. CHAUMIER, J. Les techniques documentaires. Paris: PUF, 1992. GUINCHAT, C.; MENOU, M. Introduction generale aux sciences et techniques de linformation et de la documentation. Paris: UNESCO, 1990. LANCASTER, F. W.; WARNER, A. J. Information Retrieval Today. Arlington: Inforamtion Resources Press, 1993. Le COADIC, Y. F. La science de linformation. Paris: PUF, 1994. Le COADIC, Y. F. Le besoin dinformation: formulation, ngociacion, diagnostique. Paris: ADBS Editions, 1998. MANDEAL, R. Studiul utilizatorilor de informa ii. n: Studii de Bibliologie i tiin a Informrii, vol. 3 (1997), p. 25-33. MANDEAL, R. Utilizatorul i cutarea informa iei. n: Buletinul ABIR, vol. 13, nr. 2 (2002), p. 10-14. MOLES, A. A. Thorie structurale de la communication et socit. Paris: Masson, 1998.

72

S-ar putea să vă placă și