Termenul de Regsire a informaiei a aprut n anul 1952 , ns a obinut
popularitate din partea comunitii n 1961 . ntre timp, funciile de regsire a
informaiei au avansat ,au cptat un loc important n librrii, care nu mai erau vzute doar ca simple stocuri de cri, dar ca locuri unde informaia pe care o conin este catalogat si indexat. Mai trziu , acestea i-au fcut loc n toate domeniile i instituiile comunitii. Odat ce au aprut calculatoarele, au aprut i un numr imens de documente , informaii bibliografice i alte detalii care se conineau n documente. Regsirea informaiilor include toate activitile care sunt folosite n organizarea, procesarea, i accesul la informaii. Sistemul informaional ajut oamenii s gseasc informaiile de care au nevoie : texte, muzic, imagini, mesaje, video. Ca urmare, termenul regsirea informaiilor a inceput sa desemneze redobandirea informaiilor bibliografice din baze de date stocate ale documentelor unei biblioteci, spre exemplu. Regsirea informaiilor are o legtur strns att cu procesarea i organizarea, ct i cu accesul la informaii i documente de orice form sau format. Bazele de date care au scopul de a regsi informaii pot s conin texte ntrgi sau abstracte a unor documente , cum sunt , articolele de ziar, cri , dicionare , enciclopedii , statistici , documente legale , dar i informaii video , audio i imagini. Deci , bazele de date pot fi un coninut mltimedia , sau , o bibliografie. Majoritatea sistemelor de redobndire a informaiilor sunt sisteme de redobndire a documentelor, pentru c sunt fcute pentru a determina existena sau non-existena documentelor relevante pentru cerina exprimat de utilizator. Oricum, noiunea redobandirii informaiilor s-a schimbat mult dup ce fiierele cu text complet au devenit accesibile n bazele de date ale bibliografiilor. Cu toate c noiunea originala a sistemelor redobndirii de informaii nsemn redobndirea documentelor ce conineau texte, astfel nct ele se ocupau cu organizarea documentelor de tip text, multe sisteme moderne de acest gen sunt fcute pentru redobndirea informaiilor de orice format, fie audio, video, imagini sau text. Ca urmare a naturii specifice a informaiilor de tip multimedia, acestea au determinat elaborarea unor instrumente i tehnici specifice n domeniul redobndirii informaiilor. Sistemele moderne de regsire a informaiilor se ocup cu stocarea, organizarea i accesul la informaii de tip text, ct i resurse de informaii multimedia. Cu toate c , la nceput , sistemele de regsire a informaiilor erau concepute pentru redobndirea informaiilor textuale i bibliografice dintr-o baz de date, n prezent, folosim sistemele de redobndire a informaiilor in aproape orice aspect al vieii, spre exemplu : pentru a regsi um mesaj trimis prin e-mail sau SMS , trimis sau primit la o data specific , pentru a gsi ceva sau pe cineva pe web, pentru a cuta o carte ntr-un catalog online a unei librrii digitale i n multe alte situaii .
Sistemul de regsire a informaiei este caracterizat de urmtorii factori :
- autorul prezint un document care conine un set de idei , folosind un set de concepii ;
- unii utilizatori au nevoie de aceast informaie , dar nu sunt in stare s-o identifice ;
- sistemele de recuperare a informaiilor potrivesc ntre ele ideile formulate de autor n text cu cerinele i necesitaile formulate de utizatori.
Sistemele de recuperare a informaiei lucreaz ca nite poduri ntre lumea creatorilor i generatorilor de informaie i lumea utilizatorilor acestor informaii. Unii comentatori ai cercetrilor spun c recuperarea informaiilor este un proces de comunicare. Regsirea informaiilor se face cu ajutorul motoarelor de cutare. Un motor de cutare este un program care acceseaz internetul n mod automat i frecvent i care stocheaz titlul, cuvinte cheie i parial chiar coninutul paginilor web ntr-o baz de date. n momentul n care un utilizator apeleaz la un motor de cutare pentru a gsi o anumit fraz sau cuvnt, motorul de cutare se va uita n aceast baz de date i n funcie de anumite criterii de prioritate va crea i afia o list de rezultate. Cele mai utilizate motoare de cutare sunt considerate : GOOGLE , YAHOO , BAIDU , BING i ASK .
GOOGLE: a fost nregistrat pe 14 Septembrie 1997 de Larry Page i Sergey Brin, doi studeni, a Universitaii Stanford, din California. Google este unul dintre cele mai bune portaluri existente, cu vaste posibilitati de cutare, chiar si in limba romn. Misiunea Google este de a oferi cea mai bun experien in cutarea pe Internet fcnd informaia public lumii, accesibil i folositoare. Google, dezvoltator al celui mai mare motor de cautare din lume, ofer cel mai rapid si uor mod de a gsi informaii pe web. Prin accesarea a mai mult de 1,3 miliarde de pagini, Google ofer rezultate relevante ctre utilizatori, in mod obinuit in mai puin de jumtate de secund. Azi, Google rspunde la mai mult de 100 de milioane cutari pe zi.
YAHOO Yet Another Hierarchical Officious Oracle: A fost creat n 1994 n campusul Universitii Stanford, California de doi studeni : David Filo i Jerry Yang, iniial pentru a putea ine evidena link-urilor WWW cu informaii folosite pentru elaborarea lucrrii de doctorat. A fost lansat la nceput sub denumirea de Jerry and Davids Guide to the World Wide Web ns a fost redenumit ulterior YAHOO acronim pentru Yet Another Hierarchical Officious Oracle. n toamna lui 1994 site-ul a fost accesat ntr-o singur zi de 100.000 de vizitatori. n 1995 s-a fondat Yahoo! Inc. care a ajuns astzi s fie accesat lunar de peste 350 milioane de utilizatori, fiind al doilea motor de cutare, dup Google.
Motoarele de cautare se impart in trei categorii : 1.Motoarele care au propia lor baza de date 2.Motoarele care folosesc bazele de date ale unor alte motoare 3.Motoarele care folosesc atit propria baza de date cit si pe cele ale altor motoare
Sistemele de recuperare a informaiilor lucreaz cu diferite surse de informaie i cerine ale utilizatorilor, ele trebuie : S analizeze sursele de informaie, ct i cerinele formulate de utilizatori. S le potriveasc itemii comuni folositori pentru recuperarea informaiei. S gseasca arealele principale de surse folositoarea pentru a satisface necesitaile informaionale ale grupei-int de utilizatori. Aceasta este o sarcin provocatoare, deoarece practic oricine din utilizatorii web pot deveni poteniali utilizatori a unui sistem de regsire a informaiilor online. S analizeze coninutul sureselor permanent, o sarcin foarte complex, innd cont c volumul si varietatea surselor crete rapid pe internet. iii.
S recupereze informaia relevant, un ntreg set de instrumente i tehnici sunt folosite pentru a determina relevana informaiilor oferite i rangul lor de relevan.
S fac schimbri permanente n toate aspectele sistemului, lund n consideraie dezvoltarea rapid a tehnologiilor de informaie i comunicare, innd cont de necesitile de informare si ateptri.
Sistemele de regsire a informaiei sunt compuse din 6 subsisteme: Subsistemele documentelor Subsistemele indiciilor Subsistemele vocabularelor Subsistemele cutrii Subsistemele interfaei utilizatorului Subsistemele potrivirii
Caracteristicile aciunii de regsire a informaiei sunt : Prezentarea promt a informaiei Filtrarea informaiei Dispunerea unei cantiti corecte de informaiie la timpul potrivit Activarea schimbuului de informaii Expunerea informaiei n forma potrivit Obinerea informaiei n mod economic Literatura curent
Evoluia sistemelor de recuperare a informaiilor poate fi vzut din dou perspective: Viziunea computer-centrat, care vizeaz construirea unor centre de stocare computerizate , care se focuseaz pe construirea unor mecanisme de acces destul de eficiente, procesarea cerinelor i livrarea rezultatelor cutrii mult mai rapid. Viziunea utilizator-centrat care vizeaz studierea comportamentului informaional uman, nelegerea necesitilor umane, folosirea contextual a cuvintelor, i aa mai departe. Se crede c specialitii din domeniul informaional trebuie s cunoasc att metodele ct i instrumentele tradiionale de regsire a informaiilor, din cel puin dou motive, n primul rnd ele arat evoluia procesului de regsire a informaiilor de la raft pn pe web, n al doilea rnd deoarece n acest caz roata a fost inventat de dou ori, procedeele moderne de regsire a informaiilor avndu-i rdcina n tehnicile de funcionare a librriilor.