Sunteți pe pagina 1din 10

Lucrare de laborator Nr.

1
Tema 1: Localizarea informaiei n Internet. Motoare de cutare. Directoare. Recomandri simple de cutare. Cutare avansat. (4 ore). Scopul lucrrii: directoare. Familiarizarea cu motoarele de cutare. Cutare n avansat. Construirea interogrilor de cutare. Cutare

Estimarea calitii interogrilor de cutare. Tema 2: Serviciul de pot electronic (2 ore). Scopul lucrrii: Utilizarea serviciului de pot electronic. Adrese de pot electronic. Gestionarea cutiei potale.

Aspecte teoretice
Internetul este un uria depozit de informaii. Informaiile sunt localizate n cele peste 1,5 miliarde de site-uri existente n anul 2002 n reea (numrul lor se dubleaz odat la 18 luni). Marea parte a informaiei n reea este disponibil gratuit, dar sunt i destule excepii. Problema major pe care o au utilizatorii Internet este dimensiunea uria a reelei. ntrebarea care apare n mod natural cnd este vorba de cutare pe Internet este: cum gsim informaiile care ne intereseaz ?. Din pcate, nu exist nici un sistem care s asigure evidena curent a site-urilor din reea, cum ar fi cartea de telefoane sau catalogul unei biblioteci, etc. Browser este un program folosit la deplasarea (navigarea) prin paginile Web, fiind de fapt o aplicaie de rsfoire a coninutului unui server Web. Browser-ul lanseaz cererea utilizatorului ctre serverul Web i ofer documentul primit pentru utilizare. Programele de navigare cele mai cunoscute sunt Mosaic, Netscape Comunicator, Microsoft Inernet Explorer i Lynx. Programul de navigare aduce pagina cerut pe calculatorul utilizatorului, interpreteaz textul i comenzile de formatare coninute n text i afieaz pagina gata pe monitor. irurile de caractere care reprezint cuvintele cheie al documentului i legturile ctre alte documente ce conin aceleai cuvinte cheie se numesc hiperlegturi i sunt afiate n mod diferit dect restul documentului, de

obicei evideniat cu alt culoare sau subliniat. Pentru a selecta o legtur este de ajuns plasarea cursorului n zona respectiv i clicarea pe legtura respectiv. Browser- ele fac legtura ntre utilizator i Web, dar nu rezolv problema localizrii surselor ce dispun de informaiile necesare. Unica soluie pentru a rezolva problema localizrii informaiilor necesare n reeaua global este utilizarea unor servicii puse la dispoziie de ctre Internet care apar din ce n ce mai multe i mai performante. Serviciile de cutare existente pe Internet se mpart n dou mari categorii: motoare de cutare i directoare. Un motor de cutare este un server ale crui programe speciale navigheaz automat pe Internet i indexeaz toate paginile gsite, n funcie de anumite criterii. Aceste programe se numesc robots, spiders sau crawlers. Ele sunt destinate pentru a indexa (nregistra) documentele de pe Internet cuvnt cu cuvnt. Astfel, teoretic, aceste motoare de cutare vor ajunge s indexeze tot spaiul Web i deci ne putem da seama de volumul de date din baza de date al motorului. Atunci cnd un navigator transmite motorului o interogare format din unul sau mai multe cuvinte -, motorul caut aceste cuvinte n lista sa de indeci (adic n baza sa de date) i returneaz o list de adrese a documentelor susceptibile c ar conine informaia cerut. Exist o mulime de motoare de cutare pe Internet, dar cele mai cunoscute sunt: Altavista (www.av.com) Google (www.google.com) Excite (www.excite.com) HotBot (www.hotbot.com) Lycos (www.lycos.com) Webcrawler (www.webcrawler.com) Northern Light (www.northernlight.com) Cel mai cunoscut (i cel mai bun, dup prerea multora) motor de cutare este Google. Acesta indexeaz, pe lng paginile Web normale i fiiere PDF (formate cu Adobe Acrobat Reader) i chiar imagini.

Primele 2 motoare de cutare sunt cele mai apreciate din punct de vedere al rezultatelor obinute. Rezultatele sunt relevante i actualizate, deoarece spider ele lor exploreaz Reeaua cel puin odat pe lun i indexeaz site-urile noi aprute. Altavista ofer posibilitatea de cutare n 25 limbi (alegerea opiunii se face din pagina gazd), iar Google dispune de interfee pentru cteva zeci de limbi, inclusiv romn, care poate fi conectat din pagina principal. Google poate limita cutrile la documente redactate doar n limba pe care utilizatorul o indic. Chiar i atunci cnd se caut informaii redactate n alt limb dect englez, este recomandabil de utilizat aceste motoare, deoarece sunt superioare ca performan motoarelor de cutare locale. Un motor de cutare romnesc performant este GoFind (www.gofind.ro). Pentru cutare n Web-ul francofon este recomandabil motorul Voila (www.voila.fr). Cele mai utilizate motoare de cutare realizate n R. Moldova sunt www.moldova.cc i www.ournet.md Directoarele sau cataloagele funcioneaz dup un principiu diferit fa de motoarele de cutare. Un director Web este o colecie de link- uri, nsoite de anumite explicaii i mprite n anumite categorii / subcategorii. De cele mai multe ori directoarele sunt alctuite manual. Aceasta nsemn c site - urile sunt verificate de ctre o anumit persoan, dup care sunt nscrise ntr-o categorie sau alta, conform unor criterii stabilite (schem de clasificare, numit taxonomie). De aceea, informaiile din directoarele Web sunt mai puin voluminoase, dar mult mai valoroase. Majoritatea directoarelor ofer i posibilitatea de cutare direct n baza lor de date (a nu se confunda cu baza de date al adevratelor motoare de cutare). Directoarele pe Internet se mpart n dou categorii: directoare generale (sau orizontale) i directoare specializate (sau verticale). Cel mai popular director general este Yahoo (www.yahoo.com). Alte directoare generale care merit menionate sunt: About (www.about.com), Looksmart (www.looksmart.com), Dmoz (www.dmoz.org).

Pe Web-ul romnesc directoarele cele mai populare sunt: Kappa (www.kappa.ro), Acas (www.acasa.ro), Edison (www.edison.ro), Trafic (www.trafic.ro). O list cu 2600 directoare specializate, organizate pe 39 categorii, putei gsi la: GoGettem (www.gegettem.com sau www.gogettem.com). Un director cunoscut n R. Moldova este www.ournet.md Folosirea directoarelor este util atunci cnd informaia cutat se ncadreaz ntr-o categorie clar, bine delimitat. Cutarea ntr-un director se poate face n dou moduri: Mergnd direct la categoria n care se gsete informaia, dac o cunoatem, sau

Folosind cuvinte cheie, la fel ca n cazul motoarelor de cutare. Directorul ne va returna categoriile de baz unde putem gsi documente ce conin cuvintele cerute.

Grania dintre motoarele de cutare i directoare ncepe s se tearg odat ce motoarele de cutare i organizeaz propriile directoare (exemple Altavista i Google). Acestea au de obicei dou opiuni: cutare pe Web sau n director. Calitatea rezultatelor pe care ni le furnizeaz un motor de cutare depinde n mod hotrtor de calitatea interogrii utilizate. Interogrile bine formulate pot da rezultate excelente, n timp ce cele formulate anapoda vor returna liste interminabile de rezultate, care conin n mare parte documente irelevante. Iat cteva sfaturi pentru a crea interogri eficiente. 1. Este necesar de definit ct mai exact tipul informaiilor de care avei nevoie. Dac informaia pe care o cutai se refer la un domeniu vast de cercetare, atunci mprii domeniul n subdomenii mai mici i cutai informaiile pentru fiecare n parte. Pentru cutarea informaiilor despre piaa produselor auto din R. Moldova am putea diviza problema n mai multe dup careva categorii care in de prioritile noastre (cutare dup model, dup distribuitor, dup pre, etc.).
2.

Alctuii o list cu cuvinte cheie care v pot ajuta s gsii

informaia necesar. Cu ct lista este mai lung, cu att este mai bine. Formai cu cuvintele cheie fraze care definesc univoc informaia cutat. Eliminai din cutri

cuvintele cheie cu mai multe nelesuri. De exemplu, dac vom utiliza pentru interogare cuvntul piaa, rezultatele primite se vor referi att la Piaa Central din Chiinu, ct i la piaa produselor alimentare, de uz casnic, etc. n opinia specialitilor, cele mai eficiente cuvinte cheie sunt substantivele, urmate de verbe. Adjectivele i adverbele sunt mai puin utile. Prepoziiile i conjunciile sunt ignorate de ctre motoarele de cutare. 3. Nu folosii interogri alctuite dintr-un singur cuvnt. Aceasta este cea mai frecvent greeal a nceptorilor. Vei obine rezultate multe i irelevante. Cele mai eficiente interogri sunt alctuite din 3-4 cuvinte. Folosii frazele n cutare de cte ori este nevoie (dar este cazul cel mai des ntlnit de cutare). Prin fraze se nelege sintagme cu neles de sine stttor, formate din 2-3 cuvinte. (De exemplu : bursa de valori sau marketing internaional). Frazele se includ n interogare ntre ghilimele; n acest caz, motorul de cutare va returna acele documente care conin ntreaga fraz i nu doar anumite cuvinte din ea. Rezultate foarte bune se obin atunci cnd se combin o fraz cu un cuvnt izolat. (bursa de valori- Londra sau marketing internaional tehnici). Cele dou interogri vor returna informaii numai despre bursa de valori din Londra i numai despre tehnicile utilizate n marketing internaional. Dac dorim s eliminm din cutare documentele ce conin un anumit cuvnt, va trebui s introducei n interogare acel cuvnt, precedat de semnul -, fr spaiu. (De exemplu, interogarea bursa de valori SUA-New York va returna documente cu informaii despre bursele de valori din SUA, mai puin din New York. 4. Folosii operatorii booleeni n cutare. Operatorii booleeni sunt instrumente foarte puternice, care permit interogrilor s se apropie de limbajul natural, obinndu-se astfel, rezultate mai precise. Cei mai folosii operatori booleeni sunt: AND (i). O interogare de tipul <cuvnt1> AND <cuvnt2> returneaz numai acele documente care conin ambele cuvinte. Operatorii booleeni se scriu n interogare numai cu MAJUSCULE. internaional AND tehnici AND utilizare. Exemplu: marketing

OR (sau). Acest operator se folosete atunci cnd dorim s lrgim aria cercetrii, ntruct returneaz documente care conin unul sau altul din cuvintele cutate (nu neaprat amndou deodat). Operatorul OR i gsete ndeosebi utilitatea atunci cnd dorim s introducem n cutare cuvinte sinonime: cercetare de pia OR studiu de pia. AND NOT (i nu) are acelai neles ca i semnul - (minus): adic documentele care conin cuvntul sau fraza ce urmeaz dup acest operator sunt excluse din lista cu rezultate. De exemplu interogarea consulting AND NOT electronics va furniz toate documentele despre orice tip de consultan, mai puin electronic. NEAR (lng, aproape) are un efect asemntor cu AND, dar permite o precizie mai bun a cutrilor. El returneaz documentele n care cuvintele cutate se afl aproape unul de cellalt, pe aceiai pagin (pentru operatorul AND este suficient ca cuvintele s fie n acelai document, chiar i pe pagini diferite). 5. Pentru a introduce simultan ntr-o interogare toate cuvintele cheie din aceiai familie de cuvinte este util trunchierea cuvintelor cu ajutorul asteriscului (*). Spre exemplu, forma trunchiat construct ne va da documente ce conin i constructor i construcie i construiete, .a.m.d. 6. 7. La utilizarea simultan a mai multor operatori booleeni, ordinea Facei cutarea cu ajutorul a mai multor motoare de cutare. Chiar ndeplinirii lor este indicat cu ajutorul parantezelor. dac majoritatea rezultatelor vor fi aceleai, se poate ntmpla s avei i surprize plcute, adic s gsii anume acel document de care avei nevoie. Regimul de Cutare avansat este utilizat pentru ngustarea ariei de cutare i precizarea cererilor de cutare. Fiecare motor de cutare are i regimul de cutarea avansat. De exemplu, www.google.com ne faciliteaz munca de cutare a informaiilor n reeaua mondial prin oferirea urmtoarelor opiuni suplimentare opionale: 1. Definirea suplimentar a condiiei de cutare: Cu toate cuvintele

Cutare Cu fraza exact Cu oricare din cuvintele Fr cuvintele 2. Determinarea limbajului n care vor fi returnate paginile rezultante. Cutarea poate fi fcut n paginile realizate orice limb sau numai n limba specificat prin alegere din lista limbajelor propuse de ctre motor; 3. Determinarea formatului fiierelor n cadrul crora se va face cutarea. n afar de opiunea implicit n orice format vom putea alege dintr-o list stabilit i astfel preciza tipul fiierelor cutate, reducnd n aa mod att timpul de cutare, ct i numrul rezultatelor nedorite; 4. Data documentelor vom putea preciza intervalul de timp al apariiei informaiei n reea, omind documentele care nu corespund perioadei cutate; 5. Se poate preciza chiar i locul cutrii: n orice loc al paginii; Numai n titlu; Numai n textul de baz; n adres; n legturi ctre alte documente.

Utilizarea regimului de cutare avansat este un atu important n procesul de cutare a informaiei necesare n reea, care, n afar de avantajul de a micora simitor timpul cutrii, ne ofer i siguritatea obinerii unui numr rezonabil de rezultate, care, la rndul lor vor fi mult mai relevante.

Efectuarea lucrrii: 1. Alegei una dintre temele indicate mai jos, propuse pentru cutare sau stabilii o alt tem, care va fi confirmat de ctre profesor. Cutai cu ajutorul motoarelor, metamotoarelor sau directoarelor informaii recente, interesante, pertinente referitoare la tema aleas. Teme pentru cutare: 1. Piaa produselor cosmetice autohtone n R. Moldova; 2. Piaa automobilelor de import n R. Moldova; 3. Piaa vinicol n R. Moldova; 4. Piaa locurilor de munc pentru specialiti n marketing; 5. Piaa materialelor de construcie n Republica Moldova; 6. Industria hotelier n R. Moldova; 7. Activitatea turistic n R. Moldova; 8. Migraia populaiei din R. Moldova; 9. Dinamica programelor Work&Travel; 10. 11. 12. 13. 14. 15. Economia R. Moldova n anii 2006 2007; Piaa serviciilor Internet n R. Moldova; Telefonia mobil n R. Moldova. Prezena METRO n Republica Moldova Centrele comerciale ale Chiinului Restaurantele Chiinului

2. La finalizarea cutrilor elaborai un material de sintez. Materialul va fi creat n MS Word, va purta numele: Numele Prenumele Studentului i va conine: 1. Denumirea temei selectate; 2. Caracteristica succint a principalelor site-uri gsite, dup cum urmeaz: Adresa site-ului i caracteristicile de baz ale lui (tipul informaiilor plasate pe pagini, modul de amplasare n pagin, efectele utilizate; sistemul de navigare, etc.);

Gradul de satisfacere a navigatorului cu informaii pertinente; Gradul de actualitate sau noutate a informaiilor oferite de ctre site 3. Tabloul prioritilor pentru site-urile alese (top al adreselor URL n ordinea prioritilor, stabilit subiectiv de ctre student); 4. Sugestii referitoare la neajunsurile site-urilor (lips de informaii, informaii eronate sau pariale, amplasarea incomod a informaiilor n pagin, greeli gramaticale, efecte cromatice neadecvate, etc.); 3. Plasai adresele cu cele mai ample informaii referitoare la tematica aleas n lista de adrese favorite i explicai utilitatea lor. Remarcai cel mai interesant site web; 4. Cele mai calitative informaii localizate la tema aleas vor fi memorate pe discul logic n forma convenabil (pagin web, document Word, zone de text, imagini). Dosarul ce conine materialele va fi numit: Numele Prenumele Studentului 5. Utiliznd serviciul de pot electronic, trimitei pe adresa de e-mail a profesorului materialul final, sub form de ataament, pentru control i notificare (Subiect: NumePrenume Student, Nr lucrare, grupa); Informaia cea mai relevant o vei memora pe discul logic, deoarece ea va fi utilizat i la alte lucrri de laborator. ntrebri de control: 1. Care este deosebirea dintre un motor de cutare i un director ? 2. Explicai avantajele utilizrii regimului de cutare avansat n baza cutrilor efectuate.
3. Numii operaiile principale cu ajutorul crora se gestioneaz cutia potal

electronic. Rezultatul final al lucrrii: ndeplinirea integral a lucrrii de laborator la calculator, rspunsul n scris la ntrebrile de control.

S-ar putea să vă placă și