Sunteți pe pagina 1din 13

TEHNOLOGII ALE INFORMARII ȘI

COMUNICĂRII

Coordonator:

Lector univ. dr. BORS SILVIU

Student, master- Prof. documentarist

CHIVEREANU ( STURZEANU ) DANIELA

An II (2017-2018)

1
Cum functioneaza

motoarele de cautare

1. Motor de căutare

Un motor de căutare este un apelabil programcare accesează Internetul în mod automat și


frecvent și care stochează titlul, cuvinte cheie și parțial, chiar conținutul paginilor web într-o bază de
date. În momentul în care un utilizator apelează la un motor de căutare pentru a găsi o informație, o
anumită frază sau un cuvânt, motorul de căutare se va uita în această bază de date și, în funcție de
anumite criterii de prioritate, va crea și afișa o listă de rezultate (engleză: hit list ).
Problema nu este deloc trivială, deoarece:
 există deja peste 100 milioane de situri web, sumând în total miliarde de pagini web, distribuite
pe tot globul
 conținutul acestori pagini nu este static, ci chiar extrem de dinamic (se schimbă frecvent)
 răspunsul la o comandă de căutare trebuie să vină repede, în general în mai puțin de o jumătate
de secundă, chiar atunci când lista de rezultate conține, să zicem, zeci de mii de pagini web
potrivite la criteriile de căutare folosite.
Orice motor de căutare are trei elemente majore:
 robotul de căutare: (engleză - robot, spider sau web crawler) este un program care vizitează
paginile web, le citește și apoi urmărește legăturile către alte pagini.
Robot de căutare
 index sau catalog: unde sunt trecute informațiile despre fiecare pagină web pe care le găsește
robotul (titlul și adresa paginii, cuvinte cheie, porțiuni de text din paginile vizitate, legături către
alte pagini etc.); pentru aceasta, robotul utilizează un fișier text (robots.txt) aflat în rădăcina site-
ului care poate permite sau restricționa roboții motoarelor de căutare să acceseze paginile site-ului.
 software-ul de căutare: care permite căutarea printre multitudinea de pagini înregistrate în index
precum și afișarea rezultatului sub forma unei liste de legături, în ordinea relevanței.

Motoarele de cautare se impart in trei categorii :


1.Motoarele care au propia lor baza de date (de ex. Google si AllTheWeb - FAST)

2
2.Motoarele care folosesc bazele de date ale unor alte motoare (de ex. MSN foloseste serviciile
LookSmart si Inktomi)
3.Motoarele care folosesc atit propria baza de date cit si pe cele ale altor motoare (de ex. Yahoo
care foloseste baza de date proprie dar si pe cea a motorelor Google, Inktomi (pe care l-a cumparat) si
Overture (pe care l-a cumparat).1

Pentru crearea acestor motoare de cautare este necesar un spider (bot, spider, crawler) care este
realizat într-un limbaj care poate fi Perl, Ruby, Java, Php, Python. Acesta extrage linkurile utile. Apoi
aceste linkuri se gasesc intr-o forma prelucrata si filtrata prin metode specifice intr-o baza de date.
Printre cele mai utilizate motoare de cautare, amintim:
 Google
 Yahoo

 Judy

 Alta Vista

 MSN Search

 Yozilla

 AndStart

1.Google - Link-http://www.google.ro/
Google Inc. este o companie americana care administrează motorul de căutare pe Internet cu
același nume. A fost fondată în 1998 de către doi doctoranzi de la Universitatea Stanford, Larry Page și
Sergey Brin. Google oferă o metodă simplă și rapidă de găsire a informațiilor pe web, având o bază de
date despre peste 8 miliarde de situri web. La începutul anului 2004, Google răspundea zilnic la mai
mult de 200 milioane de consultări.
Compania a pornit cu o investiție de 100.000 de dolari care a venit din partea unuia dintre co-
fondatorii Sun Microsystems, Andy Bechtolsheim, care considera că un motor de căutare pe internet
poate revoluționa lumea.

1
http://www.startupcafe.ro/stiri-marketing-21708028-motoare-cautare-internet.htm
3
Numele Google este un joc de cuvinte de la googol, neologism pus în circulație de către
americanul Milton Sirotta în anul 1938, prin care acesta desemna numărul uriaș format dintr-un 1 urmat
de 100 de zerouri (10100).
Google dispune și de motoare de căutare pentru imagini, cărți, bloguri, grupuri de știri și directoare
web.
La sfârșitul anului 2007 a fost cotat drept cea mai puternică marcă globală, după criteriul valorii
în milioane de dolari (86057 milioane dolari SUA), dar și după modul de percepție de către utilizatori,
următoarele locuri fiind ocupate de companiile General Electric, Microsoft, Coca-Cola, China Mobile,
IBM,Apple, McDonald's, Nokia și Marlboro.,
De asemenea, conform unui sondaj realizat de Harris Interactive, Google a fost declarată, la
sfârșitul lui 2007, ca fiind compania americană cu cea mai bună reputație, mai ales datorită modului în
care își tratează angajații.
Servicii oferite
 Google Earth, imagini din satelit ale Pământului
 Google Chrome, navigator de web (browser)

 Android, un sistem de operare de tip open source pentru dispozitive mobile

 Gmail, sistem de e-mail

2.Yahoo! - link:http://search.yahoo.com/search?fr=ffds1&p=yahoo
Este un portal si motor de căutare, considerat a fi fost primul motor de căutare performant. În
prezent, oferă unele dintre cele mai populare servicii online, toate bazate pe un cont unic: un serviciu
de e-mail (Yahoo! Mail), având spatiu de stocare nelimitat, un program de conversatie pe internet
(Yahoo! Messenger), stiri (Yahoo! News), călătorii (Yahoo! Travel) si multe altele.

3.Judy.ro -http://www.judy.ro/
Google-ul romanesc Judy.ro, primul motor de cautare care da rezultate numai de pe site-uri
romanesti, este obiectul de lucru al unui specialist in softuri cu pregatire in America.
Judy.ro a fost gandit initial ca un site pentru copii, unde se gaseau informatii doar pentru aceasta
categorie de utilizatori. “Riscurile erau destul de mari, trebuia sa fim foarte atenti la criteriile de
protectie sau la accesul pe anumite site-uri nerecomandate lor. Asa ca ne-am gandit sa-l facem
generalist, pentru paginile de pe internetul romanesc”, a explicat Mircea Buza, managerul Silversoft,
initiatorul judy.ro.
4
In prezent inca se mai lucreaza la eficientizare, site-ul realizand indexarea a aproximativ 1.000 de
pagini de internet in 12 ore, un numar destul de mic avand in vedere ca exista in jur de 300.000 de
domenii achizitionate pe internetul romanesc. “Dintre acestea, cam jumatate sunt active. Noi avem un
singur spider, softul care scaneaza internetul si indexeaza paginile. Ar trebui sa investim in mai multi
spideri si in servere care sa stocheze toate datele”, a mai adaugat specialistul. Mircea Buza a explicat ca
site-ul este diferit de Google atat ca design, dar si ca principii, iar rezultatele cautarilor vor fi indeaxte
diferit. Investitia a fost estimata la 15.000- 20.000 de euro.
Exista tari unde Google nu ocupa locul fruntas in lista motoarelor de cautare, acest lucru datorandu-se
unui specific cultural sau politic al regiunii. China este, fara indoiala, una dintre acestea. Acolo
baidu.com ocupa locul 1 in topul accesarilor, iar google.com.hk ocupa locul 5. In Rusia cel mai accesat
site este yandex.ru, motor de cautare cu litere chirilice. Iar in lumea araba yamli.com este motorul de
cautare care transforma scrierea latina in litere arabe.

4.AltaVista - Link-ul Alta Vista:


http://search.aol.ru/aol/search?&query=alta+vista&invocationType=tb50winampab
Alta Vista al firmei Digital este un puternic motor de cautare atat pentru Web,cat si pentru
Usenet.
Interogarile sale sunt precise, iar cele avansate ofera posibilitatea trierii exacte a informatiei
cautate. La prima interogare, Alta Vista informeaza despre numarul documentelor gasite pentru fiecare
cuvant specificat. Apoi, afiseaza rezultatele, oferind titlul si URL-ul, primele cateva cuvinte din text,
dimensiunea fisierului, precum si data in care Alta Vista a inregistrat intrarea respectiva in baza de date.
Rezultatele primesc punctaje, fiind afisate in ordinea scorului obtinut. De regula, Alta Vista cauta doar
pe Web, dar ofera si optiunea de cautare in grupurile de stiri Usenet.
Rafinarea cautarii se face usor, cu ajutorul operatorilor logici AND, OR si NOT, completati de directiva
NEAR, care specifica un cuvant din imediata apropiere. Cautarea avansata permite limitarea
rezultatelor in functie de data, limba etc., acordarea punctajului facandu-se dupa criterii specificate.
Toate acestea fac din Alta Vista un sit excelent pentru a incepe o cautare.
5.MSN Search - Link:http://www.msn.com/
MSN Search este un motor de căutare care permite căutarea de pagini web, ştiri, produse,
grupuri (vezi MSN Groups), imagini şi enciclopedia Microsoft, Encarta.
MSN Search şi-a îmbunătăţit grafica pentru a putea să concureze cu Google şi Yahoo!.
Critică- Un URL introdus greşit în Internet Explorer duce automat la MSN Search. Acest lucru

5
este văzut de majoritatea criticilor ca o modalitate de creştere a traficului prin acest motor de căutare
.Deşi există un meniu de configurare care permite schimbarea motorului de căutare implicit în Internet
Explorer,Google , principalul competitor al MSN, nu se află în listă.
Limbi - MSN Search este disponibil în mai multe versiuni de limbă. Printre acestea se află
chineză simplificată, chineză tradiţională, cehă, daneză, engleză, estonă, finlandeză, franceză, germană,
greacă, maghiară, italiană, japoneză, coreană, letonă, lituaniană, norvegiană, olandeză, poloneză,
portugheză, română, rusă, slovacă, slovenă, spaniolă, suedeză şi turcă.
6.Yoozila, motor de cautare 100% romanesc
Un nou motor de cautare pe Internet a fost lansat zilele trecute in Romania. Yoozila, este
dezvoltat de o echipa din Romania iar directorul Yoozila International, Bogdan Hutuleac,a declarat
pentru Hit.ro ca "numele noului motor de cautare a fost obtinut din combinarea numelor: Yahoo!,
Google si Mozilla, cele mai cunoscute motoare de cautare pe Internet deoarece va fi foarte usor de
retinut."
Yoozila are implementata si functia ControlParental, cu care se poate filtra continutul pentru
adulti. Adresele de accesare sunt: www.yoozila.ro, versiunea romaneasca si www.yoozila.com pentru
versiunea internationala. Bogdan Hutuleac a mai precizat pentru Hit.ro ca pana la sfastitul acestui an,
doreste sa implementeze noul motor de cautare si in Asia, iar apoi planurile de extindere vizeaza
Franta, Germania si Statele Unite ale Americii.

7. AndStart
AndStart, este un motor de cautare romanesc care, ca si DuckDuckGo, este concentrat pe
confidentialitate sau altfel spus, este un motor de cautare care "nu va urmareste". AndStart ne ofera o
interfata de cautare simpla, rezultatele returnate nefiind pline de informatii de tot felul cum ar fi:
imagini, harti, clipuri video si nici nu ne sugereaza diversi termeni de cautare. De fapt, interfata sa
aminteste de vechile interfete ale motoarelor de cautare deja cunoscute.
Momentan, motorul de cautare se afla in stadiu de incercare (beta) ceea ce inseamna ca nu toate
caracteristicile sale sunt disponibile.2

2. Cele mai mari motoare de căutare sunt utilizate de milioane de oameni zilnic și oferă
câteva funcționalități cheie

2
https://ie2.wikispaces.com/MOTOARE+DE+CAUTARE
6
Atunci când vine vorba de motoare de căutare, majoritatea utilizatorilor nu își doresc o gamă
extrem de variată. Sunt foarte puțini cei care schimbă motorul de căutare preferat, acesta fiind și unul
dintre motivele pentru care Google a reușit să-și mențină poziția dominantă pentru atât de mult timp. În
general, trei lucruri sunt absolut necesare pentru ca un motor de căutare să aibă succes.
În primul rând, rezultatele oferite de acesta trebuie să fie relevante pentru utilizatori. Numărul
de rezultate afișate își pierde orice importanță dacă niciunul dintre aceste nu are legătură cu ceea ce o
persoană caută cu adevărat. În al doilea rând, acesta trebuie să beneficieze de o interfață extrem de
accesibilă și ușor de înțeles pentru orice tip de utilizator. Într-un final, acesta trebuie să ofere o varietate
mare de opțiuni pentru a lărgi și restrânge căutare. Cele de mai jos îndeplinesc toate aceste trei condiții,
fiind dor câteva dintre cele mai mari motoare de căutare.
Cele mai mari motoare de căutare – Google
Noțiunea de motor de căutare a ajuns similară cu Google. În Statele Unite, compania americană
cu sediul în Mountain View atrage peste 67% din căutările pe desktop și aproximativ 83% din căutările
de pe dispozitive mobile. În Europa, poziția celor de la Google este și mai dominantă, cu o cotă de piață
de peste 90%. Din acest motiv, în ultimii ani, Google a atras constant atenția autorităților de la
Bruxelles, care au pornit numeroase investigații împotriva sa.

La momentul la care Serghei Brin și Larry Page puneau bazele Google, motoarele de căutare se
bazau doar pe numărul de menționări ale cuvântului cheie pe pagina principală. Cei doi au introdus,
însă, un sistem care determina relevanța unui site în funcție de numărul de pagini și de importanța
acestora.
În prezent Google, vă poate ajuta să găsiți nu numai site-uri, ci și imagini, locații, cărți și multe
alte elemente grație numeroaselor filtre introduse. Există chiar și Google Scholar, o variantă a

7
motorului de căutare care se concentrează asupra materialelor științifice care au fost revizuite de către
cercetători sau profesori. Google Scholar este perfect pentru cei care vor să alcătuiască o lucrare
științifică și pentru cei care caută materiale pentru o dezbatere.3

Bing a apărut în anul 2009, fiind denumit până la acel moment ”msn Search”. Acesta a fost
anunțat în anul 2009 de către Steve Ballmer și se folosește de o serie de sugestii pentru a ajuta
utilizatorii în timpul căutărilor. Și Bing oferă posibilitatea de a căuta materiale video și imagini, însă un
capitol la care acesta nu poate concura cu Google sunt hărțile.

Cu toate acestea, există câteva lucruri pe care Bing le face mai bine decât Google. În condițiile
în care căutați materiale video, cursuri online, prețuri ale biletelor de avion sau fotografii care pot fi
utilizate fără a avea nevoie de licență, Bing s-ar putea dovedi mai util decât rivalul său din Mountain
View.

Cele mai mari motoare de căutare – Yahoo Search


Yahoo Search este al treilea cel mai important motor de căutare în Statele Unite. La un moment
dat, Yahoo a fost cea mai populară pagină de pornire pentru utilizatori, însă unele decizii mai puțin
inspirate au adus compania într-o situație mai puțin plăcută în anul 2000.4

3
https://playtech.ro/2015/cele-mai-mari-motoare-de-cautare-de-pe-internet/
4
https://playtech.ro/2015/cele-mai-mari-motoare-de-cautare-de-pe-internet/
8
Deși își achiziționase deja propriile motoare de căutare, Yahoo a continuat să se folosească de
serviciile celor de la Google până în anul 2004, atunci când Yahoo Search a devenit un serviciu
independent. Marissa Mayer a devenit CEO al companiei în anul 2012, fapt care a ajutat compania
Yahoo Search să-și mențină poziția pe piață, deși nu-și generează propriile rezultate organice.
Ask.com se menține printre cele mai mari motoare de căutare, în ciuda politicii agresive ale
celor de la Bing și Google. Deși se bazează pe un sistem de întrebări și răspunsuri, Ask.com oferă
aceleași funcționalități precum Google și Yahoo. În ciuda interfeței elegante și extrem de ușor de
utilizat, rezultatele furnizate de Ask.com nu sunt întotdeauna printre cele mai bune, un lucru menționat
de un număr din ce în ce mai mare de utilizatori.

Cele mai mari motoare de căutare – AOL


AOL reușește să atragă un trafic de aproape două ori mai mare decât cei de la Ask.com, însă
vremurile în care site-ul conta cu adevărat au trecut. În anul 2006, AOL a fost implicat într-unul dintre

9
cele mai ciudate scandaluri legate de confidențialitate din ultimii ani. Mai exact, companie a publicat
date private despre căutările efectuate de utilizatori.

Este vorba despre 20 de milioane de cuvinte cheie introduse de 650.000 de utilizatori pe o


perioadă de șase luni. Din câte se pare, AOL a șters informațiile după trei zile, nu înainte ca acestea să
fie copiate pe alte site-uri. Unii utilizatori au putut fi identificați, fapt dovedit chiar de către cei de la
New York Times în perioada respectivă.
DuckDuckGo este un motor de căutare cât se poate de simplu. Acesta nu este plin de reclame la
diverse produse și servicii, nu își localizează utilizatorii și afișează toate rezultatele pe o singură pagină.
Astfel, toți utilizatorii vor avea partea de aceleași rezultate pentru un termen anume, DuckDuckGo
punând accent pe credibilitatea surselor și nu pe numărul acestora.
De asemenea, în condițiile în care aveți opțiunea ”instant answers” selectată, motorul de căutare
vă va afișa răspunsuri la diverse întrebări.

Cele mai mari motoare de căutare – Yandex

10
Yandex este cel mai popular motor de căutare din Rusia, acolo unde este folosit de către
majoritatea populației. Dominația aceasta se datorează algoritmului folosit de Yandex, care este mult
mai potrivit pentru limba rusă. Fiind capabil să înțeleagă sintaxa unei propoziții pentru a afișa
rezultatele cele mai bune.
Chiar și așa, Yandex a fost nevoit să recurgă la anumite metode pentru a se proteja de companii precum
Google, astfel că în anul 2012 și-a lansat propriul browser și propria aplicație.

Baidu este cel mai important motor de căutare din China, unde are o cotă de piață de peste
50%. Baidu a devenit prima companie din China care a fost inclusă în indexul NASDAQ-100, mulți
considerând că este evaluată la o sumă cu mult peste cea reală, în ciuda rezultatelor foarte bune
obținute în mod constant.5

Traim in secolul vitezei. Ritmul de viata este ametitor si, de multe ori, simtim ca nu mai facem

5
https://playtech.ro/2015/cele-mai-mari-motoare-de-cautare-de-pe-internet/
11
fata acestui volum urias de informatii ce ne invadeaza existenta. Motoarele de cautare sunt aici sa ne
usureze viata, sa ne ajute sa triem aceasta informatie in favoarea noastra.
Tocmai pentru ca lucrurile s-au intamplat intr-un timp atat de scurt, noi, utilizatorii, am “sarit”
peste etapa de a intelege cum functioneaza motoarele de cautare si am inceput sa le folosim pur si
simplu. Ideea acestui articol pleaca tocmai de la acest aspect si, vom incerca sa explicam in continuare
de ce este important sa cunoastem modul de functionare al acestora cat si cum functioneaza efectiv.
De ce este important sa stim cum functioneaza motoarele de cautare?

 pentru ca utilizatorii le folosesc in fiecare zi

 pentru ca pot ajuta utilizatorii sa descopere mult mai usor produsele si serviciile pe care le cauta

 pentru ca afacerile online pot folosi motoarele de cautare sa-si faca mai vizibile produsele si
serviciile

Care sunt principiile de functionare ale motoarelor de cautare


Motoarele de cautare indeplinesc doua functii majore: crawleaza (scaneaza) website-
urile, construiesc o baza de date in timp real si genereaza o lista de raspunsuri relevante pentru
utilizatori.

Sa ne imaginam internetul sau World Wide Web-ul cum mai este el denumit, ca o retea de
localitati/orase. Fiecare localitate este un site web. Pentru a “descoperi” fiecare site, spiderii - sau
programele de scanare - au nevoie de drumuri, iar aceste drumuri/cai de acces sunt reprezentate de
linkuri. Structura aceasta de link-uri este cea care uneste toate site-urile, formand astfel, o retea uriasa.
In acest mod, spiderii calatoresc din site in site, aduna informatiile de care au nevoie, le
inmagazineaza si le structureaza (pentru ca ulterior sa se intoarca pe acele site-uri pentru a afla
noutatile) si apoi raspund solicitarilor utilizatorilor cu rezultate relevante. Haideti sa descoperim in
continuare ce se intampla in fiecare etapa a acestui proces.
Crawling si Indexing
Crawling-ul este prima actiune pe care o desfasoara motoarele de cautare. Spiderii scaneaza
fiecare site in parte si aduna toate informatiile relevante despre acesta: numar de pagini, titluri,
metadescrieri, imagini, cuvinte cheie, link-uri, si multe altele. Cand termina de adunat informatiile,
toate link-urile identificate sunt puse deoparte, pentru ca apoi sa fie din nou crawl-uite pentru continut
actualizat, proaspat. Este un practic un proces continuu.
12
Orice site care este legat/linkuit de alt site, va fi, la randul sau, crawlat. Daca totusi nu exista o
legatura/un link (in cazul site-urilor noi) exista si optiunea manuala de a “chema” spiderii. Aceasta
solicitare manuala poate fi folosita si de site-urile cu vechime pentru a indexa mai rapid continutul nou
creat.
Indexing-ul este procesul prin care toate datele adunate de spideri sunt sortate si plasate intr-o
baza de date gigantica. Toata aceasta baza de date va fi folosita ulterior pentru a genera utilizatorilor
rezultate relevante. Modul in care este creata acesta baza de dare este esential pentru ultima si cea mai
importanta etapa a procesului.6

BIBLIOGRAFIE

1. https://ie2.wikispaces.com/MOTOARE+DE+CAUTARE
2. https://playtech.ro/2015/cele-mai-mari-motoare-de-cautare-de-pe-internet/
3. https://playtech.ro/2015/cele-mai-mari-motoare-de-cautare-de-pe-internet/
4. http://www.startupcafe.ro/stiri-marketing-21708028-motoare-cautare-internet.htm
5. http://www.startupcafe.ro/stiri-marketing-21708028-motoare-cautare-internet.htm

6
http://www.startupcafe.ro/stiri-marketing-21708028-motoare-cautare-internet.htm
13