Documente Academic
Documente Profesional
Documente Cultură
SEARCH ENGINE
O P T I M I Z AT I O N
I R I N A TO M A
I R I N A . TO M A @ U P B . R O
CE ESTE SEO?
• SEO = Optimizarea site-
ului pentru motoarele de
căutare
• Obiectiv: îmbunătățirea
vizibilității site-ului in
rezultatele motoarelor de
căutare
Calitate – atragerea vizitatorilor care
sunt interesați de produsul reprezentat
pe site
CALITATE,
CANTITATE ȘI Cantitate – cât mai multe accesări ale
site-ului de la persoanele interesate de
REZULTATE produs
ORGANICE
Rezultate organice – trafic neplătit
care vine din rezultatele unui motor de
căutare (SERP - Search Engine Results
Pages)
R E Z U LTAT E
ORGANICE
NEVOI SEO
CUM
FUNCȚIONEAZĂ
UN MOTOR DE
C Ă U TA R E
MOTOARE DE
CĂUTARE (1)
• Obiectivul motorului de căutare este
să prezinte o serie de rezultate
relevante într-un timp scurt
• Cum căutam?
1. Type, type, type
2. Glitter, magic, unicorns
3. Poof!
4. Results
MOTOARE DE
CĂUTARE (2)
• Orice motor de căutare are în spate
mai multe crawlers care adună
informații despre termenii căutați de
utilizator din tot WWW
• Crawlers se numesc search engine
bots sau spiders
• Motorul de căutare downloadează
pagini web și accesează toate linkurile
incluse în acele pagini pentru a
descoperi noi pagini web
MOTOARE DE
CĂUTARE (3)
• Cei mai populari crawlers sunt:
– GoogleBot
– BingBot
– Slurp – bot-ul Yahoo
– DuckDuckBot – bot-ul DuckDuckGo
– Baiduspider – bot-ul de la motorul de căutare chinezesc Baidu
– YandexBot – bot-ul de la motorul de căutare rusesc Yahdex
– Facebot – bot-ul Facebook
– ia_archiver – bot-ul Amazon Alexa
MOTOARE DE CĂUTARE (4)
• Pe lângă termenii căutați de utilizator, motoarele de căutare folosesc alte date
relevante căutării:
– Locația utilizatorului – pentru căutări ca ”near me”
– Limba setată de utilizator, dacă poate fi inferată – pentru a întoarce rezultate în
acea limbă
– Căutări anterioare
– Dispozitivul de pe care a fost făcută căutarea
CRAWLING
ACCESIBILITATE (1)
• robots.txt (case sensitive) este un fișier ce specifică crawlers ce părți din site pot accesa
• Fișierul este localizat în root-ul website-ului
• Structura fișierului este:
– User-agent: [user-agent name] Disallow: [URL string not to be crawled]
• Fiecare subdomeniu al unui site folosește alt fișier robots.txt
• Avantajele folosirii robots.txt:
– Prevenirea apariției contentului duplicat în rezultatele motoarelor de căutare
– Menținerea unei părți din pagina web privată
– Prevenirea indexării unor fișiere (imagini, PDF, etc)
• În robots.txt se poate specifica sitemap-ul webserver-ului
• Mai multe detalii: https://www.robotstxt.org/robotstxt.html
ACCESIBILITATE (2)
• Un exemplu de robots.txt
– https://www.google.com/robots.txt
ACCESIBILITATE (3)
• Sitemap conține informații despre paginile și fișierele de pe un site și relațiile dintre ele
• Crawlers citesc acest fișier pentru un proces de crawling mai bun
• Într-un sitemap se specifică cele mai importante resurse pentru un site și alte informații suplimentare, ca:
– Când a fost pagina modificată
– Cât de des se schimbă pagina
– Versiuni alternative al paginii în funcție de limbă
– Prioritatea paginii în structura site-ului
– Pentru video: categorie, timpul de rulare, restricționarea accesului pentru anumite categorii de vârstă
– Pentru imagini: tip, subiect, licență
• Mai multe detalii: https://www.practicalecommerce.com/seo-include-images-and-videos-in-
sitemaps
ACCESIBILITATE
(4)
• Când avem nevoie de un sitemap
– Site-ul este foarte mare și complex
– Site-ul are multe pagini izolate sau care
nu sunt legate bine de restul paginilor
– Site-ul are foarte puține link-uri
externe care îl referă
– Site-ul conține multe imagini sau
videoclipuri
• Exemple de sitemaps:
– https://www.google.com/sitemap.xml
• Pe lângă fișierul robots.txt, există meta directive robots care dau
instrucțiuni ferme despre cum trebuie indexat conținutul unei pagini
• Meta directivele pot fi incluse in pagina HTML sau întoarse de server în
headers HTTP (x-robots-tag)
– <meta name=“robots” content=“noindex, nofollow”>
• PageRank
– Metoda de calcul pe care Google o folosește pentru a stabili autoritatea unei pagini
– Metrica asociată de Google pentru importanța unei pagini
• Link Juice
– Proprietățile (PageRank, TrustRank) pe care un backlink le poate transmite altui site
ANALIZA LINK JUICE
– https://moz.com/domain-analysis?site=cs.curs.pub.ro
ALTE METRICI
• Probleme SEO
– Într-o SPA conținutul este adăugat dinamic, folosind JavaScript
– În general, DOM-ul unei SPA este un container gol
– Crawlers nu pot accesa conținutul încărcat asincron
• Rezolvare:
SPA SEO (2) – Server-side rendering (SSR)
– Prerendering
SPA SEO (3)
• Social media SEO are impact asupra traficului organic din motoarele de căutare prin mărirea
gradului de vizibilitate al paginii
• Platformele de social media sunt considerate autorități
• Pagina va câștiga rank deoarece este referită de o autoritate
• Deși numărul de shares sau followers nu influențează rank-ul unei pagini, este probabil ca o
pagină cu număr mare de vizualizări să fie referită de pagini importante
SOCIAL MEDIA SEO (2)
• Twitter
– <meta name="twitter:card" content="summary">
– <meta name="twitter:site" content="@publisher_handle">
– <meta name="twitter:title" content="Page Title">
– <meta name="twitter:description" content="Page description less than 200 characters">
– <meta name="twitter:creator" content="@author_handle">
• Open Graph
– <meta property="og:title" content="Title Here" />
– <meta property="og:type" content="article" />
– <meta property="og:description" content="Description Here" />
• Mai multe detalii: https://moz.com/blog/meta-data-templates-123
RECOMANDĂRI
SEO – RECOMANDĂRI (1)
• Performanță
– Site-urile ce se încarcă încet sunt penalizate de crawlers
– În general crawlers au un timeout de 5 secunde
• User engagement
• Link juice, rank și diferite tipuri de scor (TrustScore, Authority Score)
ANALIZĂ
”COOKIE RECIPE”
• Primul rezultat:
– https://joyfoodsunshine.com/the-most-amazing-chocolate-chip-cookies/
• Ultimul rezultat:
– http://thesquishymonster.com/2014/09/1-minute-chocolate-chip-cookie-for-1.html
ÎNTREBĂRI