Sunteți pe pagina 1din 20

Origine du SEO, historique de

Google
Mise à jour du 25 janvier 2010

Rémi Bachelet
Dernière version de ce cours de
cours de référencement / SEO

Cours distribué sous licence Creative Commons,


selon les conditions suivantes :

Source des images indiquées au-dessous ou en cliquant sur l’image

École Centrale de Lille


RémiScientifique
Cité Bachelet – Ecole
- BPCentrale de Lille
48 F-59651 Villeneuve d’Ascq Cedex
25 janv. 2010 Image
Utilisation ou copie interdites : Source
sans citation
1
Comment utiliser ce
cours :
1. Mettre les diapos en format plein écran en cliquant sur
2. Faire défiler l’animation en cliquant sur les diapositives
(attention : cliquer sur une image ou un lien ouvre la page web correspondante)

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
2
Origine du SEO

1. Les premiers moteurs de recherche


• Les algorithmes d’indexation
1. Google … et ses concurrents

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
3
Histoire du SEO

• Au début pas de moteurs de recherche, mais des engins spécialisés (the


Wanderer mesure la taille du web, Gopher est un protocole de classement)
ou de simples indexeurs (Archie indexe les fichiers disponibles en ftp).
• Premier moteur de recherche : Aliweb en 1993
1. On déclare ("to submit") l’adresse d’une page = son URL (Uniform Resource
Locator), à divers moteurs de recherche
2. Le moteur envoie un "crawler" une “spider” télécharger la page La page est
stockée sur le serveur du moteur de recherche…
3. … où elle est traitée par un indexeur pour en extraire les informations (mots-
clés, liens) et les interpréter (importance, répétition…).
4. par la suite, le "crawler" revient sur la page pour actualiser les informations.
• Au milieu des années 1990, le problème de l'indexation des sites web pour
les rendre plus faciles à trouver émerge car la visibilité d’un site devient un
facteur de plus en plus important : le SEO ("search engine optimization")
émerge en tant que champ de compétence
– Apparition du terme vers 1997 selon Danny Sullivan

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
4
Premiers algorithmes d’indexation
Aliweb requiert des fichiers "index", qui sont placés
spécialement par les webmestres et qui y déclarent
l'adresse de leur pages, les mots-clés associés …
– Mais ensuite les moteurs de recherche se basent sur des mots-clés
insérés dans le code des pages
 Ce sont les étiquettes méta ou "meta tag"
– Limites de l’utilisation des meta tags comme indicateurs de la
pertinence des pages :
• Les webmestres y mettent des mots-clés sans rapport avec le contenu
réel du site dans le but d'attirer du trafic = "spamdexing", "black hat"
• .. résultat : à cette époque trouver la bonne page web est une
aventure…
 Les premiers moteurs de recherche sont facilement manipulés et
discrédités.
• .. De nouveaux algorithmes de recherche plus difficiles à manipuler sont
développés…
• La course entre les moteurs de recherche et ceux qui veulent manipuler
les résultats de recherche s'engage…

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
5
Google : les débuts
• Des étudiants de Stanford, Larry Page et Sergey Brin développent
"backrub," un moteur de recherche basé sur un algorithme baptisé
PageRank
– PageRank = nom de l'inventeur, Larry Page
• L'algorithme calcule un indice basé sur les liens entrants :
– PR(page X) = Σ PR(des pages qui donnent un lien vers X)
• Le principe n'est pas nouveau
– Utilisé en recherche : citation index. On mesure l'importance d'un article
au nombre de fois qu'il est cité dans d'autres articles.
– Le moteur de recherche Inktomi utilise déjà ce principe
– … et déjà des webmestres ont développé des manières de le manipuler
• Google est fondé en 1998.
– Le moteur de recherche est :
• Dépouillé (page légère)
• Simple (recherche "et" par défaut)
• Rapide
… et il devient très rapidement populaire (en quelques semaines)

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
6
Google, les chiffres :
– Un index de plus de 24 milliards de pages (2007)
– 20 000 employés dans le monde (sept 2009)
– Plus de 110 sites régionaux
– Plus de 130 interfaces linguistiques
– Plus de 3 milliards de requêtes et 16 millions de
visiteurs uniques par mois (2007)
– Slogan « Don't be evil »
• Eric E. Schmidt, directeur
• Sergey Brin, directeur technique
• Larry E. Page, directeur produits

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
7
Le chiffre d'affaires de Google.

22 milliards de
dollars de
liquidités au 30
septembre 2009
Les bénéfices nets

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ouSource le Monde
copie interdites 16.10.09
sans citation
8
Google sur le marché des
recherches

• En mai 2009, dans le monde


– 68,6 %,
– devant Yahoo! (9 %)
– Baidu (8,7% - chinois).
• 85% à 90% de parts de trafic en Europe
• Sur le marché américain 65 %
– 19,6 % pour Yahoo!
– 8,4 % pour Microsoft.
Source : ComScore
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
9
Mais Google, c’est plus qu'un
moteur de recherche…
Google Earth, Analytics, Webmasters Tools,
Gmail, Youtube, Wave …
– le modèle opposé à celui de Microsoft : on est
prisonnier de MS contre son gré, essentiellement à
travers l’absence d’alternative et la non-
interopérabilité
• En plus, on est obligé de payer ….
– avec Google on devient dépendant … en choisissant
d’utiliser des applications innovantes ..
• ..et gratuites… (ce « gratuit » ne l’est bien sûr pas réellement, il fait
partie du modèle économique).

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
10
Politique d'acquisition de
technologies
• Deja => Google Groups
• Picasa => Picasa
• Keyhole, Inc => Google Earth
• Urchin Software, Measure Map, Trendalyzer, => Google Analytics
• Android => Android
• Phatbits => Google Desktop
• YouTube => YouTube (1.6MM$)
• FeedBurner => Google Reader
• Upstartle, Zenter, Tonic Systems, 2Web Technologies =>
Google Documents
• JotSpot => Google Sites
• Marratech => Google Talk

Source

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
11
Analyse du succès de Google
• Le bon timing
• Une philosophie : « Google attitude », Googleplex
• Rupture technologique
• Rapidité, simplicité ("et" par défaut entre les mots-clés)
• Pages de résultats dépouillées (sans publicité au début)
• Une parfaite compréhension de la culture du Web
– Gratuité
– Affinités avec l'Opensource
– Innovation constante

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
12
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Image
Utilisation ou copie interdites sans :citation
Source 13
Les concurrents de Google
• Yahoo! Search,
• Microsoft Live Search / Bing
• Les outsiders : Exalead, Ask.com
• Les annuaires et moteurs thématiques / régionaux
– DMOZ
– Une myriade de "micro" moteurs expérimentaux…

• De nouveaux venus ?
– Mais le coût d'entrée n'est-il pas aujourd'hui devenu énorme ?

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
14
Google comme étalon universel

• Dans beaucoup de pays, le


référencement naturel est devenu une
« chasse au classement Google »
– Effet superstar
– Les nouvelles formes de réseaux sociaux du
référencement : news, scholar, twitter,
slashdot

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
15
Google Universal Search
• Depuis mai 2007, une recherche sur Google propose sur sa search engine
results page (SERP) des résultats mixant :
• Certes
– des Pages web
– Des liens sponsorisés
– Mais aussi
• Actualités,
• Images,
• Livres
• Cartes
• Blogs
• Vidéos
• Définitions (define:)
 Avec Universal Search, des contenus auparavant séparés sont présentés simultanément
 Résultat :
 encore plus de candidats à la première page
 Des stratégies alternatives pour y figurer
• Une évolution incessante
 Par exemple : Sept 2009 : nouvelle version du moteur de recherche en test

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
16
Google, les vulnérabilités
• Modèle économique = le gratuit + les effets d’échelle
– Un CA dépendant à 98% du marché des liens sponsorisés
– Non-rentabilité de Youtube et de nombreux autres services …
– Risque de dispersion
• Fraude aux clics sur les pubs adwords
• De plus en plus de questions sur
– La sécurité des données
– la vie privée des utilisateurs
• Google et la crise
• Microsoft et Yahoo! ont lancé, en juillet 2009 un partenariat destiné à
concurrencer Google dans la recherche sur Internet.
– Microsoft, avec Bing, fournira la technologie
– Yahoo! la vente d'espaces publicitaires

En terme d’image Google est encore le « chevalier blanc » face à Microsoft,


mais un risque : en cas d’impair, la déception sera à la mesure de
l’engouement

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
17
Questions ?

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
18
Rémi BACHELET

Enseignant-chercheur,
Ecole Centrale de Lille

Mes principaux cours à Centrale


Gestion de projet, sociologie des organisations, recueil, analyse et traitement de données,
prévention du plagiat, module de marchés financiers, cours de qualité et méthodes de résolution
de problèmes, établir des cartes conceptuelles, utiliser Wikipédia et CentraleWiki, formation au
coaching pédagogique et à l'encadrement, référencement et SEO

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
19
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
20

S-ar putea să vă placă și