Cours referencement origine

Click here to load reader

  • date post

    03-Jul-2015
  • Category

    Documents

  • view

    466
  • download

    2

Embed Size (px)

Transcript of Cours referencement origine

  • 1. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 1 cole Centrale de Lille Cit Scientifique - BP 48 F-59651 Villeneuve dAscq Cedex Origine du SEO, historique de Google Image : Source Cours distribu sous licence Creative Commons, selon les conditions suivantes : Source des images indiques au-dessous ou en cliquant sur limage Mise jour du 29 janvier 2015 Rmi Bachelet Dernire version de ce cours de cours de rfrencement / SEO

2. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 2 Comment utiliser ce cours : 1. Mettre les diapos en format plein cran en cliquant sur 2. Faire dfiler lanimation en cliquant sur les diapositives (attention : cliquer sur une image ou un lien ouvre la page web correspondante) 3. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 3 Origine du SEO 1. Les premiers moteurs de recherche Les algorithmes dindexation 2. Google et ses concurrents 4. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 4 Histoire du SEO Au dbut du web, pas de moteurs de recherche, mais des engins spcialiss (the Wanderer mesure la taille du web), Gopher est un protocole de classement) ou des indexeurs basiques (Archie indexe les fichiers disponibles en ftp). Premier moteur de recherche : Aliweb en 1993, il tabli le principe de fonctionnement qui est toujours dactualit : 1. On dclare ("to submit") ladresse dune page = son URL (Uniform Resource Locator commencant par http:// ) 2. Le moteur envoie un "crawler" (ou spider) tlcharger la page. La page est stocke sur le serveur du moteur de recherche 3. o elle est traite par un indexeur pour en extraire les informations (mots- cls, liens) et les interprter (importance, rptition). 4. priodiquement, le "crawler" revient sur la page pour actualiser les informations (20% du trafic dinternet vient des moteurs de recherche). Au milieu des annes 1990, le problme de l'indexation des sites web pour les rendre plus faciles trouver merge, car la visibilit dun site devient un facteur de plus en plus important : le SEO ( Search Engine Optimization ) merge en tant que champ de comptences Selon Danny Sullivan, apparition du terme Search Engine Optimization vers 1997 5. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 5 Premiers algorithmes dindexation Aliweb requiert des fichiers "index", qui sont placs spcialement par les webmestres et qui y dclarent l'adresse de leur pages, les mots-cls associs Mais ensuite les moteurs de recherche se basent sur des mots-cls insrs dans le code des pages Ce sont les tiquettes mta ou meta tag (meta parce quil sagit de donner de linformation sur de linformation). Mais on est confronts aux limites de lutilisation des meta tags comme indicateurs de la pertinence des pages : Les webmestres y mettent des mots-cls sans rapport avec le contenu rel du site dans le but d'attirer du trafic = "spamdexing", "black hat" .. rsultat : cette poque, trouver la bonne page web est une aventure Les premiers moteurs de recherche sont facilement manipuls et discrdits mais de nouveaux algorithmes dindexation, plus difficiles tromper sont dvelopps La course entre les moteurs de recherche et les webmasters qui veulent manipuler les rsultats de recherche pour attirer du trafic s'engage 6. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 6 Google : les dbuts Des tudiants de Stanford, Larry Page et Sergey Brin dveloppent "backrub," un moteur de recherche bas sur un algorithme dindexation baptis PageRank PageRank = nom de l'inventeur, Larry Page L'algorithme calcule un indice bas sur les liens entrants : PR(page X) = PR(des pages qui donnent un lien vers X) Le principe n'est pas nouveau Utilis en recherche : citation index. On mesure l'importance d'un article au nombre de fois qu'il est cit dans d'autres articles. Le moteur de recherche Inktomi utilise dj ce principe et dj des webmestres ont dvelopp des manires de le manipuler pour tricher (link farms) Google est fond en 1998. Le moteur de recherche est : Dpouill (page lgre) Simple (recherche "et" par dfaut) Rapide et il devient trs rapidement populaire (en quelques semaines et aux dpens dAlta Vista) 7. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 7 8. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 8 Google, les chiffres : Un index de plus de 24 milliards de pages (2007) 23 000 employs dans le monde (2010) Plus de 110 sites rgionaux, de 130 interfaces linguistiques La marque la plus populaire au monde[1] Plus de 3 milliards de requtes et 16 millions de visiteurs uniques par mois (2007) Slogan Don't be evil Eric E. Schmidt, directeur Sergey Brin, directeur technique Larry E. Page, directeur produits 9. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 9 Le chiffre d'affaires de Google. Les bnfices nets 22 milliards de dollars de liquidits au 30 septembre 2009 Source le Monde 16.10.09 10. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 10 Google sur le march des recherches En mai 2009, dans le monde 68,6 %, devant Yahoo! (9 %) Baidu (8,7% - chinois). 85% 90% de parts de trafic en Europe Sur le march amricain 65 % 19,6 % pour Yahoo! 8,4 % pour Microsoft. Source : ComScore 11. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 11 Mais Google, cest plus qu'un moteur de recherche Google Earth, Analytics, Webmasters Tools, Gmail, Youtube, Picasa Le modle oppos celui de Microsoft : on est prisonnier de MS contre son gr, essentiellement travers labsence dalternative et la non- interoprabilit En plus, on est oblig de payer . avec Google, on devient dpendant en choisissant dutiliser des applications innovantes .. ..et gratuites (ce gratuit ne lest bien sr pas rellement, il fait partie du modle conomique). 12. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 12 Politique d'acquisition de technologies Deja => Google Groups Picasa => Picasa Keyhole, Inc => Google Earth Urchin Software, Measure Map, Trendalyzer => Google Analytics Android => Android Phatbits => Google Desktop YouTube => YouTube (1.6MM$) FeedBurner => Google Reader Upstartle, Zenter, Tonic Systems, 2Web Technologies => Google Documents JotSpot => Google Sites Marratech => Google Talk Contrairement MS, qui acheta souvent ses concurrents pour les liminer, Google les valorise Source 13. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 13 Analyse du succs de Google Le bon timing Une philosophie : Google attitude , Googleplex Rupture technologique : Brin et Page ont des doctorats en en mathmatiques.. et les ont valoriss Rapidit, simplicit Pages de rsultats dpouilles (sans publicit au dbut) Une parfaite comprhension de la culture du Web Gratuit Affinits avec l'Opensource Innovation constante 14. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 14Image : Source 15. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 15 Les concurrents de Google Yahoo! Search, Microsoft Live Search / Bing Les outsiders : Exalead, Ask.com Les annuaires et moteurs thmatiques / rgionaux DMOZ Une myriade de "micro" moteurs exprimentaux De nouveaux venus ? Mais le ticket d'entre n'est-il pas aujourd'hui devenu norme ? 16. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 16 Google comme talon universel Dans beaucoup de pays, le rfrencement naturel est devenu une chasse au classement Google 17. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 17 Google Universal Search Depuis mai 2007, une recherche sur Google propose sur sa search engine results page (SERP) des rsultats mixant : Certes des Pages web Des liens sponsoriss Mais aussi Actualits, Images, Livres Cartes Blogs Vidos Dfinitions (define:) Avec Universal Search, des contenus auparavant spars sont prsents simultanment Rsultat : - encore plus de candidats la premire page + Des stratgies alternatives pour y figurer Une volution incessante : nouvelles versions rgulirement 18. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 18 Google, les vulnrabilits Modle conomique = le gratuit + les effets dchelle Un CA dpendant 99% du march des liens sponsoriss => fraude aux clics sur les pubs Adwords Rentabilit difficile de Youtube et de nombreux autres services Risque de dispersion, manque de cohrence (Android vs. Chrome OS etc..) Microsoft et Yahoo! ont lanc, en juillet 2009 un partenariat destin concurrencer Google dans la recherche sur Internet. Microsoft, avec Bing, fournit la technologie Yahoo! la vente d'espaces publicitaires Questions sur : Labus de monopole (par exemple les pages des filiales de Google sont souvent fort bien classe dans les SERP.. De Google) La privatisation du patrimoine culturel (scannerisation de bibliothques entires par Google Books, impact de Google News sur la presse en ligne) 19. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 19 Google, les concurrents de demain Des alternatives la manire daccder au web et la recherche faon Google se dveloppent travers le web social . Facebook, Twitter : les informations pertinentes sont proposes par les amis , pas par un moteur de recherche. Le temps pass sur le net est plus centr sur les interactions sociales proposes par ces services Cette approche consistant montiser le rseau social pose de plus en plus de questions sur le respect de la vie prive des utilisateurs Google : Gmail + Google agenda + mmorisation des recherches sous IP pendant plusieurs mois) Facebook : les informations du profil, photos etc sont cdes Facebook (cf. le contrat dutilisation) 20. Utilisation ou copie interdites sans citationRmi Bachelet janvier 15 20 Les thmes et chapitres du cours 1. Origine du SEO, Google et s