referencement - Création de site internet

Aller au contenu


Référencement naturel (SEO)



Définition

On désigne habituellement par le terme « référencement » (en anglais SEO pour Search Engine Optimization, traduisez Optimisation des moteurs de recherche) l'ensemble des techniques permettant d'améliorer la visibilité d'un site web :

soumission (en anglais submission) consistant à faire connaître le site auprès des outils de recherche ;
positionnement (en anglais ranking) consistant à positionner les pages d'un site en bonne position dans les pages de résultat pour certains mots-clés ;


Toute la difficulté de l'exercice ne réside pas tant dans la promotion du site auprès des moteurs de recherche que dans la structuration du contenu et le maillage interne et externe pour être bien positionné dans les résultats sur des mots-clés préalablement choisis.


En effet une majorité d'internautes utilise les moteurs de recherche afin de trouver de l'information et interroge à ce titre un moteur de recherche à l'aide de mots clés (en anglais keywords). Il est donc essentiel avant tout chose de se préoccuper du contenu que l'on propose afin de répondre au mieux aux attentes des internautes, et d'identifier les mots-clés susceptibles d'être saisis par ces derniers !

SERP

Le terme SERP (Search Engine Result Pages) désigne les résultats de recherche tels qu'affichés après une requête. Il est essentiel de comprendre que d'un utilisateur à l'autre les résultats pour un même moteur de recherche peuvent varier, d'une part selon le paramétrage qu'a choisi l'utilisateur (langue, nombre de résultats par page) mais aussi selon le lieu (pays, région) d'où la requête est faite ou encore le terminal (mobile, tablette, ordinateur de bureau) ou bien parfois selon les requêtes effectuées préalablement par l'utilisateur et enfin car les moteurs de recherche font régulièrement de l'A/B testing pour tester différents affichages. A ce titre, il n'est pas rare qu'un site disparaisse des SERP sur une requête pendant 24h à 48h, puis refasse son apparition. Cela signifie donc qu'il faut attendre a minima 72h avant de s'inquiéter.

Cela signifie donc que ce n'est pas parce que vous vous voyez en première position que vous l'êtes forcément. Pour obtenir un résultat le plus proche possible de ce que la majorité des utilisateurs voient, il est conseillé de désactiver l'historique des requêtes, voire de naviguer en utilisant la navigation privée de son navigateur.

Les pages référencées en première position obtiennent évidemment plus de visites, puis viennent les pages en seconde position, etc. Il en va de même pour les pages référencées en première page par rapport aux pages référencées en seconde page. Ainsi, si une page se trouve en 11ème position (donc en seconde page), il est très intéressant d'essayer de l'optimiser afin de la faire passer en première page et obtenir un gain important de visiteurs uniques.

Mots-clés

Le référencement n'a de sens que vis-à-vis de mots-clés (en anglais keywords), c'est-à-dire les mots utilisés par les visiteurs pour faire des recherches.

Le premier travail consiste donc à déterminer les mots-clés sur lesquels on souhaite positionner les pages de son site. Les mots-clés que l'on a en tête ne correspondent pas toujours aux mots-clés utilisés par les visiteurs, car ceux-ci ont tendance à utiliser des termes les plus courts possibles ou encore à faire des fautes d'orthographe.

Il existe des outils permettant de comparer le volume de recherche d'un mot-clé par rapport à un autre et donnant des suggestions :
http://www.google.com/trends/?hl=fr


Enfin, il existe des sites permettant de connaître les mots-clés des sites concurrents :
SEMRush.com

SEO Black hat / White hat

En matière de référencement naturel, on oppose généralement deux courants de pensée :
Le SEO White hat (traduisez chapeau blanc), désignant les référenceurs respectant scrupuleusement les consignes des moteurs de recherche aux webmasters, dans l'espoir d'obtenir un référencement durable en jouant avec les règles du jeu ;
Le SEO Black hat (traduisez chapeau noir), designant les référenceurs adoptant des techniques contraires aux consignes des moteurs de recherche, dans le but d'obtenir un gain rapide sur des pages à fort potentiel de monétisation, mais avec un fort risque de déclassement. Les SEO black hat jouent ainsi au chat et à la souris avec les moteurs de recherche, qui adaptent régulièrement leurs algorithmes pour identifier et déclasser les sites ne respectant pas les consignes. Des techniques telles que le cloaking ou le content spinning sont ainsi considérées comme dangereuses et non recommandées.

Soumettre son site

Avant de parler d'optimisation du référencement, la première étape consiste à faire en sorte que les principaux moteurs de recherche et en particulier Google (car il est le plus utilisé) identifient le site et viennent le parcourir régulièrement.

Référencement gratuit

Le référencement n'est pas nécessairement payant car les moteurs de recherche indexent gratuitement le contenu des sites et il n'est pas possible de les payer afin de mieux positionner son site.

Référencement payant

En revanche il est possible d'une part d'acheter des mots-clés sur les moteurs de recherche, il s'agit alors d'emplacement publicitaires (appelés liens sponsorisés), situés autour des résultats de recherche dits naturels. On parle alors de SEM (Search Engine Marketing) par opposition au SEO (Search Engine Optimization).

D'autre part, le référencement étant une notion vaste, demandant beaucoup d'expérience et avec de nombreuses difficultés cachées, il est conseillé pour les entreprises de faire appel à ses agences spécialisées en référencement qui sauront les conseiller et les accompagner.

Optimiser le référencement

L'élément de référence pour les moteurs de recherche est la page web, il faut donc penser, lors de la conception du site web, à structurer les pages en prenant en compte les conseils ci-dessus pour chacune des pages.


En effet la plupart des webmasters pensent à indexer correctement la page d'accueil de leur site mais délaissent les autres pages, or ce sont généralement les autres pages qui contiennent le contenu le plus intéressant. Il est donc impératif de choisir un titre, une URL et des métas (etc.) adaptés pour chacune des pages du site.


Il existe quelques techniques de conception de site permettant de donner plus d'efficacité au référencement des pages d'un site :

un contenu original et attractif,
un titre bien choisi,
une URL adaptée,
un corps de texte lisible par les moteurs,
des balises META décrivant précisément le contenu de la page,
des liens bien pensés,
des attributs ALT pour décrire le contenu des images.

Contenu de la page web

Les moteurs de recherche cherchent avant tout à fournir un service de qualité à leurs utilisateurs en leur donnant les résultats les plus pertinents en fonction de leur recherche ainsi avant même de songer à améliorer le référencement il est indispensable de s'attacher à créer un contenu consistant et original.

Un contenu original ne signifie pas un contenu qui n'est proposé par aucun autre site, cela serait une mission impossible. En revanche il est possible de traiter un sujet et de lui amener une plus-value en approfondissant certains points, en l'organisant d'une manière originale ou en mettant en relation différentes informations. Les réseaux sociaux sont à ce titre un excellent vecteur pour promouvoir le contenu et pour identifier l'intérêt que les lecteurs portent à votre contenu.

D'autre part, toujours dans l'optique de fournir le meilleur contenu aux visiteurs, les moteurs de recherche accordent de l'importance à la mise à jour des informations. Le fait de mettre à jour les pages du site permet donc d'augmenter l'indice accordé par le moteur au site ou en tout cas la fréquence de passage du robot d'indexation.
Titre de la page

Le titre est l'élément de prédilection pour décrire en peu de mots le contenu de la page, c'est notamment le premier élément que le visiteur va lire dans la page de résultat du moteur de recherche, il est donc essentiel de lui accorder une importance particulière. Le titre d'une page web est décrit dans l'en-tête de la page web entre les balises <TITLE> et </TITLE>.

Le titre doit décrire le plus précisément possible, en 6 ou 7 mots maximum, le contenu de la page web et sa longueur totale recommandée ne doit idéalement pas dépasser la soixantaine de caractères. Enfin, il doit idéalement être aussi unique que possible dans le site pour que la page ne soit pas considérée comme du contenu dupliqué.

Le titre est d'autant plus important qu'il s'agit de l'information qui s'affichera dans les favoris de l'internaute, dans la barre de titre et les onglets du navigateur ainsi que dans l'historique.

Etant donné que les utilisateurs européens lisent de gauche à droite, il est conseillé de mettre les mots portant le plus le sens de la page à gauche.

URL de la page

Certains moteurs de recherche accordent une importance capitale aux mots-clés présents dans l'URL, notamment les mots-clés présents dans le nom de domaine. Il est donc conseillé de mettre un nom de fichier adapté, contenant un ou deux mots-clés, pour chacun des fichiers du site plutôt que des noms du genre page1.html, page2.html, etc.

Screen Impact utilise une technique appelée URL-Rewriting consistant à écrire des URL lisibles et contenant les mots-clés du titre de la page. Sur Screen Impact le tiret est utilisé comme séparateur : http://www.screen-impact/votre-texte-votre-texte

Corps de la page

Afin de valoriser au maximum le contenu de chaque page il est nécessaire que celui-ci soit transparent (par opposition aux contenus opaques tels que le flash), c'est-à-dire qu'il comporte un maximum de texte, indexable par les moteurs. Le contenu de la page doit être avant tout un contenu de qualité adressé aux visiteurs, mais il est possible de l'améliorer en veillant à ce que différents mots-clés soient présents.


Les cadres (frames) sont fortement déconseillés car ils empêchent parfois l'indexation du site dans de bonnes conditions.

Balises META

Les META Tags sont des balises non affichées à insérer en début de document HTML afin de décrire finement le document. Etant donné l'usage abusif des métas constaté dans un nombre important de sites web, les moteurs utilisent de moins en moins ces informations lors de l'indexation des pages. La balise meta "keywords" a ainsi été officiellement abandonnée par Google

META description

La balise meta description permet d'ajouter une description décrivant la page, sans les afficher aux visiteurs (par exemple des termes au pluriel, voire avec des fautes d'orthographe volontaires). C'est généralement cette description (ou une partie de cette description) qui s'affichera dans les SERP. Il est conseillé d'utiliser le codage HTML pour les caractères accentués et de ne pas dépasser une vingtaine de mots clés.
META robots

La balise meta robots a une importance particulière car elle permet de décrire le comportement du robot vis-à-vis de la page, notamment indiquer si la page doit être indexée ou non et si le robot est autorisé à suivre les liens.

Par défaut l'absence de balise robots indique que le robot peut indexer la page et suivre les liens qu'elle contient.

La balise robots peut prendre les valeurs suivantes :

index, follow : cette instruction revient à ne pas mettre de balise robots puisque c'est le comportement par défaut.
noindex, follow : le robot ne doit pas indexer la page (toutefois le robot peut revenir régulièrement pour voir s'il existe de nouveaux liens)
index, nofollow : le robot ne doit pas suivre les liens de la page (par contre le robot peut indexer la page)
noindex, nofollow : le robot ne doit plus indexer la page, ni suivre les liens. Ceci se traduira par une baisse drastique de la fréquence de visite de la page par les robots.


Voici donc un exemple de balise robots :
<meta name="robots" content="noindex,nofollow"/>

Notez également l'existence des valeur suivante, pouvant être cumulées avec les valeurs précédentes :
noarchive : le robot ne doit pas proposer aux utilisateurs la version en cache (notamment pour le cache de Google).
noodp : le robot ne doit pas proposer la description de DMOZ (Open Directory Project) par défaut


Il est possible de cibler spécifiquement le robots d'exploration de Google (Googlebot) en remplaçant le nom robots par Googlebot (il est toutefois conseillé d'utiliser la balise standard afin de rester générique) :
<meta name="googlebot" content="noindex,nofollow"/>

Dans le cas où un grand nombre de pages ne doivent pas être indexées par les moteurs de recherche, il est préférable de les bloquer via le robots.txt car dans ce cas les robots d'exploration ne perdent pas de temps à crawler ces pages et peuvent ainsi concentrer toute leur énergie sur les pages utiles.

Sur Screen Impact les questions du forum n'ayant pas obtenu de réponses sont exclues des moteurs de recherche, mais ceux-ci peuvent continuer à crawler les pages pour suivre les liens :

<meta name="robots" content="noindex,follow"/>

Au bout d'un mois, si la questions n'a toujours pas de réponse, la balise meta devient la suivante, afin que le moteur l'oublie :

<meta name="robots" content="noindex,nofollow"/>

Liens internes

Afin de donner le maximum de visibilité à chacune de vos pages, il est conseillé d'établir des liens internes entre vos pages pour permettre aux crawlers de parcourir la totalité de votre arborescence. Ainsi il peut être intéressant de créer une page présentant l'architecture de votre site et contenant des pointeurs vers chacune de vos pages.

Cela signifie par extension que la navigation du site (menu principal) doit être pensée pour donner efficacement accès aux pages ayant un fort potentiel en terme de SEO.

NetLinking

Le terme NetLinking désigne le fait d'obtenir des liens externes pointant vers son site web car cela augmente d'une part le trafic et la notoriété de son site, d'autre part car les moteurs de recherches prennent en compte le nombre et la qualité des liens pointant vers un site pour caractériser son niveau de pertinence (c'est le cas de Google avec son indice appelé PageRank).

Liens Nofollow

Les liens sont par défaut suivis par les moteurs de recherche (en l'absence de META robots nofollow ou d'un fichier robots.txt empêchant l'indexation de la page). Toutefois, il est possible d'indiquer aux moteurs de recherche de ne pas suivre certains liens en utilisant l'attribut nofollow.

Ceci est notamment recommandé si :
Le lien fait l'objet d'un accord commercial (liens payants)
Le lien est ajouté par des utilisateurs non sûrs dans des espaces contributifs du site (commentaires, avis, forums, etc.).


Sur CommentCaMarche, les liens postés par les utilisateurs anonymes ou n'ayant pas participé activement à la communauté (aide sur les forums) sont des liens nofollow. Les liens postés par les utilisateurs actifs et les contributeurs sont des liens normaux (dits « dofollow »).

Attributs ALT des images

Les images du site sont opaques pour les moteurs de recherche, c'est-à-dire qu'ils ne sont pas capables d'en indexer le contenu, il est donc conseillé de mettre un attribut ALT sur chacune des images, permettant d'en décrire le contenu. L'attribut ALT est également primordiale pour les non-voyants, navigant à l'aide de terminaux en braille.


Voici un exemple d'attribut ALT :

<img src="images/exemple.gif"                                        
width="140"                                        
height="40"                                        
border="0"                                        
alt="logo exemple">

Il est également conseillé de renseigner un attribut title permettant d'afficher une infobulle à l'utilisateur décrivant l'image.
Améliorer le crawl

Le référencement commence par le crawl (en français exploration) de votre site par les robots d'exploration des moteurs de recherche. Il s'agit d'agents parcourant les sites à la recherche de nouvelles pages à indexer ou bien de pages à mettre à jour. Un robot d'indexation agit en quelque sorte comme un visiteur virtuel : il suit les liens présents sur votre site afin d'explorer le maximum de pages. Ces robots sont identifiables dans les logs par l'en-tête HTTP User-Agent qu'ils envoient. Voici les user-agents des principaux moteurs de recherche :

Googlebot, etc.

Voici ci-dessous des exemples de chaînes de User-Agents pour les moteurs de recherche les plus populaires :


Nom du moteur User-Agent
Google GoogleBot
Mediapartners-Google
Googlebot-Image
Googlebot-Mobile
Google Wireless Transcoder
AdsBot-Google
Bing = bingbot
MsnBot
Yahoo = Slurp
Yandex = Yandex
Orange/Voila = VoilaBot
Cuil = Twikler



Ainsi, il convient de faire en sorte de mailler intelligemment ses pages à l'aide de liens afin de permettre aux robots d'accéder au maximum de pages, le plus rapidement possible.

Pour améliorer l'indexation de votre site, il existe plusieurs méthodes :
Robots.txt

Il est possible et souhaitable de bloquer les pages inutiles au référencement à l'aide d'un fichier robots.txt afin de permettre aux robots d'indexation de consacrer toute leur énergie aux pages utiles. Les pages en doublon (ayant par exemple des paramètres inutiles aux robots) ou les pages ayant peu d'intérêt pour les visiteurs depuis une recherche (résultats de recherche interne du site, etc.) doivent typiquement être bloquées ;

Sur Screen Impact, les résultats du moteur de recherche interne sont explicitement exclues du référencement via le fichier robots.txt, afin de ne pas fournir aux utilisateurs arrivant par un moteur de recherche des résultats générés automatiquement, conformément aux consignes de Google.

Vitesse de chargement des pages

Il est important d'améliorer le temps de chargement des pages, en utilisant par exemple des mécanismes de cache car cela permet d'une part d'améliorer l'expérience utilisateur et donc la satisfaction des visiteurs et d'autre part car les moteurs de recherche prennent de plus en plus en compte ces types de signaux dans le positionnement des pages ;
Sitemap

Le fait de créer un fichier sitemap permet de donner accès au robots à l'ensemble de vos pages ou des dernières pages indexées.
Réseaux sociaux

De plus en plus de moteurs de recherche prennent en compte les signaux de partage sociaux dans leur algorithme. Google Panda prend notamment en compte ce critère pour déterminer si un site est de qualité ou non. Autrement dit, le fait de favoriser le partage social limite les risques d'impact par les algorithmes tels que Panda.

Sur Screen Impact, les pages contiennent des boutons de partage asynchrones afin de ne pas ralentir le chargement des pages, ainsi que les META OpenGraph og:image permettant d'indiquer aux réseaux sociaux quelle image afficher lorsqu'un utilisateur partage un lien.

Référencement d'un site mobile

L'idéal est d'avoir un site mobile conçu en responsive design car, dans ce cas, la page indexée pour les ordinateurs de bureau et terminaux mobile est la même, seul son affichage change selon le périphérique d'affichage.

Si votre site web mobile est sur un domaine ou sous-domaine à part, comme c'est le cas pour CommentCaMarche, il suffit de rediriger automatiquement les internautes vers le site mobile en faisant attention que chaque page redirigée pointe bien vers son équivalent sur le site mobile. Il faut également s'assurer que le crawler Googlebot-Mobile soit bien traité comme un terminal mobile !

Pour approfondir: Référencement d'un site mobile
Contenu dupliqué

Dans la mesure du possible, il s'agit de créer des titres de pages uniques sur l'ensemble du site, car les moteurs de recherche tels que Google ont tendance à ignorer le contenu dupliqué (en anglais duplicate content), c'est-à-dire soit de nombreuses pages du site ayant le même titre ou bien des pages du site dont le principal contenu existe sur le site ou des sites tiers.

Le contenu dupliqué est quelque chose de naturel, ne serait-ce que par le fait que nous sommes amené à faire des citations, à rapporter des propos de personnalités ou encore à faire mention à des textes officiels. Toutefois, une trop grande proportion de contenu dupliqué sur un site peut conduire à une pénalité algorithmique, il est donc conseillé de bloquer un tel contenu à l'aide d'un fichier robots.txt ou une balise META robots ayant pour valeur "noindex".
Balise canonical

Lorsque les moteurs de recherche détectent du contenu dupliqué, ils n'en conservent qu'une seule page, selon leurs propres algorithmes, ce qui peut parfois conduire à des erreurs. Ainsi, il est conseillé de faire figurer dans les pages possédant du contenu dupliqué une balise Canonical pointant vers la page à conserver. En voici la syntaxe :

<link rel="canonical" href="http://votresite/pagefinale"/>

D'une manière générale, il est conseillé de faire figurer dans vos pages une balise canonical avec l'URL de la page en cours. Cela permet notamment de limiter la déperdition liée aux paramètres inutiles dans l'URL tel que http://www.commentcamarche.net/forum/?page=1 ou encore http://www.commentcamarche.net/faq/?utm_source=mail !

Cela sert également pour les pages d'index car il arrive que Google indexe votre page d'accueil sous sa forme http://www.screen-impact.com/ et http://www.screen-impact.com/index.php3

Pénalités

On distingue généralement deux types de pénalités :
Les pénalités manuelles, c'est-à-dire résultant d'une action humaine, faisant suite à un non respect des consignes aux webmasters. Il peut s'agir de liens non naturels (liens achetés), de contenu artificiel, de redirections trompeuses, etc. Les pénalités pour achat de liens sont courantes et pénalisent le site ayant vendu des liens ainsi que ceux les ayant acheté. Ces pénalités ne peuvent être levées qu'après avoir corrigé le problème (ce qui suppose d'avoir identifié le problème) et effectué une demande de réexamen du site via le formulaire consacré. Le réexamen d'un site web peut prendre plusieurs semaines et ne conduit pas nécessairement à une récupération de position ou parfois partielle.

Les pénalités algorithmiques, c'est-à-dire ne résultant d'aucune action humaine, liée généralement à un ensemble de facteurs que seul le moteur de recherche connaît. C'est le cas par exemple de Google panda, l'algorithme de Google déclassant les sites dits de mauvaise qualité. Ces pénalités ne peuvent être levées qu'à près avoir éliminé les "signaux" conduisant à un déclassement, à l'itération suivante de l'algorithme.

Algorithme Google

L'algorithme de Google est l'ensemble des insctructions permettant à Google de donner une page de résultats suite à une requête.

PageRank

A l'origine l'algorithme était uniquement basé sur l'étude des liens entre les pages web et reposait sur un indice affecté à chaque page et nommé PageRank (PR). Le principe est simple : plus une page a de liens entrants, plus son PageRank augmente. Plus une page a de PageRank, plus elle en distribue à ses liens sortants. Par extension, on parle du PageRank d'un site pour désigner le PageRank de sa page d'accueil, car c'est généralement la page qui a le plus grand PageRank parmi toutes les pages du site.
Optimisations de l'algorithme

Depuis le PageRank, l'algorithme prend en compte un grand nombre de signaux supplémentaires, parmi lesquels (liste non exhaustive) :
la fraîcheur de l'information ;
la mention de l'auteur ;
le temps passé, le degré d'implication du lecteur ;
les sources de traffic autres que les SEO
etc.


Google annonce procéder à environ 500 optimisations de l'algorithme par an, soit plus d'une modification par jour. De ce fait, les SERP peuvent varier de façon importante selon les modifications effectuées par les équipes de Google.
Google Caffeine

Google Caffeine est le nom donné à la nouvelle architecture déployée par Google en août 2009 (et régulièrement améliorée depuis), dont l'objectif est une prise en compte plus rapide des informations mises à jour, ce qui se traduit par un crawl amélioré et par conséquent des résultats plus frais dans les résultats de recherche.
Google Panda

Panda est le nom donné au filtre déployé courant 2011 par Google pour lutter contre les sites de mauvaises qualités. Le principe consiste à dégrader le positionnement des sites dont le contenu est jugé de qualité trop faible :
Voir Google Panda

Google Penguin

Déployé en 2012, Google Penguin est une mise à jour de Google pénalisant les sites dont l'optimisation SEO est jugée excessive. C'est le cas par exemple des sites dont un trop grand nombre de liens proviennent de sites jugés comme "spammant". Il semblerait également qu'un abus de liens entre pages parlant de sujets disparates soit un facteur pouvant entraîner une pénalité via l'algorithme Google Penguin. Google a ainsi mis en place un formulaire permettant de désavouer des liens pouvant potentiellement porter préjudice au référencement d'un site.

www.screen-impact.com


imprimer cette page




Retourner au contenu