Comment Supprimer Une Recherche Sur Google
Annotate désindexer des pages de Google ? Le tuto ultra complet !
Il est bien plus courant qu'on ne l'imagine d'avoir besoin de désindexer des pages de Google, c'est-à-dire de les supprimer de l'index. Ceci permet de nettoyer le site et parfois de sortir d'une pénalité. Voici comment faire...
Dossier mis à jour le 03/07/2019, publié initialement le 22/12/2015
Il y a de nombreux cas de figure et ce tuto les décrit a priori tous. Si vous êtes dans un cas particulier non listé, northward'hésite pas à me 50'indiquer ! Et si vous ne vous en sortez pas tout seul, contactez-moi pour du consulting.
A voir aussi : comment supprimer son historique de recherche sur Google ?
Pourquoi faut-il parfois désindexer des pages ?
Il y a plusieurs situations :
- vous n'aviez pas réalisé que certaines pages étaient indexées - et ce due north'était pas prévu
- certaines pages créent du contenu dupliqué interne et vous souhaitez vous en débarrasser
- vous estimez que des pages (de faible qualité) vous font prendre trop de risques avec l'algorithme de Google (ou même avec l'équipe qualité de la recherche si elle venait à passer par là) et vous souhaitez donc les supprimer de Google
- une ou plusieurs pages vous posent des problèmes juridiques et vous devez les retirer au plus vite de votre site et de Google
- etc.
Si vous êtes déjà venu à ma formation, vous savez que je décris le concept de masse noire (des pages que Google crawle et parfois indexe et qui ne devraient pas l'être). Si la function de la masse noire devient trop importante sur votre site, il est grand temps de faire le ménage !
Quelle différence entre pages indexables et pages indexées ?
Une page indexable est une page qui respecte toutes les conditions techniques pour qu'elle soit indexée.
Une folio indexée est une page que Google a crawlée et "décidé" d'ajouter à son index (il arrive que Google crawle une page indexable et ne fifty'indexe pas malgré tout).
Je rappelle que pour être indexable, une page doit évidemment être également "crawlable" !
Une page crawlable est une folio autorisée au crawl : en clair, non bloquée dans le fichier robots.txt même south'il existe un cas particulier que j'expose plus loin. Elle doit également être accessible (à Google) et d'un format pris en charge.
A 50'inverse, une folio non-indexable est une page pour laquelle on indique à Google qu'il ne doit pas l'indexer. Comme vous l'avez deviné, pour désindexer une folio de Google, vous devez suivre 2 étapes :
- la rendre not-indexable cascade Google
- puis la désindexer
Je détaille ces 2 étapes ci-après.
Envie de faire la liste des pages crawlables et indexables de votre site ? Lancez un audit RM Tech
Comment rendre une page non-indexable ?
La première question à vous poser est sans doute la suivante : la folio que vous souhaitez désindexer doit-elle rester consultable par les internautes ?
Comment désindexer une page toujours accessible aux internautes ?
Dans ce cas de figure, vous devez choisir parmi ces solutions (les liens donnent les détails si besoin) :
- ajouter une balise meta robots noindex (ou none) permet d'indiquer aux moteurs que vous ne souhaitez pas qu'elle soit indexée. Si jamais elle est actuellement indexée, elle sera désindexée quand Google détectera cette balise dans la page ; si elle n'est pas encore indexée, alors elle ne le sera pas not plus à l'avenir (il southward'agit donc de prévention)
- envoyer un entête HTTP spécial (Ten-Robots-Tag) : c'est la même idée que la balise meta robots noindex. Elle s'impose quand le document à désindexer north'est pas une page HTML, car dans ce cas vous ne pouvez pas ajouter de balises meta (PDF, documents Word ou Excel, etc.).
- définir une URL canonique différente de l'URL de la page à désindexer. Par exemple, une fiche produit est accessible aussi bien à l'URL A qu'à l'URL temporaire B pour cause de promotion. Vous pouvez définir dans la folio B une URL canonique faisant référence à A. Attention, fifty'URL canonique est united nations indicateur que vous fournissez à Google, lequel ne s'appoint pas à le respecter dans 100% des cas.
Ensuite, soit vous attendez que Google désindexe la page, soit vous accélérez le processus (voir ci-dessous).
Comme je sais que vous avez bien suivi mes explications, vous avez compris que votre page doit être crawlable, n'est-ce pas ? Machine si vous interdisez à Google de la crawler, il ne pourra pas constater que vous demandez qu'elle soit désindexée. Je discute de ce cas de figure dans ce dossier.
#SEO mettre une meta robots noindex ET bloquer dans robots.txt = Google ne supprime pas la folio Click to TweetComment désindexer une folio qui n'est plus attainable ?
Dans ce cas de figure, vous devez choisir parmi ces solutions les plus courantes :
- envoyer un code HTTP 404 ou 410 : ceci indique à Google que la page due north'existe pas (404) ou plus (410). Le code 410 semble plus efficace, automobile avec un lawmaking 404 il peut se passer plusieurs mois avant que Google décide enfin de désindexer la page ! Si vous êtes perdus dans tous ces codes HTTP, consultez ma liste.
- envoyer un entête HTTP spécial (Ten-Robots-Tag) : c'est la même idée que la balise meta robots noindex. Elle south'impose quand le certificate à désindexer north'est pas une page HTML, car dans ce cas vous ne pouvez pas ajouter de balises meta (PDF, documents Word ou Excel, etc.).
- rediriger en 301 vers une autre page : on utilise cette méthode quand on pense que 50'URL à supprimer avait obtenu des (bons) backlinks (par exemple en ecommerce ou site de petites annonces). Pour éviter d'en perdre le bénéfice, il faut mettre en place une redirection permanente. Notez que si vous faites ça sur une grosse quantité d'URL, il est likely que Google considère ça comme des soft 404 et qu'au final les pages ne soient pas désindexées.
Ensuite, soit vous attendez que Google désindexe la page (ça peut être très long), soit vous accélérez le processus (voir ci-dessous).
Comment vérifier qu'une page est non-indexable ?
Vous pouvez utiliser différents outils cascade vérifier que vous êtes bien dans une des situations exposées précédemment.
Je vous recommande néanmoins de passer par un logiciel spécialisé (comme RM Tech, celui que j'ai conçu chez My Ranking Metrics). Après une analyse exhaustive de votre site, il vous listera l'ensemble des URL des pages HTML non-indexables.
Vous pourrez ainsi confirmer que les pages non-indexables sont bien celles que vous avez prévues. Dans le cas contraire, si fifty'outil liste des pages non-indexables qui devraient être indexables, autant dire que c'est une erreur plutôt grave...
Voici un exemple de rapport d'inspect qui montre qu'un très grand nombre d'URL sont interdites d'indexation à cause d'une balise meta robots noindex (espérons pour son propriétaire que c'est voulu) :
Voici united nations autre exemple de rapport d'audit similaire avec de nombreuses URL non indexables en raison d'une URL canonique différente de l'URL crawlée :
En combien de temps Google supprimera mes pages ?
Maintenant que vous avez vérifié que la ou les pages à supprimer de Google sont "non-indexables", qu'elles soient encore en ligne ou pas, vous devez attendre...
En effet, la page ne sera désindexée qu'au moment où Google cherchera à y accéder (la crawler). Et encore, dans le cas d'une erreur 404, je vous ai indiqué que ça pouvait prendre beaucoup de temps...
Comment supprimer rapidement une folio de Google ?
Supprimer une page grâce à Search Panel
Si vous avez une seule page à supprimer, ou un petit nombre, le plus efficace est certainement de faire une demande explicite dans Google Search Console. Avant, il south'agissait de l'outil de suppression d'URL. Depuis septembre 2015, Google a légèrement changé les termes utilisés mais fifty'idée reste la même.
Si par contre vous avez de nombreuses URL, il sera peut-être fastidieux voire incommunicable en pratique de passer par des demandes individuelles dans la Search Console.
Rassurez-vous, j'ai une astuce :-)
Elle n'est pas très connue et je vous l'offre ici : listez toutes les URL à désindexer dans un fichier sitemap ! Un simple fichier texte avec une URL par ligne suffit largement (encodage UTF-8), avec le nom de votre choix. Déclarez ce fichier dans Search Console (rubrique Exploration > Sitemaps) et patientez.
L'idée est qu'united nations sitemap ne sert pas à faire indexer des pages, mais à inciter Google à crawler des URL.
Grâce à ce sitemap :
- Google viendra assez rapidement crawler toutes ces URL
- il constatera qu'elles doivent être désindexées
- au fur et à mesure qu'il viendra les crawler, il les désindexera
- en plus, à chaque fois que vous irez consulter Search Console, vous saurez combien d'URL de ce sitemap sont encore présentes dans fifty'index.
Dès que toutes les URL sont désindexées, vous pouvez supprimer ce sitemap.
Résumé à partager sur Twitter :
Astuce #SEO : un sitemap peut lister des URL à faire désindexer, ça fait gagner du temps ! Click to TweetPeut-on utiliser le fichier robots.txt pour désindexer des pages ?
Réponse rapide : "non", pour la bonne raison que le fichier robots.txt ne gère pas 50'indexation mais le crawl.
Concrètement, si vous ne faites qu'interdire le crawl d'une URL, Google ne viendra plus la crawler, c'est tout. Si jamais l'URL était indexée, il ne la désindexera pas ! Simplement, il ne viendra plus jamais la mettre à jour. C'est d'ailleurs une erreur classique, que vous pouvez partager sur Twitter :
#SEO Cascade désindexer une page, n'utilisez pas le fichier robots.txt qui n'est pas prévu pour ça ! Click to TweetCertes, il y a une petite remarque à faire : il est possible de supprimer une page via Search Console, et pour éviter qu'elle revienne à 50'avenir dans l'index de Google, on la bloque dans le fichier robots.txt. Ce n'est donc pas le fait de la mettre dans le robots.txt qui la désindexe, mais la combinaison "demande de désindexation dans GSC + blocage dans robots.txt".
Dernier point : la directive Noindex: située dans le fichier robots.txt, . Pendant des années, Google en a tenu compte alors qu'elle north'a jamais fait partie du standard et que Google due north'en a jamais parlé nulle part dans ses pages d'aide. Mais en juillet 2019, Google a indiqué qu'il ne faut plus l'utiliser, car à partir du 1er septembre 2019 il arrêterait de la supporter.
Si vous souhaitez en savoir plus, consultez le dossier où j'ai testé le Noindex dans le robots.txt.
Besoin d'aide ?
J'ai passé pas mal de temps à rédiger ce dossier, ainsi qu'à organiser la logique de sa structure afin qu'il soit facile à comprendre.
- Si j'ai oublié des cas, ou si vous avez des questions, merci de les indiquer dans les commentaires ou dans le forum Indexation Google sur WebRankInfo.
- Si vous souhaitez vérifier que votre site ne contient aucune page Not indexable, lancez un audit RM Tech gratuit.
- Si vous due north'y arrivez pas tout seul, demandez-moi un devis.
Comment Supprimer Une Recherche Sur Google,
Source: https://www.webrankinfo.com/dossiers/indexation/comment-desindexer
Posted by: ericksoncoultle.blogspot.com

0 Response to "Comment Supprimer Une Recherche Sur Google"
Post a Comment