|
GUIDE DU REFERENCEMENT : Foire Aux Questions
- Quels sont les outils de recherche français les plus importants ?
- Quels sont les outils de recherche mondiaux les plus importants ?
- Comment connaître l'indice de popularité de mon site ?
- Comment vérifier la présence de mon site dans un moteur ou un annuaire ?
- Comment empêcher l'indexation de certaines pages par les moteurs ?
- Qu'est-ce qu'une"page satellite " ?
- Que sont les meta moteurs ?
- Existe-t-il un site regroupant les outils de recherche ?
- Faut-il se référencer sur un maximum d'outils de recherche ?
- Quel est le pourcentage de sites rejetés par les annuaires ?
1) Quels sont les outils de recherche français les plus importants ?

(source Xiti- juin 2002)
Google http://www.google.com
Yahoo France http://www.yahoo.fr
Voila http://www.voila.fr
Lycos France http://www.lycos.fr
Altavista France http://www.altavista.fr
Nomade / Tiscali http://www.nomade.tiscali.fr
2) Quels sont les outils de recherche mondiaux les plus importants ?
Google http://www.google.com
Yahoo http://www.yahoo.com
Hotbot http://www.hotbot.com
Lycos http://www.lycos.com
Altavista http://www.altavista.com
Alltheweb http://www.alltheweb.com
Northern Light http://www.northernlight.com
Open Directory http://dmoz.org
Infoseek http://www.go.com
Précisions :
- Volontairement, les moteurs et annuaires dont l'indexation est désormais payante (Looksmart, Snap, Goto) ne sont pas mentionnés
- Google, Hotbot, Infoseek et Lycos ont une seule base de données; seule l'interface est localisée.
Par contre Altavista, Yahoo et Open Directory ont des index différents suivant les pays.
- Excite, en proie à des problèmes financiers importants, et qui ne propose plus qu'un recensement au rabais si on ne sort pas ses dollars, ne me semble guère une solution recommandable.
- l'annuaire Open Directory inaugure une nouvelle voie : le recensement par des bénévoles qui gère chacun un petit domaine et décident comme des grands si votre site sera accepté ou non. Il suffit de remplir un formulaire pour être admis comme éditeur sur Open Directory.
- La soumission à la partie annuaire d'Infoseek, appelée GO Guides, ne peut se faire que par mail (url_review@infoseek.com).
Indiquer adresse, catégorie choisie et résumé du site en anglais.
3) Comment connaître l'indice de popularité de mon site ?
Dans l'interface de recherche des moteurs Altavista et Google, taper
link:www.nomdusite.com
Pour Alltheweb saisir
ml:www.nomdusite.com
Avec Hotbot fr choisir "Recherche avancée" puis cocher "Analyse des liens vers une page" et saisir l'adresse de son site.
Les autres outils de recherche ne proposent pas ce type d'option.
4) Comment vérifier la présence de mon site dans un moteur ou un annuaire ?
Altavista host:www.nomdusite.com
Google motclé1 motclé2 site:www.nomdusite.com
Hotbot domain:www.nomdusite.com
Infoseek site:www.nomdusite.com
Lokace adresse du site ou mots-clés principaux
Lycos adresse du site ou mots-clés principaux
Nomade adresse du site ou mots-clés principaux
Northern light url:www.nomdusite.com
Voila adresse du site ou mots-clés principaux
Yahoo u:www.nomdusite.com
(respecter scrupuleusement la syntaxe sous peine d'erreur)
5) Comment empêcher l'indexation de certaines pages par les moteurs ?
Ceci peut concerner vos pages non terminées, en réfection, ou destinées à demeurer confidentielles : deux solutions s'offrent à vous .
- le fichier robots.txt Il doit être strictement nommé ainsi et se trouver à la racine de votre site (c'est-à-dire ni dans un répertoire ni dans un sous-répertoire).
Il est constitué de deux instructions : - User-agent (paramètres : * pour permettre l'accès à tous les robots, ou nom du robot autorisé)
- Disallow (paramètres : répertoire et /ou sous-répertoires à exclure de l'indexation, ou / pour exclure toutes vos pages)
Ainsi si je souhaite empêcher tous les robots de visiter le répertoire /temporaire/ et le fichier toto.htm du répertoire /trucs le fichier nommé robots.txt sera constitué de :
User-agent : *
Disallow : /temporaire/
Disallow : /trucs/toto.htm
Une liste des noms des robots de moteurs de recherche peut être consultée ici.
- l'autre possibilité est constituée d'une balise META, nommée "robots", et qui possède la syntaxe suivante :
<META NAME="robots" CONTENT="index (ou noindex),follow (ou nofollow)>
index = le robot peut indexer la page
noindex = le robot ne peut pas indexer la page
follow = le robot peut suivre les liens contenus dans la page pour les indexer
nofollow = le robot ne peut pas suivre les liens contenus dans la page pour les indexer
ATTENTION : à l'inverse du fichier robots.txt qui concerne l'ensemble de votre site, la balise META "robots" doit être insérée dans chaque page pour laquelle vous souhaitez moduler l'action des robots.
6) Qu'est-ce qu'une "page satellite" ?
Il s'agit d'une page "fantôme" dont la seule fonction est d'être optimisée pour UN mot-clé et UN moteur de recherche. Page à créer de manière spécifique pour chacun de vos mots-clés principaux et pour chacun des moteurs incontournables ... Bon courage !
Comme ces pages "satellites" ne sont qu'un subterfuge destiné à leurrer les robots, il faut donc trouver une ruse pour que l'internaute, lui, n'y voie que du feu et atterrisse finalement sur vos pages réelles. La balise meta "refresh", qui redirige automatiquement un navigateur vers une autre adresse, est à oublier car repérée par les moteurs.
C'est un bout de code javascript, moins facile à identifier, qui fera donc l'affaire.
Procédé à la limite de la fraude les "pages satellites" semblent de plus en plus dépréciées (les critères "off the page" augmentant eux leur coefficient) et inefficaces (les gendarmes , c'est bien connu, progressant presque aussi vite que les voleurs).
7) Que sont les meta moteurs ?
Il s'agit soit de logiciels soit de sites web qui présentent la caractéristique d'interroger plusieurs moteurs simultanément et de vous livrer des résultats mis en forme (classement par pertinence, élimination des doublons, surlignage des mots-clés, etc.)
Le gain de temps constituent leur principal intérêt ; leur auto-appellation d' " agents intelligents " relève davantage du marketing que de l'appréciation objective. Ils rendent service en cas de recherche pointue qui nécessite l'exploration de plusieurs moteurs afin de ratisser large.
Meta moteurs logiciels
Copernic http://www.copernic.com/ (la référence en la matière / version de base gratuite)
Web Ferret http://www.zdnet.com/ferret/index.html
Lexibot http://www.lexibot.com/
Meta moteurs en ligne
Ixquick http://www.ixquick.com/ (recherche sur 10 moteurs francophones)
Ariane http://www.espace2001.com/moteur/ (français)
Metacrawler http://www.metacrawler.com/ (recherche sur les principaux moteurs américains)
Dogpile http://www.dogpile.com/ (idem)
8) Existe-t-il un site regroupant les outils de recherche ?
Dénommé Enfin, cet "annuaire des outils de recherche francophones" propose :
- recherche généraliste (annuaires, moteurs, meta-moteurs)
- recherche thématique (art & culture, commerce & économie, informatique, institutions, internet, loisirs et sports, régional, santé & spiritualité, sexe)

http://www.enfin.com
9) Faut-il se référencer sur un maximum d'outils de recherche ?
12 moteurs et annuaires français et mondiaux ( le " Big Twelve ") accaparent au moins 95 % des recherches des internautes. Il est donc conseillé de concentrer son action de référencement et de suivi de positionnement sur ceux-là (voir questions 1 et 2) et de ne pas s'éparpiller sur les centaines d'autres outils de recherche mineurs.
10) Quel est le pourcentage de sites rejetés par les annuaires ?
De 40 % pour Nomade (devenu en 2002 Nomade / Tiscali) à 60 % pour Yahoo France (source Enfin.fr)
|