Ce qui va perturber un moteur.
– URL avec plus de 2 paramètres dynamiques (% ? &).
– Pages avec plus de 100 liens vers d'autres pages du site.
– Pages à plus de 3 clics de la page d'accueil.
– Pages nécessitant un "SessionID" ou Cookie pour la navigation.
– Pages avec frames.
Ce qui est rédhibitoire (pour les moteurs).
– Pages nécessitant de s'identifier.
– Pages accessibles par menus déroulants.
– Documents accessibles par un moteur de recherche interne.
– Documents bloqués par des balises META Robots.
– Pages nécessitant un mot de passe.
– Pages avec temps de chargement trop long.
Le plus simple est d'avoir des liens HTML directs vers chaque page que l'on veut indexer.
Evitez les fausses bonnes idées.
– Evitez le contenu dupliqué: une même page accessible par plusieurs URL.
– Ne copiez pas de contenu venant d'autres sites.
– N'envoyez pas de liens sortants n'importe où (notamment vers des sites de spam).
– Ne cachez pas d'images, ni de texte (de la même couleur que le fond d'écran). Masquer du texte, des mots-clés… en pied de page ne marche plus et peut même être sanctionné.
Evitez les erreurs bêtes.
– Avant de modifier vos URL, renseignez-vous sur les différentes redirections existantes (301, 302…).
– Ne confondez pas les redirections permanentes et les temporaires.
– Evitez le "tout flash". Même si maintenant les moteurs peuvent indexer Flash, aucun mot-clé ne peut être pris en compte (seul le site dans sa globalité).
– N'utilisez pas le même titre pour toutes les pages.
– Bannissez les Frames.
– Utilisez Javascript avec parcimonie. Et compensez cette technologie avec un sitemap XTML ou une navigation html.
– Enregistrez votre domaine pour 5 ans. Les sites à expiration proche sont pénalisés.
En complément, les 10 points de la Philosophie Google:
https://www.google.fr/intl/fr/corporate/tenthings.html