Intervention de Philippe Yonnet, vivastreet
Tous les moteurs de recherche poursuivent le même objectif: être le plus pertinent pour chaque demande. La notion de pertinence peut être très subjective (le plus pertinent sur Obama est l’article de wikipedia? le site de la Maison Blanche? son site perso? son profil Facebook?). Aujourd’hui, il y a plus de points communs que de réelles différences entre les différents algorithmes des moteurs de recherche.
Mais, connaître la liste des “ingrédients” utilisés est une chose, connaître les “dosages” en est une autre. Le poids de chaque critère et son importance relative ont un fort impact sur les résultats obtenus.
Critères de classement des résultats:
Ils doivent être pertinents pour donner la meilleure réponse à chaque question.
Ils doivent être faciles et rapides à calculer. L’internaute étant impatient, la rapidité de réponse est stratégique.
Dans la mesure du possible, il doit être “non spammable”.
Comment les choisir?
Proposer des résultats qui contiennent les termes de recherche.
Mais proposer aussi des résultats dont le contenu est proche.
Le code HTML permettant de pondérer les différents termes en fonction des balises où on les trouve. Title: contenu de la page. H1: élément le plus important…
La simple hiérarchie des balises HTML (Altavista) n’était pas très efficace:
1) Titre, anchor text des backlinks, texte en rapport avec la requête.
2) Mot clé dans l’url. Mot clé dans le H1.
3) Autres balises: B, EM, ALT…
Problème:
Quand la réponse a une forte concurrence, les 100 premiers résultats sont très proches sur les différents critères. Tous ont autant de chances d’être le plus pertinent. Il faut donc d’autres critères de classement. D’où le Page Rank de Google.
Fonctionnement des liens
Ils donnent une indication de la popularité.
Ils relient différentes variations autour d’un même thème.
Ils sont émis par des sites d’autorité plus ou moins importante.
Hiérarchie des liens entrants (backlinks):
1) Liens venant de sites à PR élevé.
2) Qualité: site de confiance (trust rank), thème proche, non-spam.
Critères on-page ou off-page?
Ce n’est pas réellement important.
Préférer les critères dépendants de la requête aux critères indépendants.
Les limites du PR:
Tous les liens n’ont pas la même valeur.
Le PR est structurellement tourné vers le passé.
Les internautes n’ont pas la même logique et ne surfent pas que sur des “sites de confiance”.
Ne prend pas en compte l’usage: CTR, taux de rebond…
Quels sont les nouveaux critères à prendre en compte?
Les moteurs cherchent à déterminer le type d’info recherchée: “Paris Hilton” ne demande pas (a priori) les mêmes réponses qu’ “Hilton Paris”.
La recherche est-elle liée à un évènement? à une date? à l’actu?
La recherche est-elle marchande? ou non marchande?
L’internaute recherche-t’il un avis? un support? un prix? un point de vente?
La recherche concerne-t’elle une personne ou une société?
Géolocalisation:
Tendance en fort développement notamment à cause (grâce à?) de la mobilité et des smartphones.
2 approches: partir du nom de lieu reconnu dans la requête ou partir du principe que la requête demande une géolocalisation.
Par exemple, si je tape '”hotel” dans la recherche Google, je suis géolocalisé à Paris par ma connexion Internet. Donc Google me propose automatiquement des hôtels à Paris.
Requêtes transactionnelles:
La requête indique-t’elle une intention d’achat.
Dans ce cas, l’intenaute recherche-t’il une info? un prix? un lieu d’achat? un site e-commerce? Cela peut d’ailleurs être le même internaute selon l’évolution de sa démarche.
Microsoft annonce une prédictivité de près de 90% sur le sujet.
Nouvelles fonctionnalités de Google:
Depuis quelques mois, les pages de résultats Google ont évolué et proposent d’affiner les résultats en fonction de la date, dans une langue spécifique, sur un blog, dans l’actualité…
Réseaux Sociaux:
Compte tenu du fort développement de ces outils (citations Twitter ou Facebook, Digg-like, blogs, forums, avis…), ils pourraient prendre plus d’importance dans les pages de résultats.
Limites de la personnalisation:
Jaguar: voiture ou animal?
Java: danse? île? ou informatique?
La pertinence est liée au contexte de la recherche. Le contexte inconnu empêche d’avoir personnalisation ET pertinence.