Joueb.com
Envie de créer un weblog ?
ViaBloga
Le nec plus ultra pour créer un site web.
Débarrassez vous de cette publicité : participez ! :O)

La recherche par similarité


Sans doute vous est-il déjà arrivé de vouloir dénicher un site "similaire" à celui que vous aviez trouvé afin d'obtenir un contenu approchant. Sur des services comme Amazon ou Fnac, la rubrique "les internautes qui ont acheté [ce livre] ont également acheté [les livres]" va dans ce sens. Le service musical Pandora vous propose de découvrir des chansons et morceaux "similaires" à ceux que vous écoutez en fonction des genres, sons, textures, influences... Dans le domaine des images, XCavatorRetrievr ou Like.com permettent de trouver des documents similaires. 
Et pour un site web ?
Quelques pistes pour trouver des sites "similaires" :

1. Google : le lien Pages similaires (Similar pages)
Chaque résultat dispose du  lien Pages similaires qui permet d'afficher des sites que le moteur estime similaires.
Exemple : des sites similaires à eMusic
Vous pouvez obtenir ces résultats via la syntaxe related: . exemple : related:www.emusic.com

2. Parcourir les catégories des annuaires
Les internautes délaissent les répertoires pour les moteurs. Et pourtant, ils peuvent faire gagner un temps précieux.
Entrer "emusic" sur l'Open Directory ou l'annuaire Yahoo! permet de découvrir la catégorie à laquelle ce site appartient.
On peut ensuite explorer Shopping > Entertainment > ... > Audio > Music > Sound Files > MP3  et yahoo.com/Business_and_Economy/Shopping_and_Services/Music/Digital_Distribution/ pour découvrir des sites proches/concurrents de eMusic.

3. Utiliser les bookmarks sociaux
Les outils Web 2.0 sont très utiles pour cette recherche par similarité.
- Le service français Yoono permet de partager ses favoris et d'interroger les bases de favoris des autres internautes. Yoono va notamment permettre, en analysant les adresses des favoris des autres utilisateurs, de trouver des sites similaires à cekui que vous lui soumettez : exemple avec eMusic.

-Dans le même esprit, l'outil Similicio.us interroge les bookmarks sociaux de Del.icio.us (j'avais évoqué Similicio.us ici). Il analyse les tags et favoris des utilisateurs de Del.icio.us. Exemple : les internautes qui ont taggé le site Yahoo! Music ont également taggé ces autres sites.

4. Utiliser une recherche "orientée résultat"
Vous avez trouvé un certain nombre de sites "similaires" et souhaitez compléter la liste ? Essayez une recherche "orientée résultat"  c'est-à-dire en imaginant ce que votre résultat doit contenir comme mots et expressions clés. Ainsi, si une page parle de eMusic, Yahoo! Music et iTunes, il y a fort à parier qu'elle évoque d'autres sites du même type. En entrant 3 noms de service sur Google, exemple : "MSN Music", Rhapsody, emusic, vous obtiendrez dans les 10 premiers résultats, des pages de sites qui listent, synthétisent ou comparent des sites de téléchargement de musiques. Pour ce type de recherche, des mots clés comme comparatifs, comparison, banc d'essai, best of, les meilleurs...affinent les résultats.

Christophe ASSELIN

Ecrit par slide68, le Lundi 15 Janvier 2007, 10:45 dans la rubrique "Méthodologie-Process information".

Commentaires :

christophe
15-01-07 à 13:07

Lien croisé

Wiw2.com, Web 2.0: The Web become my personal network (Fr) : "> inFLUX > rechercher Sans doute vous est-il déjà arrivé de vouloir dénicher un site "similaire" à celui que vous aviez trouvé afin d'obtenir un contenu approchant. Sur des services comme Amazon ou Fnac, la rubrique "les internautes qui ont acheté [ce livre] ont également acheté [les li" rel="nofollow"

 
christophe
15-01-07 à 20:42

Lien croisé

Infobulles.ch - Syndication de flux RSS : "  » ‎" rel="nofollow"

 
christophe
18-10-09 à 18:19

Lien croisé

CV Christophe ASSELIN - Expert Veille Internet, e-réputation, Web Evange : "Trop de Wikipedia sur Google ? (inFLUX)   La recherche par similarité (inFLUX)   "