Joueb.com
Envie de créer un weblog ?
Soutenez le Secours populaire
ViaBloga
Le nec plus ultra pour créer un site web.
Débarrassez vous de cette publicité : participez ! :O)

Taille d'index de Yahoo! : objectif atteint
--> tout le monde en parle

Yahoo! semble avoir atteint son objectif : faire parler de lui dans un monde brut de moteurs où ne l'on parle que de Google. La taille de l'index fait écrire beaucoup de blogs, sites ou même journaux prestigieux. Petite revue de presse...
Le 8 août, Yahoo! publie dans son blog la nouvelle taille de son index : 19,2 milliards de "documents web"...Impressionnant puisque l'index de Google ne compte "que"
8 milliards (8 168 684 336)  de "pages Web recensées".
  
Totu de même, est-ce bien raisonnable de s'attaquer à la supprématie de Google avec des chiffres aussi grossiers ?
Ainsi
l'étude du NCSA "A Comparison of the Size of the Yahoo! and Google Indices" semble démontrer que, sur des reuêtes retournant moins de de 1000 résultats, Google apporte toujours plus de résultats que Yahoo!.
Mais la méthodologie de cette étude est très critiquée par l'excellent Jean Veronis sur Technologies du Langage (d'ailleurs repris par une gazette locale, le New York Times !).
Cette critique méthodologique est également faite par le programmeur Seth Finkelstein sur son blog Infothought.

Sur SEW Blog, Danny Sullivan, quelque peu excédé par ces "chiffres farfelus" défie carrément Google et Yahoo! d'apporter des éclairages méthodologiques quandceux-ci annoncent année après année ce type de chiffres : "Ideally, I want to see the major search engines come together to develop a unified, accepted way to measure relevancy in various ways: web search, local search, advanced queries, whatever. Establish a research center, a consortium or something and a methodology that all will agree upon".

Quant au célèbre Shlashdot, il considère les résultats de l'étude du NCSA comme plutôt justes.

John Battelle, lui, rapporte une conversation qu'il a eu avec un cadre de chez Google qui se dit "troublé par l'annonce de Yahoo!, les ingénieurs de Google ne trouvant aucune preuve de cette taille d'index à travers leurs tests". Le contraire eut été étonnant.

Enfin, le NY Times cite Sergey Brin, co-fondateur de Google : "Sergey Brin, Google's co-founder, suggested that the Yahoo index was inflated with duplicate entries in such a way as to cut its effectiveness despite its large size".

Mais d'après les tests de Jean Véronis et Seth Finkelstein, on est plutôt en présence du cas contraire : davantage de duplications sur Google....

Le mot de la fin pour un professeur de Stanford (CA), toujours dans le  New York Times : "It's a little bit silly, said Christopher Manning, a Stanford University professor who teaches a course on information retrieval. It's difficult, and the whole question of how big indexes are has clearly become extremely political and commercial".
En tout les cas, Yahoo! fait beaucoup parler de lui à partir de son annonce postée sur son blog le 8 août, par coïncidence, le jour de l'ouverture du salon SES Conference (Search Engine Strategies). Qui a parlé de stratégie ?

P.S : Dubitatif ? faîtes vous déjà votre idée sur les différences entre Google et Yahoo! en testant les 2 moteurs simultanément sur Gahoo!Yoogle ou sur Dogpile ici et .

Ecrit par slide68, le Mercredi 17 Août 2005, 22:37 dans la rubrique "Yahoo!".