Yahoo! a annoncé hier via son blog que Yahoo! Search indexait dorénavant plus de 20 milliards de documents, plus précisément 20 milliards d'"items", d'objets. Ce décompte (qui est le premier fourni par Yahoo! depuis la création du moteur) se décompose comme suit :
- pages web : 19, 2 milliards
- images : 1,6 milliard
- fichiers audio et video : plus de 50 millions
Dans ces effets d'annonces marketing, la taille de l'index importe finalement moins que la pertinence des résultats des premières apges de résultats. De plus, il convient de se poser certaines questions :
- qu'entend-on exactement par "page web" ?
- Yahoo! inclut-il les pages issues des bases de données et agrégateurs payant indexés avec Yahoo! Subscriptions ?
- Combien de pages dupliquées comporte l'index ?
Ce qui est certain c'est que Yahoo! a mis en ligne, ces dernières semaines, de nouveaux services impressionnants et notamment Yahoo! Search Subscriptions, Yahoo! Audio Search, la traduction à la volée (sur Yahoo! Deutschland pour l'instant), l'indexation du Flash sur Yahoo! Search Video ...
En terme d'index, à titre de comparaison, Google indexe actuellement 11,3 milliards d'objets (8.168 milliards de pages web, 2.187 milliards d'images. D'autres part, il archive plus de 1 milliard de messages de newsgroups Usenet). De son côté, MSN Search indexe un peu plus de 5 milliards de pages web.