Google Caffeine est le nom code pour la dernière itération de Google pour son produit de recherche. L’idée était simple mais englobant: à «repousser les limites sur la taille, vitesse d’indexation, l’exactitude, l’exhaustivité et d’autres dimensions. » Retour en Décembre, il semblait presque prête, mais n’est jamais venu.Aujourd’hui, il est enfin prêt à rouler.
Dans un post sur le blog de Google, la société à déclaré que le système d’indexation web ‘Google Caffeine’ est complète. Significativement, il prévoit que «50 pour cent des résultats plus frais pour les recherches sur le Web que leur dernier index, et c’est la plus grande collection de contenu Web, Fondamentalement, vous allez maintenant être en mesure de trouver les liens les plus récents plus vite que jamais.
Google indique que l’ancien index est composé de plusieurs couches (dont certains ont été mis à jour plus rapidement que d’autres), par contre le nouvel index sera Caféiné « analyser le Web en petites portions et mettre à jour l’index de recherche sur une base continue, au niveau mondial. »

Quelques grands statistiques et renseignements sur Caffeine:
Chaque seconde Caffeine calcule des centaines de milliers de pages en parallèle, s’il s’agissait d’un monceau de papier il va s’accroître trois miles plus haut chaque seconde.
La Caffeine prend près de 100 millions de gigaoctets de stockage dans une base de données et ajoute de nouvelles informations à un taux de centaines de milliers de giga-octets par jour.
Il faudrait 625.000 de la plus grande iPod pour stocker ce grand volume d’informations.
Tag supplémentaires :
- vivastreet rakuten
Posts relatifs:
- Google test la Mise à jour Live des résultats de la recherche (Vídeo) Il est donc confirmé, Google teste de nouvelles...
- Google teste des aperçus de site sur les pages de résultats Google teste actuellement des aperçus en pleine page, un...
- Nouvelles Google: l’actualité des Nouveaux Produits de Google Google vient de lancer un nouveau produit, Nouvelles Google....
- Google Doodle pour son anniversaire Google célèbre son 12e anniversaire aujourd’hui, comme vous l’avez...
- Google Translate avec une nouvelle interface Google a donné à Google Translate le lifting qu’il...
Bonjour,
Une petite question par rapport à caféine. Chez un client, je suis obligé de bloquer les moteurs de recherche sur un nombre conséquent d’URLs (robots.txt) pour cause de saturation du site et plantage au final de tomcat.
Question 1 : Y a-t-il d’autres remontées de ce type ou est-ce un cas unique?
Question 2 : y a-t-il des options spécifiques pour caféine que l’on puisse poser dans le robots.txt (ex: fréquence d’indexation ou plage horaires) ?
Merci