BingBot : Le crawler (user agent) du moteur de recherche change de nom

Microsoft annonce des modifications importantes concernant son robot de crawling. A partir du premier octobre 2010, ce dernier perdra d’une part l’étiquette bêta mais changera surtout de nom. Jusqu’à présent baptisé MSNBot (de MSN Search), et ce malgré le passage à Live Search, celui-ci s’appellera bientôt BingBot, en accord avec la marque actuelle du produit de la firme de Redmond.

Le user agent sera plus précisément identifiable par :

Mozilla/5.0 (compatible; bingbot/2.0 +http://www.bing.com/bingbot.htm)

Le champ From de l’en-tête HTTP renverra :

From: bingbot(at)microsoft.com

Du côté des instructions précisées à l’actuel crawler via le fichier robots.txt, Bing annonce une rétrocompatibilité. Avec toute fois un bémol puisque seront prises en compte par le BingBot les moins restrictives d’entre elles.

User-agent: bingbot
Disallow: /photos/

User-agent: msnbot
isallow: /photos/
Disallow: /videos/

User-agent: *
Disallow: /

Pour l’exemple ci-dessus, BingBot aura donc accès à tout le contenu excepté le répertoire photos.

Microsoft prévient à l’avance pour laisser le temps de mettre à jour les installations. Avis aux développeurs qui établissent des logs de crawl, aux adeptes du cloaking ou encore ceux qui souhaitent se faire passer pour le BingBot.

Source : Blog Bing

Baptiste Simon aka TiChou

Ingénieur développeur web dans le secteur du e-commerce et du tourisme mais avant toute chose passionné par internet et ses intarissables ressources.

2 commentaires, pings et rétroliens

Partenaires et blog à la une