{"id":455,"date":"2008-05-12T08:26:32","date_gmt":"2008-05-12T07:26:32","guid":{"rendered":"http:\/\/www.waebo.com\/TiChouStyle\/2008-05-12\/google-technologie-pour-indexer-le-web-invisible\/"},"modified":"2008-05-12T09:12:32","modified_gmt":"2008-05-12T08:12:32","slug":"google-technologie-pour-indexer-le-web-invisible","status":"publish","type":"post","link":"https:\/\/www.waebo.com\/TiChouStyle\/2008-05-12\/google-technologie-pour-indexer-le-web-invisible\/","title":{"rendered":"Google : technologie pour indexer le Web invisible"},"content":{"rendered":"<p>Le <strong>web invisible<\/strong> est toute la partie des pages internet qui est g\u00e9n\u00e9r\u00e9e via des requ\u00eates dynamiques cherchant les informations dans les bases de donn\u00e9es et que les robots (bots) ne peuvent pour l&rsquo;instant pas crawler et donc pas indexer. J&rsquo;esp\u00e8re que cette d\u00e9finition vous plait car j&rsquo;ai tout donn\u00e9 !<\/p>\n<p>Google a annonc\u00e9 le 15 avril 2008 via son blog (oui j&rsquo;ai du retard sur certaines news, toutes mes excuses&#8230;) qu&rsquo;il travaillait sur une technologie capable de comprendre tout ce qui n&rsquo;est actuellement connu que de r\u00e9elles personnes comme vous et moi. Les formulaires seront donc pris d&rsquo;assaut avec les mots contenus dans ledit site internet. Le bot va en quelque sorte reproduite une recherche effectu\u00e9e par un utilisateur \u00e0 la diff\u00e9rence qu&rsquo;il ne pourra \u00e0 priori pas innover puisqu&rsquo;il prendra, comme dit pr\u00e9c\u00e9demment, des donn\u00e9es d\u00e9j\u00e0 pr\u00e9sentes sur le site. La technologie sera cependant limit\u00e9e aux <strong>formulaires envoyant les donn\u00e9es par l&rsquo;url<\/strong> (adresse), c&rsquo;est-\u00e0-dire en GET, et non celles envoy\u00e9es via l&rsquo;en-t\u00eate du site (ie. POST). A noter qu&rsquo;il sera bien s\u00fbr possible de limiter le crawl et donc l&rsquo;indexation via le simple fichier <em>robots.txt<\/em> bien connu des webmasters.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Le web invisible est toute la partie des pages internet qui est g\u00e9n\u00e9r\u00e9e via des requ\u00eates dynamiques cherchant les informations dans les bases de donn\u00e9es et que les robots (bots) ne peuvent pour l&rsquo;instant pas crawler et donc pas indexer. J&rsquo;esp\u00e8re que cette d\u00e9finition vous plait car j&rsquo;ai tout donn\u00e9 ! Google a annonc\u00e9 le [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[141],"tags":[33],"class_list":["post-455","post","type-post","status-publish","format-standard","hentry","category-webmastering","tag-google"],"_links":{"self":[{"href":"https:\/\/www.waebo.com\/TiChouStyle\/wp-json\/wp\/v2\/posts\/455","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.waebo.com\/TiChouStyle\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.waebo.com\/TiChouStyle\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.waebo.com\/TiChouStyle\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.waebo.com\/TiChouStyle\/wp-json\/wp\/v2\/comments?post=455"}],"version-history":[{"count":0,"href":"https:\/\/www.waebo.com\/TiChouStyle\/wp-json\/wp\/v2\/posts\/455\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.waebo.com\/TiChouStyle\/wp-json\/wp\/v2\/media?parent=455"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.waebo.com\/TiChouStyle\/wp-json\/wp\/v2\/categories?post=455"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.waebo.com\/TiChouStyle\/wp-json\/wp\/v2\/tags?post=455"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}