{"id":745,"date":"2024-05-15T08:29:15","date_gmt":"2024-05-15T08:29:15","guid":{"rendered":"https:\/\/www.demenageur-site.com\/blog\/?p=745"},"modified":"2024-05-15T08:29:33","modified_gmt":"2024-05-15T08:29:33","slug":"bloquer-le-robot-bytedance-via-un-fichier-htaccess","status":"publish","type":"post","link":"https:\/\/www.demenageur-site.com\/blog\/2024\/05\/bloquer-le-robot-bytedance-via-un-fichier-htaccess\/","title":{"rendered":"Bloquer le robot ByteDance via un fichier .htaccess"},"content":{"rendered":"<p>Nouvelle plaie de l&rsquo;h\u00e9bergement de sites web, les robots d&rsquo;indexation sauvage d&rsquo;images et contenus..<\/p>\n<p>Depuis quelques mois nous sommes contact\u00e9s par des clients dont les serveurs sont soumis \u00e0 des charges non reli\u00e9es \u00e0 des pics de visiteurs \u00ab\u00a0humains\u00a0\u00bb<\/p>\n<p>En consultant les logs des serveurs, on s&rsquo;aper\u00e7oit de quantit\u00e9s faramineuses de requ\u00e8tes issues d&rsquo;un robot \u00ab\u00a0ByteDance\u00a0\u00bb, qui crawle l&rsquo;int\u00e9gralit\u00e9 des sites sans m\u00e9nagement&#8230; ( sur l&rsquo;un des cas, plus de 237 000 requ\u00e8tes en quelques heures, pour un petit site e-commerce contenant beaucoup d&rsquo;images de produits)<\/p>\n<p>R\u00e9sultats : des lenteurs, des surcharges, des plantages, qui p\u00e9nalisent le trafic l\u00e9gitime sans aucun gain pour l&rsquo;\u00e9diteur du site.<\/p>\n<p>Voici un exemple de directives \u00e0 placer au d\u00e9but d&rsquo;un fichier .htaccess (pour Apache) afin de bloquer quelques robots dont l&rsquo;utilit\u00e9 est plus que discutable&#8230;<\/p>\n<blockquote><p>RewriteEngine On<br \/>\nRewriteCond %{HTTP_USER_AGENT} ^.*(Bytespider|bytedance|Amazonbot).*$ [NC]<br \/>\nRewriteRule .* &#8211; [F,L]<\/p><\/blockquote>\n<p>Le serveur r\u00e9pondra imm\u00e9diatement une erreur 403, sans solliciter votre CMS et donc votre base de donn\u00e9es. Un gain appr\u00e9ciable en ressources !<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Nouvelle plaie de l&rsquo;h\u00e9bergement de sites web, les robots d&rsquo;indexation sauvage d&rsquo;images et contenus.. Depuis quelques mois nous sommes contact\u00e9s par des clients dont les serveurs sont soumis \u00e0 des charges non reli\u00e9es \u00e0 des pics de visiteurs \u00ab\u00a0humains\u00a0\u00bb En<span class=\"ellipsis\">&hellip;<\/span><\/p>\n<div class=\"read-more\"><a href=\"https:\/\/www.demenageur-site.com\/blog\/2024\/05\/bloquer-le-robot-bytedance-via-un-fichier-htaccess\/\">Lire la suite &#8250;<\/a><\/div>\n<p><!-- end of .read-more --><\/p>\n","protected":false},"author":4,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5,58],"tags":[],"class_list":["post-745","post","type-post","status-publish","format-standard","hentry","category-actualites","category-securite"],"_links":{"self":[{"href":"https:\/\/www.demenageur-site.com\/blog\/wp-json\/wp\/v2\/posts\/745","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.demenageur-site.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.demenageur-site.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.demenageur-site.com\/blog\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.demenageur-site.com\/blog\/wp-json\/wp\/v2\/comments?post=745"}],"version-history":[{"count":2,"href":"https:\/\/www.demenageur-site.com\/blog\/wp-json\/wp\/v2\/posts\/745\/revisions"}],"predecessor-version":[{"id":747,"href":"https:\/\/www.demenageur-site.com\/blog\/wp-json\/wp\/v2\/posts\/745\/revisions\/747"}],"wp:attachment":[{"href":"https:\/\/www.demenageur-site.com\/blog\/wp-json\/wp\/v2\/media?parent=745"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.demenageur-site.com\/blog\/wp-json\/wp\/v2\/categories?post=745"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.demenageur-site.com\/blog\/wp-json\/wp\/v2\/tags?post=745"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}