Список полезных ботов Cloudflare 🔥🔥🔥

Что из себя представляет Cloudflare known bots list - список полезных ботов по мнению Cloudflare. В нем 200 различных ботов, которых фильтры Cloudflare пропускают на сайт при включении опции пропуска хороших ботов known bots.
Большую часть этих ботов нужно блокировать, во избежание проблем с паразитной нагрузкой на хостинге.

Распространенные шаблоны настройки WAF Cloudflare

Во многих наборах начальных настроек правил фильтрации WAF вы найдете правило пропуска полезных ботов (на скриншоте - первый номер).

Список полезных ботов Cloudflare 🔥🔥🔥

Это правило ставится первым в списке фильтров, с действием - Skip. И предназначено для того, чтобы пропускать ботов поисковых систем - YandexBot, Googlebot, bingbot. Ну или, многие так думают. Хотя на самом деле, - это не так.

Список полезных ботов Cloudflare 🔥🔥🔥

Нужно ли пропускать всех хороших ботов

В ваших этих интернетах, как всем известно - плохого не напишут, поэтому вебмастера бездумно копируют себе это все в аккаунт Cloudflare. А потом очень сильно удивляются, когда хостер начинает присылать уведомления о превышении лимита нагрузки, и предлагает перейти на более дорогой тариф. И при всем при этом, в счетчике Яндекс метрики вы видите вполне себе обычные цифры. Например, 100 посетителей в сутки.

И возникает вполне закономерный вопрос - как так. На каком основании хостер хочет на вас нажиться. Вы же грамотно настроили Cloudflare (передрав архивную инструкцию по настройке из интернетов), заблокировали все что движется. Плохих ботов на сайте нет. Наверное.

Ошибка в том, что список хороших ботов, по мнению Cloudflare - намного шире, чем банальные краулеры поисковых систем. В этом списке 200 различных ботов. Среди которых есть и те боты, что создают слишком большую нагрузку на хостинг, постоянно сканируя ваш сайт. А пользы от них - ноль. Только контент воруют, для своего обучения. Например, openai (OAI-SearchBot), AhrefsBot, Applebot, GPTBot, Barkrowler, AhrefsBot, PetalBot, MJ12bot, Photon, и прочее.

Больше всех "повезло" сайтам с большим количеством поддоменов городов. Каждый поддомен считается отдельным сайтом, а значит мусорная нагрузка на хостинг будет увеличиваться пропорционально количеству поддоменов.

Рекомендации по настройке WAF, каких "хороших" ботов нужно блокировать

Чтобы избежать лишней нагрузки на хостинг, всех лишних ботов нужно заблокировать. Для этого нужно проанализировать список тех ботов, которых пропустил Cloudflare, оставить из этого списка действительно полезных (краулеры поисковых систем). А всех  остальных - заблокировать.

Более подробно расписано здесь.

Для этого нужно на первое место в WAF поставить действие Block и внести в него всех лишних ботов, которых Cloudflare пропускает. Так вы снизите нагрузку на свой хостинг, ни капли при этом не проиграв в видимости своего сайта в выдаче поисковых систем. Так как боты поисковиков по-прежнему будут беспрепятственно попадать к вам на сайт.

Примеры ботов для блокировки

Если исключить известных поисковых ботов, в группе "плохих" могут оказаться:

AhrefsBot: Используется для анализа ссылок и SEO, может генерировать большой объем запросов.
MJ12bot: Похож на AhrefsBot, также может создавать значительную нагрузку.
OpenAI Search Bot (OAI-SearchBot): Может вызывать нагрузку, если используется неправильно.
Barkrowler (babbar.tech): Бесполезный, но крайне настырный сканирующий бот.
Другие специализированные сканеры: Например, боты, которые собирают данные для аналитики или мониторинга.

Ниже вы найдете полный список полезных ботов (по мнению Cloudflare). Как вы уже поняли, ваше мнение - отличается от мнения компании. Так что найдите время, найдите в логах переходы, которые пропустило правило Know Bots - и заблокируйте все лишнее.

Список "полезных ботов" Cloudflare

В списке 200 ботов, которых Cloudflare считает полезными ботами, и пропускает при включении опции known bots.

Название ботаРазработчикКатегория бота
GoogleBotGoogleПоисковый робот
QualysQualysБезопасность
Google Image ProxyGoogleПредпросмотр страниц
BingBotMicrosoftПоисковый робот
Synthetic BotDataDogМониторинг и аналитика
GoogleOtherGoogleБот нейросетей
Google AdsBotGoogleРеклама и маркетинг
AmazonbotAmazonБот нейросетей
Google APIGoogleВебхуки
YandexBotYandexПоисковый робот
Google ImagesGoogleПоисковый робот
PinterestBotPinterestАгрегатор
Google Read AloudGoogleПреобразование данных
DetectifyDetectifyБезопасность
New RelicNew RelicМониторинг и аналитика
AhrefsBotAhrefsПоисковая оптимизация
TaboolaTaboolaРеклама и маркетинг
UptimeRobotUptimerobotМониторинг и аналитика
GPTBotOpenAIБот нейросетей
Moz dotbotMozПоисковая оптимизация
ApplebotAppleБот нейросетей
BarkrowlerBabbarПоисковая оптимизация
PetalBotHuaweiБот нейросетей
BLEXBotWebMeUpПоисковая оптимизация
Google AdSenseGoogleРеклама и маркетинг
SendGridSendGridВебхуки
SemrushbotSEMrushПоисковая оптимизация
OAI-SearchBotOAI SearchBotБот нейросетей
Ahrefs Site AuditAhrefsПоисковая оптимизация
DataForSEO BotDataForSEOПоисковая оптимизация
Amazon AdBotAmazonРеклама и маркетинг
BaiduBaiduПоисковый робот
CriteoBotCriteoРеклама и маркетинг
PingdomPingdomМониторинг и аналитика
ContentKingContentKingМониторинг и аналитика
BotifyBotifyПоисковая оптимизация
StripeStripeВебхуки
SucuriSucuriБезопасность
ChatGPT-UserOpenAIБот нейросетей
YahooMailProxyYahooПредпросмотр страниц
Site24x7Site24x7Мониторинг и аналитика
CookiebotCybot A/SБезопасность
Siteimprove CrawlSiteimproveПоисковая оптимизация
SlackbotSlackВебхуки
DuckDuckBotDuckDuckGoПоисковый робот
Better UptimeBetter Up TimeМониторинг и аналитика
BrandwatchBrandwatchМаркетинг в социальных сетях
SeekportSISTRIXПоисковый робот
SogouSogouПоисковый робот
HetrixToolsHetrixTools IncМониторинг и аналитика
FullStoryFull StoryМониторинг и аналитика
webpagetestWebPagetestМониторинг и аналитика
Bing AdsMicrosoftРеклама и маркетинг
SiteAuditBotSemrushПоисковая оптимизация
StatusCakeStatusCakeМониторинг и аналитика
SeznamSeznamПоисковый робот
Cốc CốcCoccocПоисковый робот
ProximicComScoreРеклама и маркетинг
Trendiction BotTrendiction S.A.Мониторинг и аналитика
SiteLockSiteLockБезопасность
Yeti by NaverNaverПоисковый робот
InnologicaInnologicaСбор фидов
Dataprovider.comПоисковый робот
elmah.io Uptime Monitoringelmah.ioМониторинг и аналитика
SE Ranking BotSE RankingМониторинг и аналитика
Yahoo SlurpYahooПоисковый робот
Internet ArchiveInternet ArchiveАрхиватор
ManageWPManageWPВебхуки
CCBotCommonCrawlАрхиватор
ZoomInfoZoomInfoПоисковый робот
ExodusExodusВебхуки
LinkedInBotLinkedInПредпросмотр страниц
Yahoo Ad MonitoringYahooРеклама и маркетинг
FeedlyFeedlyСбор фидов
Telegram BotTelegramПредпросмотр страниц
CxenseCxenseПоисковая оптимизация
BlogVaultBlogVaultМониторинг и аналитика
SkypeSkypeПредпросмотр страниц
ChargeBeeChargeBeeВебхуки
Google VideosGoogleПоисковый робот
SplunkSplunkМониторинг и аналитика
Ghost InspectorGhost InspectorМониторинг и аналитика
FeederReally Simple ABСбор фидов
Slack Image ProxySlackПредпросмотр страниц
Google Inspection ToolGoogleБезопасность
VaultPressVaultPressВебхуки
Oh DearOh DearМониторинг и аналитика
MojeekMojeekПоисковый робот
Coveo BotCoveoПоисковый робот
eMoney AdvisoreMoney AdvisorАгрегатор
Google Schema Markup Testing ToolGoogleМониторинг и аналитика
AwarioAwarioРеклама и маркетинг
FreshpingfreshworksМониторинг и аналитика
OutbrainOutbrainРеклама и маркетинг
NodepingNodepingМониторинг и аналитика
PayPalPayPalВебхуки
GTmetrixGTmetrixМониторинг и аналитика
IAS crawlerIntegral Ad ScienceРеклама и маркетинг
NETVIGIEМониторинг и аналитика
ClickagyClickagyРеклама и маркетинг
MSNMicrosoftПоисковый робот
IframelyIframelyПредпросмотр страниц
WPMUDEV Uptime Monitor 5.0WPMUDEVМониторинг и аналитика
klaviyohttps://www.klaviyo.com/Реклама и маркетинг
UptimiaUptimiaМониторинг и аналитика
RackspaceRackspaceМониторинг и аналитика
Bluesky Link Preview ServiceBlueskyПредпросмотр страниц
Alertsite by SmartbearSmartbearМониторинг и аналитика
Google-AdWords-ExpressGoogleПоисковая оптимизация
DataForSEODataForSEOПоисковая оптимизация
Audisto CrawlerAudistoМониторинг и аналитика
Moz rogerbotMozПоисковая оптимизация
FeedbinFeedbinСбор фидов
HostTrackerHostTrackerМониторинг и аналитика
Amazon ContxbotAmazonРеклама и маркетинг
ReelevantReelevantРеклама и маркетинг
AdyenAdyenВебхуки
FlipboardProxyFlipboardПредпросмотр страниц
Yahoo JapanYahoo Japan CorporationРеклама и маркетинг
Bing PreviewMicrosoftПредпросмотр страниц
Parse.lyParse.lyМониторинг и аналитика
Marginalia SearchMarginaliaПоисковый робот
MetorikMetorikВебхуки
deadlinkcheckerDLC WebsitesМониторинг и аналитика
BlockaidBlockaidБезопасность
EasyCronEasyCronВебхуки
InternetArchiveBotInternet ArchiveМониторинг и аналитика
rss2tg_botrss2tg_botСбор фидов
Mars FinderMars FlagПоисковый робот
QuantcastbotQuantcastРеклама и маркетинг
Jagged Pixel UptimeBotJagged Pixel Inc.Мониторинг и аналитика
SalesViewerBotSalesViewer GmbHРеклама и маркетинг
CludoCludoМониторинг и аналитика
WOVN CrawlerWovn Technologies, Inc.Преобразование данных
updayupday GmbH & Co. KGАгрегатор
Drata AutopilotБезопасность
Arquivo Web CrawlerArquivoАрхиватор
Google Feed FetcherGoogleСбор фидов
DuckAssistbotDuckDuckGoБот нейросетей
FlipboardRSSFlipboardСбор фидов
Let's EncryptLet's EncryptБезопасность
Accessible Web BotAccessible WebПреобразование данных
MonitoRSSMonitoRSSСбор фидов
Sansec Security MonitorSansec Security MonitorБезопасность
HatenaHatenaСбор фидов
ICC CrawlerNICTБот нейросетей
SEO Audit Check BotSEO Audit CheckПоисковая оптимизация
Skroutz ImageBotSkroutz S.A.Разное
PressEngine BotPressEngineПредпросмотр страниц
NewsBlurNewsBlurСбор фидов
Splunk Attack AnalyzerSplunkБезопасность
Online Webceo BotOnline WebceoПоисковая оптимизация
ProjectShield Url CheckGoogleБезопасность
QwantbotQwantПоисковый робот
marketgoomarketgooПоисковая оптимизация
MediaMonitoringBotMediaMonitoringBotАгрегатор
WP UmbrellaWP UmbrellaМониторинг и аналитика
Google Trust Services (DCV Check)GoogleБезопасность
SentrySentryБезопасность
SpectateМониторинг и аналитика
Medialogia BotMedialogiaМониторинг и аналитика
WPMU DEV Broken Link CheckerWPMUDEVМониторинг и аналитика
RSS APIRSS API (by Tibush GmbH)Сбор фидов
WatchfulWatchful LLCМониторинг и аналитика
SecurityHeadersSecurity HeadersБезопасность
LINER BotLiner BotБот нейросетей
JetpackAutomatticМониторинг и аналитика
Rakuten Image extraction botRakutenРазное
NooshubNooshubСбор фидов
Shortwave Image FetcherShortwave Communications Inc.Предпросмотр страниц
FeedWind CrawlerMikleСбор фидов
Swifteq Link CheckerSwfiteq LtdМониторинг и аналитика
IntegromatMakeВебхуки
SkroutzBotSkroutz S.A.Сбор фидов
Modular DSUniqoders Technologies SLВебхуки
Adagio Botnfouche@adagio.ioМониторинг и аналитика
Google ScholarGoogleПоисковый робот
Ozon Web GrabberOzonПредпросмотр страниц
EvoUptimeBotEvo Agency Ltd.Мониторинг и аналитика
HoneybadgerBotHoneybadger IndustriesМониторинг и аналитика
videootv BotDigital GreenАгрегатор
RetroListeCOMNiclas PapstМониторинг и аналитика
Spark ShippingSpark ShippingВебхуки
WebSpiderMountAspenTechLabs IncАгрегатор
MgidBotMGIDРеклама и маркетинг
AutomatonAutomatonМониторинг и аналитика
NotabotHelpfeelПоисковый робот
OpenRSSOpenRSSСбор фидов
Alexa ArchiveAlexaПоисковый робот
SnipcartSnipcartВебхуки
eRepublik.toolsSebastian Foth - Software SolutionsМониторинг и аналитика
AddThisAddthisПоисковая оптимизация
ReadableAdded Bytes LtdПреобразование данных
New York Times NewsgatheringThe New York TimesРазное
Alexa Site AuditAlexaПоисковый робот
CloudtrellisМониторинг и аналитика
Sora Caisse POSРазное
MainWPDirect Support / Website ManagedВебхуки
MacrobondbotMacrobondbotМониторинг и аналитика
Missinglettr BotMissinglettrРеклама и маркетинг

Российская альтернатива Cloudflare

Функцию фильтрации ботов Cloudflare может на себя взять российский антибот Killbot. Вот к нему у РКН точно претензий нет, сервера компании находятся в РФ. Принцип работы отличается от привычного, отслеживаются не знакомые всем при настройке Cloudflare параметры (входящие IP адреса, AS подсети ботов, User Agent и прочее), а уникальные для каждого набора браузеров слепки. По отличию оригинального браузера от модифицированного, тот или иной заход определяется либо как заход реального посетителя, либо как заход бота. Чтобы не повторяться - расписывал более подробно в статье Альтернатива Cloudflare в России.

При регистрации в Killbot введите промокод antiddos24 и получите месяц тестирования платного тарифа (1000 руб) в качестве бонуса. Этого вам хватит на то, чтобы понять, подходит вам данное решение, или нет.
Также по промокоду автоматически подключается подписка на интеграцию с Яндекс Директ, вы можете синхронизировать Киллбот и рекламный кабинет РСЯ, и наконец избавиться от недействительных кликов и скликивания рекламы конкурентами. Поведенческим ботам устанавливается ставка -100% и объявления не показываются, экономя ваш рекламный бюджет.

Подпишитесь на Telegram канал для того, чтобы всегда быть в курсе последних новостей и обновленных настроек для защиты от ботов через Cloudflare, а также оперативно получать новые материалы, выходящие на antiddos24.ru

Всегда нужно иметь в виду, что те советы, которые вы прочли в статьях на сайте antiddos24.ru - это лишь часть настроек, которые я делаю при профессиональной экспертной настройке фильтрации поведенческих ботов. Все остальное - это непубличные профессиональные секреты. Любая информация, становящаяся общедоступной - достаточно быстро устаревает и перестает быть эффективной.
Если вы столкнулись с повышенной ботностью в Яндекс метрике, увеличением числа прямых заходов, увеличением количества отказов - вы всегда можете заказать у меня настройку Cloudflare или Killbot.

Услуги

Свежие записи

Портфолио

AntiDDOS24

АнтиДДОС, поведенческие факторы, защита от ботов, настройка Cloudflare и КиллБот.

Telegram

@antiddos24

Быстрее всего отвечаю в Telegram.

На значок Telegram можно нажать.
Более 500 выполненных работ на Кворк, положительные отзывы, профессионально занимаюсь защитой от ДДОС с 2017 года.
Ссылка на кворк
Свяжитесь со мной, для согласования перечня работ и условий оплаты.
Контакты
Copyright © 2024, AntiDDOS24. Копирование материалов сайта запрещено.
menu-circlecross-circle