Firma Akamai Technologies, která se specializuje na cloudové služby a ochranu online aktivit, publikovala zprávu o stavu internetu („State of the Internet“). V ní uvádí, že nejrůznější boty (automatické nástroje procházející stránky) už tvoří 42 % celkového webového provozu, přičemž v 65 % z toho se jedná o boty se zjevně škodlivými úmysly.
Zpráva se zaměřuje a upozorňuje na bezpečnostní a obchodní hrozby, které představují webové „scrapovací boty“. Ty mohou například stahovat ceny z e-shopů a použít je ke konkurenčním účelům, což v konečném důsledku může ovlivnit zisky a tržby těchto obchodů. Pro firmy je proto důležité se chránit a mít přehled o tom, kdo a za jakým účelem na jejich webové stránky vstupuje.
Boty vykrádají weby
Těmto botům nahrává skutečnost, že jejich provoz není zakázán ani regulován žádným zákonem. Podle technického ředitele pro bezpečnostní strategii Patricka Sullivana představují významné riziko, spočívající například v krádeži dat a vytvoření falešných stránek.
Ze zprávy dále vyplývá, že botnety poháněné AI dokážou objevit a extrahovat nestrukturovaná data i v méně konzistentních formátech. Tato data pak mohou být zneužita k vytváření sofistikovaných phishingových kampaní, které kopírují produktové obrázky, popisy a ceny, a vytvářejí falešné e-shopy nebo phishingové stránky sloužící k získání přihlašovacích údajů či informací o platebních kartách.
Boty se nezaměřují jen na elektronické obchody, ale útočí také na obsahové weby, jako je například naše Živě.cz. Z nich nejčastěji kopírují obsah, který následně lehce upraví (díky generativní AI je to snadnější) a bez povolení ho replikují. Takto „vytvořené“ stránky se pak umísťují ve výsledcích vyhledávání, kradou návštěvnost a vydělávají na reklamách.
Boty způsobují problémy
Boty rabující webové stránky mají i technické dopady. Jejich neustálé dotazy mohou způsobit, že servery nestíhají odpovídat, což vede ke zpomalení načítání stránek pro skutečné uživatele. Činnosti botů vyžadují více výpočetních zdrojů, což zvyšuje náklady na provoz serverů a infrastruktury.
Provoz generovaný boty může zkreslit analytické údaje, což ztěžuje správnou analýzu chování skutečných návštěvníků. Boty také mohou zneužít získané přihlašovací údaje k útokům na účty uživatelů, což vede ke kompromitaci dat a narušení bezpečnosti.
Zpráva Scraping Away Your Bottom Line nabízí strategie, jak se scrapovacím botům bránit, a obsahuje případovou studii, která ukazuje, jak výrazně se může zlepšit výkon webových stránek po zavedení obran proti těmto botům.
Poznámka: První verzi článku jsme upravili, nyní v něm pracujeme s boty v neživotném rodě.