Automaticke stahovanie vacsieho mnozstva stranok

2 odpovědi řadit od nejnovějších

21. 1. 2025 • 13:52

Cafte,mam stiahnut vacsie mnozstvo html stranok. Provider o tom vie a moju ip-cku pridal do zamestnaneckeho zoznamu. Problem je, ze bez prihlasenia su clanky kratene.Na stranke sa prihlasuje cez nejaku javovsku vec, ktoru som este nezacal luskat a radsej to skusam inak. Ako prve som si aj bez prihlasenia urobil zoznam linkov.1) seleniumPotom som cez Selenium spustil prehliadac, prihlasil sa normalne rucne v prehliadaci (meno, heslo, akceptacia cookies,...) a dalej som nechal Selenium nech sam stahuje. Problem je, ze Selenium sa mi zda nestabilny, a napr. po 2 000 strankach padne, a ani neviem preco. Alebo po rucnom prihlaseni otvori prvu stranku zo zoznamu a padne. A tiez sa mi zda, ze casto menia syntax. Co fungovalo pred casom, mi niekedy vypise, ze funcia nie je podporovana... Ako keby to stale bolo vo vyvoji.2) automaticke mys/klavesnica klikacie programyDalej som rozmyslal o roznych Ukázat celý příspěvek

21. 1. 2025 • 14:27

Já bych se asi přihlásil v prohlížeči a pak bych si ukradl přihlášenou session cookie.Následně přes CURL podvrhnout tu přihlášenou session cookie a zkusil stáhnout stránku. Pokud to bude ok, tak ten curl command zkopírovat a zadat tam další adresu.

21. 1. 2025 • 15:38

To bude za predpokladu ze to nejakou session vytváří a autentifikace je v ni ulozena a posila se get nebo post promennou. Muze to byt resene treba pres SSO kde se vklada username do hlavicek pozadavku a prihlaseni se kontroluje dle nich. Pak bude muset poslat spravnou hlavicku

Určitě si přečtěte

Články odjinud