V tomto článku vám ukážem, ako obnoviť stránku pomocou knižnice Selenium Python. Takže poďme na to.
Predpoklady:
Ak chcete vyskúšať príkazy a príklady tohto článku, musíte mať,
1) Vo vašom počítači je nainštalovaná distribúcia Linuxu (najlepšie Ubuntu).
2) Vo vašom počítači je nainštalovaný Python 3.
3) Vo vašom počítači je nainštalovaný program PIP 3.
4) Python virtualenv balík nainštalovaný vo vašom počítači.
5) Vo vašom počítači sú nainštalované webové prehľadávače Mozilla Firefox alebo Google Chrome.
6) Musíte vedieť, ako nainštalovať ovládač Firefox Gecko alebo webový ovládač Chrome.
Pre splnenie požiadaviek 4, 5 a 6 si prečítajte môj článok Úvod do selénu v Pythone 3 v Linuxhint.com.
Mnoho článkov o ďalších témach nájdete na stránkach LinuxHint.com. Ak potrebujete pomoc, nezabudnite ich skontrolovať.
Nastavenie adresára projektu:
Ak chcete mať všetko usporiadané, vytvorte nový adresár projektu selén-refresh / nasledovne:
$ mkdir -pv selenium-refresh / ovládače
Prejdite na ikonu selén-refresh / adresár projektu nasledovne:
$ cd selén-refresh /
Vytvorte virtuálne prostredie Pythonu v adresári projektu takto:
$ virtualenv .venv
Aktivujte virtuálne prostredie nasledovne:
$ zdroj .venv / bin / aktivovať
Nainštalujte knižnicu selénu Python pomocou PIP3 nasledovne:
$ pip3 nainštalujte selén
Stiahnite a nainštalujte všetky požadované webové ovládače v vodiči / adresár projektu. V mojom článku som vysvetlil proces sťahovania a inštalácie webových ovládačov Úvod do selénu v Pythone 3. Ak potrebujete pomoc, hľadajte ďalej LinuxHint.com pre ten clanok.
Metóda 1: Použitie metódy prehľadávania refresh ()
Prvá metóda je najjednoduchšia a odporúčaná metóda na osvieženie stránky so selénom.
Vytvorte nový skript v jazyku Python ex01.py a zadajte do neho nasledujúce riadky kódov.
z webového ovládača na selén na importzo selénu.webdriver.bežné.kľúče na import kľúčov
od času import spánku
options = webdriver.ChromeOptions ()
možnosti.bezhlavý = Pravda
prehliadač = webdriver.Chrome (executable_path = "./ drivers / chromedriver ", možnosti = možnosti)
prehliadač.get ("https: // www.unixtimestamp.com / ")
timestamp = prehliadač.find_element_by_xpath ("// h3 [@ class = 'text-danger'] [1]")
print ('Aktuálna časová známka:% s'% (časová známka.text.split (") [0]))
spánok (5)
prehliadač.Obnoviť()
timestamp = prehliadač.find_element_by_xpath ("// h3 [@ class = 'text-danger'] [1]")
print ('Aktuálna časová známka:% s'% (časová známka.text.split (") [0]))
prehliadač.Zavrieť()
Po dokončení uložte súbor ex01.py Skript v jazyku Python.
Riadok 1 a 2 importuje všetky požadované komponenty selénu.
Riadok 3 importuje funkciu sleep () z časovej knižnice. Použijem to na niekoľko sekúnd čakania na aktualizáciu webovej stránky, aby sme mohli po obnovení webovej stránky načítať nové údaje.
Riadok 5 vytvára objekt Možnosti prehliadača Chrome a riadok 6 umožňuje bezhlavý režim webového prehliadača Chrome.
Riadok 8 vytvára Chrome prehliadač objekt pomocou chromedriver binárne z vodiči / adresár projektu.
Riadok 9 informuje prehliadač, aby načítal webovú stránku unixtimestamp.com.
Riadok 11 vyhľadá prvok, ktorý má zo stránky údaje časových značiek, pomocou selektora XPath a uloží ich do súboru časová značka premenná.
Riadok 12 analyzuje údaje časovej pečiatky z prvku a vytlačí ich na konzolu.
Riadok 14 používa spánok () funkciu počkajte 5 sekúnd.
Riadok 15 aktualizuje aktuálnu stránku pomocou prehliadač.Obnoviť() metóda.
Riadok 17 a 18 je rovnaký ako riadok 11 a 12. Nájde prvok časovej pečiatky zo stránky a vytlačí aktualizovanú časovú pečiatku na konzolu.
Riadok 20 zavrie prehliadač.
Spustite skript v jazyku Python ex01.py nasledovne:
$ python3 ex01.py
Ako vidíte, časová značka je vytlačená na konzole.
Po 5 sekundách od vytlačenia prvej časovej značky sa stránka obnoví a aktualizovaná časová značka sa vytlačí na konzolu, ako vidíte na snímke obrazovky nižšie.
Metóda 2: Prehodnotenie rovnakej adresy URL
Druhým spôsobom obnovenia stránky je opätovné navštívenie rovnakej adresy URL pomocou znaku prehliadač.dostať () metóda.
Vytvorte skript v jazyku Python ex02.py do adresára projektu a zadajte do neho nasledujúce riadky kódov.
z webového ovládača na selén na importzo selénu.webdriver.bežné.kľúče na import kľúčov
od času import spánku
options = webdriver.ChromeOptions ()
možnosti.bezhlavý = Pravda
prehliadač = webdriver.Chrome (executable_path = "./ drivers / chromedriver ", možnosti = možnosti)
prehliadač.get ("https: // www.unixtimestamp.com / ")
timestamp = prehliadač.find_element_by_xpath ("// h3 [@ class = 'text-danger'] [1]")
print ('Aktuálna časová známka:% s'% (časová známka.text.split (") [0]))
spánok (5)
prehliadač.získať (prehliadač.current_url)
timestamp = prehliadač.find_element_by_xpath ("// h3 [@ class = 'text-danger'] [1]")
print ('Aktuálna časová známka:% s'% (časová známka.text.split (") [0]))
prehliadač.Zavrieť()
Po dokončení uložte súbor ex02.py Skript v jazyku Python.
Všetko je rovnaké ako v ex01.py. Rozdiel je iba v riadku 15.
Tu používam prehliadač.dostať () spôsob návštevy aktuálnej adresy URL stránky. Aktuálnu adresu URL stránky je možné získať pomocou prehliadač.current_url nehnuteľnosť.
Spustiť ex02.py Skript v jazyku Python takto:
$ python3 ex02.py
Ako vidíte, Pythionov skript ex02.py vypíše rovnaký typ informácií ako v ex01.py.
Záver:
V tomto článku som vám ukázal 2 spôsoby obnovenia aktuálnej webovej stránky pomocou knižnice Selenium Python. So selénom by ste teraz mali byť schopní robiť viac zaujímavých vecí.