Data Science

Výukový program pre Python Seaborn

Výukový program pre Python Seaborn
V tejto lekcii o knižnici Python Seaborn sa pozrieme na rôzne aspekty tejto knižnice vizualizácie údajov, ktorú môžeme v Pythone použiť na generovanie krásnych a intuitívnych grafov, ktoré dokážu vizualizovať údaje vo forme, ktorú chce podnik z platformy. Aby bola táto lekcia kompletná, venujeme sa týmto častiam:

Vyzerá to, že treba veľa pokryť. Začnime teraz.

Čo je knižnica Python Seaborn?

Knižnica Seaborn je balík Python, ktorý nám umožňuje vytvárať infografiky na základe štatistických údajov. Pretože je vyrobený nad matplotlib, je s ním vo svojej podstate kompatibilný. Ďalej podporuje dátovú štruktúru NumPy a Pandas, takže vykreslenie je možné vykonať priamo z týchto zbierok.

Vizualizácia komplexných údajov je jednou z najdôležitejších vecí, o ktoré sa Seaborn stará. Ak by sme mali porovnať Matplotlib s Seabornom, Seaborn je schopný uľahčiť tie veci, ktoré je ťažké dosiahnuť pomocou Matplotlibu. Je však dôležité poznamenať, že Seaborn nie je alternatívou k Matplotlibu, ale jeho doplnkom. V tejto lekcii budeme využívať funkcie Matplotlib aj v úryvkoch kódu. Spoluprácu so spoločnosťou Seaborn si vyberiete v nasledujúcich prípadoch použitia:

Pred začatím si treba uvedomiť, že na túto lekciu používame virtuálne prostredie, ktoré sme vytvorili pomocou nasledujúceho príkazu:

python -m virtualenv seaborn
zdroj seaborn / bin / aktivovať

Keď je virtuálne prostredie aktívne, môžeme nainštalovať knižnicu Seaborn vo virtuálnom prostredí, aby bolo možné vykonať príklady, ktoré vytvoríme ďalej:

pip nainštalovať seaborn

Anacondu môžete tiež použiť na spustenie týchto príkladov, čo je jednoduchšie. Ak si ho chcete nainštalovať na svoj počítač, pozrite si lekciu, ktorá popisuje „Ako nainštalovať Anaconda Python na Ubuntu 18.04 LTS ”a podeľte sa o svoje pripomienky. Poďme teraz k ďalším typom grafov, ktoré je možné zostaviť pomocou Python Seaborn.

Používanie dátovej sady Pokemon

Aby bola táto lekcia praktická, použijeme dataset Pokémonov, ktorý je možné stiahnuť z Kaggle. Na import tohto súboru údajov do nášho programu budeme používať knižnicu Pandas. Tu sú všetky importy, ktoré uskutočňujeme v našom programe:

importovať pandy ako pd
z matplotlib import pyplot ako plt
dovážať seaborn ako sns

Teraz môžeme importovať množinu údajov do nášho programu a zobraziť niektoré zo vzorových údajov pomocou programu Pandas ako:

df = pd.read_csv ('Pokémon.csv ', index_col = 0)
df.hlava ()

Upozorňujeme, že na spustenie vyššie uvedeného útržku kódu by mala byť množina súborov CSV prítomná v rovnakom adresári ako samotný program. Po spustení vyššie uvedeného fragmentu kódu sa nám zobrazí nasledujúci výstup (v notebooku Anaconda Jupyter):

Vynesenie krivky lineárnej regresie

Jednou z najlepších vecí na Seaborne sú inteligentné funkcie vykreslenia, ktoré poskytuje a ktoré nielen vizualizujú súbor údajov, ktorý mu poskytujeme, ale tiež okolo neho vytvárajú regresné modely. Napríklad je možné zostrojiť graf lineárnej regresie s jediným riadkom kódu. Postup je nasledovný:

sns.lmplot (x = 'Útok', y = 'Obrana', dáta = df)

Po spustení vyššie uvedeného útržku kódu sa nám zobrazí nasledujúci výstup:

Vo vyššie uvedenom útržku kódu sme si všimli niekoľko dôležitých vecí:

Nebojte sa, ak ste si mysleli, že bez tejto regresnej čiary nemôžeme mať zápletku. Môžeme ! Vyskúšajme teraz nový útržok kódu podobný tomu minulému:

sns.lmplot (x = 'Attack', y = 'Defense', data = df, fit_reg = False)

Tentokrát neuvidíme regresnú čiaru v našom grafe:

Teraz je to oveľa jasnejšie (ak nepotrebujeme lineárnu regresnú priamku). Ale to ešte nie je všetko. Seaborn nám umožňuje odlíšiť túto zápletku a to budeme robiť.

Konštrukcia škatúľ

Jednou z najväčších funkcií v Seaborne je to, ako ľahko prijíma štruktúru Pandas Dataframes na vykreslenie údajov. Môžeme jednoducho odovzdať dátový rámec do knižnice Seaborn, aby z nej mohol zostaviť boxplot:

sns.boxplot (data = df)

Po spustení vyššie uvedeného útržku kódu sa nám zobrazí nasledujúci výstup:

Prvé čítanie zo súčtu môžeme odstrániť, pretože to vyzerá trochu trápne, keď tu skutočne vykresľujeme jednotlivé stĺpce:

stats_df = df.pokles (['Celkom'], os = 1)
# Nový boxplot pomocou stats_df
sns.boxplot (data = stats_df)

Po spustení vyššie uvedeného útržku kódu sa nám zobrazí nasledujúci výstup:

Roj pozemok s Seaborn

Pomocou Seabornu môžeme vytvoriť intuitívny grafický design Swarm. Znovu použijeme dátový rámec od Pandas, ktorý sme načítali skôr, ale tentoraz budeme volať funkciu zobrazenia Matplotlib, aby sme zobrazili dej, ktorý sme vytvorili. Tu je útržok kódu:

sns.set_context ("paper")
sns.swarmplot (x = "Útok", y = "Obrana", dáta = df)
plt.šou()

Po spustení vyššie uvedeného útržku kódu sa nám zobrazí nasledujúci výstup:

Použitím kontextu Seaborn umožňujeme spoločnosti Seaborn, aby pozemku dodala osobný dojem a plynulý dizajn. Tento graf je možné ešte viac upraviť pomocou vlastnej veľkosti písma použitej pre štítky v grafe, aby sa uľahčilo čítanie. Aby sme to dosiahli, odovzdáme viac parametrov funkcii set_context, ktorá funguje rovnako, ako znejú. Napríklad na úpravu veľkosti písma štítkov použijeme písmo.parameter veľkosti. Tu je útržok kódu na vykonanie úpravy:

sns.set_context ("paper", font_scale = 3, rc = "font.veľkosť „: 8,“ osi.labelize ": 5)
sns.swarmplot (x = "Útok", y = "Obrana", dáta = df)
plt.šou()

Po spustení vyššie uvedeného útržku kódu sa nám zobrazí nasledujúci výstup:

Veľkosť písma pre štítok sa zmenila na základe parametrov, ktoré sme poskytli, a hodnoty priradenej k písmu.parameter veľkosti. Jedna vec, v ktorej Seaborn je odborníkom, je veľmi intuitívna zápletka pre praktické použitie, čo znamená, že Seaborn nie je iba praktický balík Pythonu, ale vlastne aj niečo, čo môžeme použiť v našich produkčných nasadeniach.

Pridanie názvu do grafov

Je ľahké pridávať tituly k našim grafom. Musíme len postupovať podľa jednoduchého postupu používania funkcií na úrovni osí, kde budeme volať set_title () funkcia, ktorú uvádzame v útržku kódu tu:

sns.set_context ("paper", font_scale = 3, rc = "font.veľkosť „: 8,“ osi.labelize ": 5)
my_plot = sns.swarmplot (x = "Útok", y = "Obrana", dáta = df)
my_plot.set_title ("Pozemok roja ĽH")
plt.šou()

Po spustení vyššie uvedeného útržku kódu sa nám zobrazí nasledujúci výstup:

Týmto spôsobom môžeme k našim pozemkom pridať oveľa viac informácií.

Seaborn vs Matplotlib

Keď sme sa pozreli na príklady v tejto lekcii, môžeme zistiť, že Matplotlib a Seaborn nie je možné priamo porovnávať, ale je možné ich považovať za vzájomne sa doplňujúce. Jednou z funkcií, ktorá posúva Seaborn o krok vpred, je spôsob, akým môže Seaborn štatisticky vizualizovať údaje.

Aby ste parametre Seaborn využili čo najlepšie, dôrazne odporúčame pozrieť si dokumentáciu Seaborn a zistiť, aké parametre máte použiť, aby bol váš pozemok čo najbližšie obchodným potrebám.

Záver

V tejto lekcii sme sa pozreli na rôzne aspekty tejto knižnice vizualizácie údajov, ktorú môžeme pomocou programu Python použiť na generovanie krásnych a intuitívnych grafov, ktoré dokážu vizualizovať údaje vo forme, ktorú chce podnik, z platformy. Seaborm je jednou z najdôležitejších vizualizačných knižníc, pokiaľ ide o dátové inžinierstvo a prezentáciu údajov vo väčšine vizuálnych foriem, čo je určite zručnosť, ktorú musíme mať pod opaskom, pretože nám umožňuje vytvárať lineárne regresné modely.

Podeľte sa o svoju spätnú väzbu k lekcii na Twitteri s @sbmaggarwal a @LinuxHint.

Top 5 ergonomických produktov pre počítačové myši pre Linux
Spôsobuje dlhodobé používanie počítača bolesť zápästia alebo prstov? Trpíte stuhnutými kĺbmi a neustále si musíte podávať ruky? Cítite pálivú bolesť z...
Ako zmeniť nastavenie myši a touchpadu pomocou systému Xinput v systéme Linux
Väčšina distribúcií systému Linux sa štandardne dodáva s knižnicou „libinput“ na spracovanie vstupných udalostí v systéme. Dokáže spracovať vstupné ud...
S ovládaním pomocou myši X-Mouse môžete tlačidlá myši premapovať odlišne pre iný softvér
Možno budete potrebovať nástroj, ktorý by mohol zmeniť ovládanie myši pri každej aplikácii, ktorú používate. Ak je to váš prípad, môžete vyskúšať apli...