pandy

Ako používať Boxplot v Pythone

Ako používať Boxplot v Pythone
Krabicový graf sa používa na zhrnutie súborov údajov pomocou metódy box a whiskerového vykreslenia. Táto funkcia pomáha používateľom správne pochopiť súhrn údajov. Krabicové grafy môžu byť veľmi užitočné, keď chceme vedieť, ako sú dáta distribuované a šírené. Na vykreslenie údajov sa v rámčekovom grafe používajú tri typy kvartilov. Tieto hodnoty zahŕňajú medián, maximum, minimum, štatistiku v hornom kvartile a v dolnom kvartile. Krabicový graf sumarizuje tieto údaje v 25th, 50th, a 75th percentily. Tento tutoriál vám ukáže, ako vytvoriť škatuľkové grafy na základe danej množiny údajov pomocou pandy a morský knižnice Pythonu.

Predpoklad

Ak ste novým používateľom Pythonu, musíte najskôr nastaviť prostredie tak, aby zobrazovalo výstup grafu políčka. Na vykonanie kódu môžete použiť ľubovoľného tlmočníka Pythonu. V tomto návode použijem spyder3 vykonať kód. Ak ste nenainštalovali pandy a morský knižnice, potom by ste mali z terminálu spustiť nasledujúci príkaz na inštaláciu týchto knižníc:

$ pip3 nainštalujte pandy Seaborn

Krabicové pozemky s pandami

The boxplot () metóda pandy sa používa na generovanie číselných údajov políčka na základe dátového rámca. Táto metóda obsahuje veľa argumentov; niektoré z týchto argumentov sú použité v príkladoch nižšie. Táto časť tutoriálu bude obsahovať dva príklady, ktoré vám ukážu, ako vytvoriť grafy polí v pandy. Náhodne generované údaje v knižnici NumPy alebo údaje zo súboru CSV môžete použiť na vygenerovanie rámcového grafu v pandy.

Príklad 1: Krabicové grafy založené na náhodných hodnotách

Krabicové grafy v nasledujúcom príklade boli vygenerované pomocou NumPy a pandy. Knižnica NumPy sa v skripte používa na vytvorenie objektu dátového rámca generovaním dvojrozmerného poľa náhodných hodnôt, ktoré obsahujú 5 riadkov a 5 stĺpcov. Obsah dátového rámca sa vytlačí pomocou hlava() metóda. Ďalej boxplot () metóda sa používa na generovanie grafov poľa s modrou farbou, veľkosťou písma 10 a 30-stupňovým uhlom otočenia na zobrazenie hodnôt stĺpca.

#!/ usr / bin / env python3
# Importovať knižnicu pand
importovať pandy ako pd
# Importujte knižnicu NumPy a vytvorte náhodné čísla pre pole
importovať numpy ako np

Generujte množinu údajov na základe náhodne vytvoreného poľa NumPy
a hodnoty piatich stĺpcov

dátový rámec = pd.DataFrame (np.náhodný.randn (5,5), stĺpce = ['2016', '2017', '2018',
„2019“, „2020“])
 
# Vytlačte hodnoty údajového rámca
tlač (dátový rámec.hlava ())
# Zobrazte graf poľa na základe hodnôt dátového rámca
dátový rámec.boxplot (mriežka = „nepravá“, farba = „modrá“, veľkosť písma = 10, rotácia = 30)

Výkon

Po vykonaní kódu sa objaví nasledujúci výstup.

Príklad 2: Krabicové grafy založené na dátach CSV

Krabičkové grafy v nasledujúcom príklade boli vygenerované z údajov CSV. Vytvorte súbor CSV s názvom breh.csv pomocou nasledujúcich údajov.

breh.csv

SL, Client_Name, Account_Type, pohlavie, zostatok
1, Maria Hernandez, Saving, Female, 120000
2, Mary Smith, súčasná žena, 40000
3, David Smith, súčasný muž, 379000
4, Maria Rodriguez, Saving, Female, 56000
5, Mark Lee, Saving, Male, 93500
6, Jonathan Bing, súčasný muž, 5900
7, Daniel Williams, Saving, Male, 2300
8, Mike Brown, súčasný muž, 124888
9, Paul Smith, Current, Male, 59450
10, Maria Lopez, Saving, Female, 487600

V nasledujúcom scenári sa matplotlib knižnica sa použila na nastavenie veľkosti obrázka krabicového grafu a na priame zobrazenie výstupu. Všetky záznamy o banka.csv súbor bol načítaný pomocou read_csv () metóda pandy. Prvých 8 záznamov dátového rámca sa potom vytlačilo pomocou hlava () metóda. The boxplot () v nasledujúcom výroku bola použitá metóda na nakreslenie obrázka poľa pomocou červenej farby na základe 'Typ účtu' so stĺpcom s názvomRovnováha.

#!/ usr / bin / env python3
# Importovať pandy pre generovanie grafu políčka
importovať pandy ako pd
# Importujte matplotlib, aby ste nastavili veľkosť obrázka poľa
import matplotlib.pyplot ako plt
# Import get_ipython pre naformátovanie výstupného riadku
z importu IPython get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Nastavte veľkosť obrázka
plt.rcParams ['obrázok.figsize '] = (8,4)
# Načítajte datovú sadu zo súboru CSV
df = pd.read_csv ("banka.csv ")
# Vytlačte prvých 8 riadkov načítaných údajov
tlač (porov.hlava (8))
# Zobrazte grafy polí na základe použitého parametra
df.boxplot (podľa = 'Account_Type', grid = 'True', column = ['Balance'], color = 'red')

Výkon

Po vykonaní kódu sa objaví nasledujúci výstup.

Krabicové pozemky s morskými plodmi

Ďalšou knižnicou Pythonu, ktorá sa bežne používa na kreslenie grafov, je knižnica morský.  Jednou z dôležitých vlastností tejto knižnice je, že má veľa zabudovaných vzorových súborov údajov na testovanie rôznych úloh. Nasledujúce dva príklady sa budú týkať použitia dvoch rôznych súborov vzorových údajov na kreslenie grafov polí pomocou nástroja morský knižnica.

Príklad 3: Krabicové grafy založené na parametri x

Nasledujúci príklad používa vzorovú množinu údajov s názvom „diamanty, “ od morské narodenie knižnica na vygenerovanie krabicového grafu. Tu je štýl mriežky definovaný pomocou set_style () metóda. The load_dataset () metóda sa používa na načítanie údajov 'diamanty množina údajov. Prvých päť záznamov je vytlačených zo súboru údajov a súboru boxplot () metóda sa potom použije na nakreslenie škatuľkového grafu na základe stĺpca s názvom „hĺbka,„s modrou farbou.

# Importovať morskú knižnicu na vygenerovanie políčka
dovážať seaborn ako sns
# Importujte matplotlib, aby ste nastavili veľkosť obrázka poľa
import matplotlib.pyplot ako plt
# Import get_ipython pre naformátovanie výstupného riadku
z importu IPython get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Nastaviť štýl mriežky
sns.set_style ("whitegrid")
# Nastavte veľkosť obrázka
plt.rcParams ['obrázok.figsize '] = (8,4)
# Načítajte ukážkovú množinu údajov
diamond_dataset = sns.load_dataset ('diamonds')
# Zobraziť prvých 5 záznamov množiny údajov
print (diamond_dataset.hlava ())
# Nakreslite obrázok políčka
sns.boxplot (x = diamond_dataset ['depth'], color = 'blue')

Výkon

Po vykonaní kódu sa objaví nasledujúci výstup.

Príklad 4: Krabicové grafy založené na parametroch xay

V nasledujúcom príklade sa používa vzorová množina údajov s názvom „lety„aby sa nakreslilo políčko. Tu sú parametre x aj y parametra boxplot () Na nakreslenie obrázku sa používa metóda. Ostatné výroky sú podobné predchádzajúcemu príkladu.

# Importovať morskú knižnicu na vygenerovanie políčka
dovážať seaborn ako sns
# Importujte matplotlib, aby ste nastavili veľkosť obrázka poľa
import matplotlib.pyplot ako plt
# Import get_ipython pre naformátovanie výstupného riadku
z importu IPython get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
 
# Nastaviť štýl mriežky
sns.set_style ("darkgrid")
# Nastavte veľkosť obrázka
plt.rcParams ['obrázok.figsize '] = (12,4)
 
# Načítajte ukážkovú množinu údajov
flight_dataset = sns.load_dataset („lety“)
# Zobraziť prvých 5 záznamov množiny údajov
print (flight_dataset.hlava ())
 
# Nakreslite obrázok políčka
sns.boxplot (x = 'mesiac', y = 'cestujúci', data = letova_datazet, farba = 'modrá')

Výkon

Po vykonaní kódu sa objaví nasledujúci výstup.

Záver

Pri práci s veľkým množstvom údajov môžete údaje zosumarizovať pomocou diagramu, ako je napríklad rámčekové vykreslenie. Tento tutoriál použil niekoľko príkladov, aby vám ukázal, ako generovať grafy polí pomocou dvoch knižníc Pythonu.

Hry Ako vyvíjať hru v systéme Linux
Ako vyvíjať hru v systéme Linux
Pred desiatimi rokmi by len málo používateľov Linuxu predpovedalo, že ich obľúbený operačný systém bude jedného dňa populárnou hernou platformou pre k...
Hry Open source porty komerčných herných strojov
Open source porty komerčných herných strojov
Na hranie starých i niektorých z nedávnych herných titulov je možné využiť bezplatné hry s otvoreným zdrojom a multiplatformové herné enginy. V tomto ...
Hry Najlepšie hry z príkazového riadku pre systém Linux
Najlepšie hry z príkazového riadku pre systém Linux
Príkazový riadok nie je pri použití systému Linux iba vaším najväčším spojencom - môže byť tiež zdrojom zábavy, pretože ho môžete použiť na hranie mno...