pandy

Ako vykresliť dáta v Pandas Python

Ako vykresliť dáta v Pandas Python
Vizualizácia údajov hrá dôležitú úlohu v analýze údajov. Pandas je silná knižnica na analýzu údajov v pythone pre dátovú vedu. Poskytuje rôzne možnosti vizualizácie údajov pomocou .metóda plot (). Aj keď ste začiatočník, môžete svoje údaje ľahko vykresliť pomocou knižnice Pandas. Musíte importovať pandy a matplotlib.balík pyplot na vizualizáciu údajov.

V tomto článku preskúmame rôzne metódy vykresľovania údajov pomocou pythónu Pandas. Všetky príklady sme vykonali v editore zdrojového kódu pycharm pomocou matplotlib.balík pyplot.

Vykreslenie v Pandas Python

V spoločnosti Pandas .plot () má niekoľko parametrov, ktoré môžete použiť na základe vašich potrieb. Väčšinou pomocou parametra „druh“ môžete určiť, aký typ vykreslenia vytvoríte.

Syntax pre plotrovanie dát pomocou Pandas Python

Nasledujúca syntax sa používa na vykreslenie DataFrame v Pandas Python:

# importujte pandy a matplotlib.balíčky pyplot
importovať pandy ako pd
import matplotlib.pyplot ako plt
# Pripravte dáta na vytvorenie DataFrame
data_frame =
„Stĺpec1“: [„pole1“, „pole2“, „pole3“, „pole4“,…],
„Stĺpec2“: [„pole1“, „pole2“, „pole3“, „pole4“,…]

var_df = pd.DataFrame (data_frame, columns = ['Column1', 'Column2])
tlač (premenná)
# vykreslenie stĺpcového grafu
var_df.zápletka.lišta (x = „Stĺpec1“, y = „Stĺpec2“)
plt.šou()

Druh pozemku môžete tiež definovať pomocou parametra druhu takto:

var_df.plot (x = 'Stĺpec1', y = 'Stĺpec2', druh = 'bar')

Objekty Pandas DataFrames majú na vykreslenie nasledujúce spôsoby vykreslenia:

Ak používateľ použije iba metódu plot () bez použitia ľubovoľného parametra, vytvorí predvolený spojnicový graf.

Teraz pomocou niekoľkých príkladov podrobne rozpracujeme niektoré hlavné typy vykreslenia.

Bodové vykreslenie v pándach

Pri tomto type vykreslenia sme predstavovali vzťah medzi dvoma premennými. Zoberme si príklad.

Príklad

Napríklad máme údaje o korelácii medzi dvoma premennými GDP_growth a Oil_price. Na vykreslenie vzťahu medzi dvoma premennými sme v našom editore zdrojového kódu vykonali nasledujúcu časť kódu:

import matplotlib.pyplot ako plt
importovať pandy ako pd
gdp_cal = pd.DataFrame (
„GDP_growth“: [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
„Oil_Price“: [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (gdp_cal, columns = ['Oil_Price', 'GDP_growth'])
tlačiť (df)
df.graf (x = „Ropa_cena“, y = „Rast HDP“, druh = „Rozptyl“, Farba = „Červená“)
plt.šou()

Čiarové grafy vykresľujúce v pándach  

Čiarový graf je základný typ vykreslenia, pri ktorom sa dané informácie zobrazia v sérii dátových bodov, ktoré sú ďalej spojené segmentmi priamych čiar. Pomocou spojnicových grafov môžete zobraziť aj trendy informačných nadčasov.

Príklad

V nižšie uvedenom príklade sme vzali údaje o miere inflácie za minulý rok. Najskôr pripravte údaje a potom vytvorte DataFrame. Nasledujúci zdrojový kód vykresľuje čiarový graf dostupných údajov:

importovať pandy ako pd
import matplotlib.pyplot ako plt
infl_cal = 'Rok': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (infl_cal, columns = ['Year', 'Infl_Rate'])
data_frame.zápletka (x = „Rok“, y = „Infl_Rate“, kind = „riadok“)
plt.šou()

Vo vyššie uvedenom príklade musíte pre vykreslenie čiarových grafov nastaviť kind = 'line'.

Metóda 2 # Použitie grafu.metóda line ()

Vyššie uvedený príklad môžete implementovať aj pomocou nasledujúcej metódy:

importovať pandy ako pd
import matplotlib.pyplot ako plt
inf_cal = 'Rok': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
„Inflation_Rate“: [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (inf_cal, columns = ['Inflation_Rate'], index = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.zápletka.riadok ()
plt.názov („Súhrnná miera inflácie za posledných 11 rokov“)
plt.ylabel ('Inflation_Rate')
plt.xlabel („Year“)
plt.šou()

Po spustení vyššie uvedeného kódu sa zobrazí nasledujúci spojnicový graf:

Pruhový graf v Pandách

Pruhový graf sa používa na znázornenie kategorických údajov. V tomto type grafu sa na základe daných informácií vykresľujú obdĺžnikové pruhy s rôznymi výškami. Stĺpcový graf je možné vykresliť v dvoch rôznych horizontálnych alebo vertikálnych smeroch.

Príklad

V nasledujúcom príklade sme si vzali mieru gramotnosti niekoľkých krajín. Vytvoria sa dátové rámce, v ktorých sú dva stĺpce údajového rámca „Country_Names“ a „literacy_Rate“. Pomocou Pandy môžete vykresliť informácie do tvaru stĺpcového grafu nasledovne:

importovať pandy ako pd
import matplotlib.pyplot ako plt
lit_cal =
„Country_Names“: [„Pakistan“, „USA“, „Čína“, „India“, „Veľká Británia“, „Rakúsko“, „Egypt“, „Ukrajina“, „Saudia“, „Austrália“,
„Malajzia“],
'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (lit_cal, columns = ['Country_Names', 'litr_Rate'])
print (data_frame)
data_frame.zápletka.lišta (x = 'Názvy krajín', y = 'litr_Rate')
plt.šou()

Vyššie uvedený príklad môžete implementovať aj pomocou nasledujúcej metódy. Nastavte kind = "bar" pre vykreslenie stĺpcového grafu v tomto riadku:

data_frame.plot (x = 'Country_Names', y = 'litr_Rate', kind = 'bar')
plt.šou()

Horizontálne stĺpcové grafy

Údaje môžete tiež vykresliť na vodorovné pruhy vykonaním nasledujúceho kódu:

import matplotlib.pyplot ako plt
importovať pandy ako pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame (data_chart, columns = ['litr_Rate'], index = ['Pakistan', 'USA', 'Čína', 'India', 'Veľká Británia', 'Rakúsko', 'Egypt', 'Ukrajina', 'Saudia' „Austrália“,
„Malajzia“]))
df.zápletka.barh ()
plt.titul („Miera gramotnosti v rôznych krajinách“)
plt.ylabel ('Country_Names')
plt.xlabel ('litr_Rate')
plt.šou()

V df.zápletka.barh (), barh sa používa na vodorovné vykreslenie. Po spustení vyššie uvedeného kódu sa v okne zobrazí nasledujúci stĺpcový graf:

Výkres koláčového grafu v pándach

Výsečový graf predstavuje údaje v kruhovom grafickom tvare, v ktorom sa údaje zobrazujú do rezov na základe daného množstva.

Príklad

V nasledujúcom príklade sme zobrazili informácie o „Zemi_materiál“ na rôznych rezoch koláčového grafu. Najskôr vytvorte údajový rámec, potom pomocou pandov zobrazte všetky podrobnosti v grafe.

importovať pandy ako pd
import matplotlib.pyplot ako plt
material_per = 'Earth_Part': [71,18,7,4]
dátový rámec = pd.DataFrame (material_per, columns = ['Earth_Part'], index = ['Water', 'Mineral', 'Sand', 'Metals'])
dátový rámec.zápletka.koláč (y = 'Earth_Part', figsize = (7, 7), autopct = '% 1.1f %% ', začiatočný uhol = 90)
plt.šou()

Vyššie uvedený zdrojový kód vykresľuje koláčový graf dostupných údajov:

Záver

V tomto článku ste videli, ako vykresliť DataFrames v Pandas python. Vo vyššie uvedenom článku sú zobrazené rôzne druhy vykreslenia. Na vykreslenie ďalších druhov, ako sú škatule, hexbin, hist, kde, hustota, plocha atď., rovnaký zdrojový kód môžete použiť iba zmenou druhu vykreslenia.

Hry Ako zachytiť a streamovať vašu hernú reláciu v systéme Linux
Ako zachytiť a streamovať vašu hernú reláciu v systéme Linux
V minulosti sa hranie hier považovalo iba za hobby, ale časom došlo v hernom priemysle k obrovskému nárastu z hľadiska technológie i počtu hráčov. Her...
Hry Najlepšie hry na hranie s ručným sledovaním
Najlepšie hry na hranie s ručným sledovaním
Oculus Quest nedávno predstavil skvelú myšlienku ručného sledovania bez ovládačov. Vďaka stále sa zvyšujúcemu počtu hier a aktivít, ktoré vykonávajú p...
Hry Ako zobraziť prekrytie OSD v linuxových aplikáciách a hrách na celú obrazovku
Ako zobraziť prekrytie OSD v linuxových aplikáciách a hrách na celú obrazovku
Hranie hier na celú obrazovku alebo používanie aplikácií v režime rozptýlenia zadarmo na celú obrazovku vás môže odrezať od relevantných systémových i...