V tomto článku preskúmame rôzne metódy vykresľovania údajov pomocou pythónu Pandas. Všetky príklady sme vykonali v editore zdrojového kódu pycharm pomocou matplotlib.balík pyplot.
Vykreslenie v Pandas Python
V spoločnosti Pandas .plot () má niekoľko parametrov, ktoré môžete použiť na základe vašich potrieb. Väčšinou pomocou parametra „druh“ môžete určiť, aký typ vykreslenia vytvoríte.
Syntax pre plotrovanie dát pomocou Pandas Python
Nasledujúca syntax sa používa na vykreslenie DataFrame v Pandas Python:
# importujte pandy a matplotlib.balíčky pyplotimportovať pandy ako pd
import matplotlib.pyplot ako plt
# Pripravte dáta na vytvorenie DataFrame
data_frame =
„Stĺpec1“: [„pole1“, „pole2“, „pole3“, „pole4“,…],
„Stĺpec2“: [„pole1“, „pole2“, „pole3“, „pole4“,…]
var_df = pd.DataFrame (data_frame, columns = ['Column1', 'Column2])
tlač (premenná)
# vykreslenie stĺpcového grafu
var_df.zápletka.lišta (x = „Stĺpec1“, y = „Stĺpec2“)
plt.šou()
Druh pozemku môžete tiež definovať pomocou parametra druhu takto:
var_df.plot (x = 'Stĺpec1', y = 'Stĺpec2', druh = 'bar')Objekty Pandas DataFrames majú na vykreslenie nasledujúce spôsoby vykreslenia:
- Bodové vykreslenie: zápletka.bodový ()
- Vykreslenie pruhu: zápletka.bar (), parcela.barh (), kde h predstavuje graf vodorovných pruhov.
- Vynesenie čiary: zápletka.riadok ()
- Vykreslenie koláča: zápletka.koláč ()
Ak používateľ použije iba metódu plot () bez použitia ľubovoľného parametra, vytvorí predvolený spojnicový graf.
Teraz pomocou niekoľkých príkladov podrobne rozpracujeme niektoré hlavné typy vykreslenia.
Bodové vykreslenie v pándach
Pri tomto type vykreslenia sme predstavovali vzťah medzi dvoma premennými. Zoberme si príklad.
Príklad
Napríklad máme údaje o korelácii medzi dvoma premennými GDP_growth a Oil_price. Na vykreslenie vzťahu medzi dvoma premennými sme v našom editore zdrojového kódu vykonali nasledujúcu časť kódu:
import matplotlib.pyplot ako pltimportovať pandy ako pd
gdp_cal = pd.DataFrame (
„GDP_growth“: [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
„Oil_Price“: [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (gdp_cal, columns = ['Oil_Price', 'GDP_growth'])
tlačiť (df)
df.graf (x = „Ropa_cena“, y = „Rast HDP“, druh = „Rozptyl“, Farba = „Červená“)
plt.šou()
Čiarové grafy vykresľujúce v pándach
Čiarový graf je základný typ vykreslenia, pri ktorom sa dané informácie zobrazia v sérii dátových bodov, ktoré sú ďalej spojené segmentmi priamych čiar. Pomocou spojnicových grafov môžete zobraziť aj trendy informačných nadčasov.
Príklad
V nižšie uvedenom príklade sme vzali údaje o miere inflácie za minulý rok. Najskôr pripravte údaje a potom vytvorte DataFrame. Nasledujúci zdrojový kód vykresľuje čiarový graf dostupných údajov:
importovať pandy ako pdimport matplotlib.pyplot ako plt
infl_cal = 'Rok': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame (infl_cal, columns = ['Year', 'Infl_Rate'])
data_frame.zápletka (x = „Rok“, y = „Infl_Rate“, kind = „riadok“)
plt.šou()
Vo vyššie uvedenom príklade musíte pre vykreslenie čiarových grafov nastaviť kind = 'line'.
Metóda 2 # Použitie grafu.metóda line ()
Vyššie uvedený príklad môžete implementovať aj pomocou nasledujúcej metódy:
importovať pandy ako pdimport matplotlib.pyplot ako plt
inf_cal = 'Rok': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
„Inflation_Rate“: [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame (inf_cal, columns = ['Inflation_Rate'], index = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.zápletka.riadok ()
plt.názov („Súhrnná miera inflácie za posledných 11 rokov“)
plt.ylabel ('Inflation_Rate')
plt.xlabel („Year“)
plt.šou()
Po spustení vyššie uvedeného kódu sa zobrazí nasledujúci spojnicový graf:
Pruhový graf v Pandách
Pruhový graf sa používa na znázornenie kategorických údajov. V tomto type grafu sa na základe daných informácií vykresľujú obdĺžnikové pruhy s rôznymi výškami. Stĺpcový graf je možné vykresliť v dvoch rôznych horizontálnych alebo vertikálnych smeroch.
Príklad
V nasledujúcom príklade sme si vzali mieru gramotnosti niekoľkých krajín. Vytvoria sa dátové rámce, v ktorých sú dva stĺpce údajového rámca „Country_Names“ a „literacy_Rate“. Pomocou Pandy môžete vykresliť informácie do tvaru stĺpcového grafu nasledovne:
importovať pandy ako pdimport matplotlib.pyplot ako plt
lit_cal =
„Country_Names“: [„Pakistan“, „USA“, „Čína“, „India“, „Veľká Británia“, „Rakúsko“, „Egypt“, „Ukrajina“, „Saudia“, „Austrália“,
„Malajzia“],
'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame (lit_cal, columns = ['Country_Names', 'litr_Rate'])
print (data_frame)
data_frame.zápletka.lišta (x = 'Názvy krajín', y = 'litr_Rate')
plt.šou()
Vyššie uvedený príklad môžete implementovať aj pomocou nasledujúcej metódy. Nastavte kind = "bar" pre vykreslenie stĺpcového grafu v tomto riadku:
data_frame.plot (x = 'Country_Names', y = 'litr_Rate', kind = 'bar')plt.šou()
Horizontálne stĺpcové grafy
Údaje môžete tiež vykresliť na vodorovné pruhy vykonaním nasledujúceho kódu:
import matplotlib.pyplot ako pltimportovať pandy ako pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame (data_chart, columns = ['litr_Rate'], index = ['Pakistan', 'USA', 'Čína', 'India', 'Veľká Británia', 'Rakúsko', 'Egypt', 'Ukrajina', 'Saudia' „Austrália“,
„Malajzia“]))
df.zápletka.barh ()
plt.titul („Miera gramotnosti v rôznych krajinách“)
plt.ylabel ('Country_Names')
plt.xlabel ('litr_Rate')
plt.šou()
V df.zápletka.barh (), barh sa používa na vodorovné vykreslenie. Po spustení vyššie uvedeného kódu sa v okne zobrazí nasledujúci stĺpcový graf:
Výkres koláčového grafu v pándach
Výsečový graf predstavuje údaje v kruhovom grafickom tvare, v ktorom sa údaje zobrazujú do rezov na základe daného množstva.
Príklad
V nasledujúcom príklade sme zobrazili informácie o „Zemi_materiál“ na rôznych rezoch koláčového grafu. Najskôr vytvorte údajový rámec, potom pomocou pandov zobrazte všetky podrobnosti v grafe.
importovať pandy ako pdimport matplotlib.pyplot ako plt
material_per = 'Earth_Part': [71,18,7,4]
dátový rámec = pd.DataFrame (material_per, columns = ['Earth_Part'], index = ['Water', 'Mineral', 'Sand', 'Metals'])
dátový rámec.zápletka.koláč (y = 'Earth_Part', figsize = (7, 7), autopct = '% 1.1f %% ', začiatočný uhol = 90)
plt.šou()
Vyššie uvedený zdrojový kód vykresľuje koláčový graf dostupných údajov:
Záver
V tomto článku ste videli, ako vykresliť DataFrames v Pandas python. Vo vyššie uvedenom článku sú zobrazené rôzne druhy vykreslenia. Na vykreslenie ďalších druhov, ako sú škatule, hexbin, hist, kde, hustota, plocha atď., rovnaký zdrojový kód môžete použiť iba zmenou druhu vykreslenia.