ML a AI

Top 20 najlepších balíkov strojového učenia R, ktoré môžete vyskúšať hneď teraz

Top 20 najlepších balíkov strojového učenia R, ktoré môžete vyskúšať hneď teraz

Takmer všetci začínajúci vedci v oblasti dát a vývojári strojového učenia sú zmätení pri výbere programovacieho jazyka. Vždy sa pýtajú, ktorý programovací jazyk bude pre ich projekt strojového učenia a dátovej vedy najlepší. Buď pôjdeme na python, R alebo MatLab. Voľba programovacieho jazyka závisí od preferencií vývojárov a systémových požiadaviek. Medzi ďalšími programovacími jazykmi je R jedným z najpotenciálnejších a najkvalitnejších programovacích jazykov, ktoré majú niekoľko balíkov strojového učenia R pre ML, AI a dátové vedecké projekty.

V dôsledku toho môže jeden vyvinúť svoj projekt bez námahy a efektívne pomocou týchto balíkov strojového učenia R. Podľa prieskumu spoločnosti Kaggle je R jedným z najpopulárnejších jazykov strojového učenia s otvoreným zdrojom.

Najlepšie balíčky strojového učenia R


R je jazyk open-source, aby ľudia mohli prispievať z ktoréhokoľvek miesta na svete. Vo svojom kóde môžete použiť čiernu skrinku, ktorú napísal niekto iný. V R sa táto čierna skrinka označuje ako balík. Balík nie je nič iné ako vopred napísaný kód, ktorý môže ktokoľvek opakovane používať. Ďalej uvádzame 20 najlepších balíkov strojového učenia R.

1. STRECHA


Balík CARET sa týka klasifikácie a regresného tréningu. Úlohou tohto balíka CARET je integrovať školenie a predikciu modelu. Je to jeden z najlepších balíkov R pre strojové učenie, ako aj pre dátovú vedu.

Parametre je možné vyhľadávať integráciou niekoľkých funkcií na výpočet celkového výkonu daného modelu pomocou metódy mriežky tohto balíka. Po úspešnom dokončení všetkých pokusov vyhľadá mriežka konečne tie najlepšie kombinácie.

Po nainštalovaní tohto balíka môže vývojár spustiť názvy (getModelInfo ()), aby zobrazil 217 možných funkcií, ktoré je možné spustiť iba pomocou jednej funkcie. Na zostavenie prediktívneho modelu balík CARET využíva funkciu train (). Syntax tejto funkcie:

vlak (vzorec, údaje, metóda)

Dokumentácia

2. randomForest


RandomForest je jeden z najpopulárnejších balíkov R pre strojové učenie. Tento balík strojového učenia R možno použiť na riešenie regresných a klasifikačných úloh. Ďalej ho možno použiť na precvičenie chýbajúcich hodnôt a odľahlých hodnôt.

Tento balík strojového učenia s R sa všeobecne používa na generovanie viacerých čísel rozhodovacích stromov. V zásade odoberá náhodné vzorky. Potom sa pozorovania prenesú do rozhodovacieho stromu. Spoločný výstup, ktorý pochádza z rozhodovacieho stromu, je nakoniec konečným výstupom. Syntax tejto funkcie:

randomForest (vzorec =, údaje =)

Dokumentácia

3. e1071


Tento e1071 je jedným z najbežnejšie používaných balíkov R. pre strojové učenie. Pomocou tohto balíka môže vývojár implementovať podporné vektorové stroje (SVM), výpočet najkratšej cesty, zoskupovanie v taškách, klasifikátor Naive Bayes, krátkodobú Fourierovu transformáciu, fuzzy klastrovanie atď.

Napríklad pre dáta IRIS je syntax SVM:

svm (Druhy ~ Sepal.Dĺžka + Sepal.Šírka, údaje = clona)

Dokumentácia

4. Rpart


Rpart znamená rekurzívne delenie a regresný tréning. Tento balík R pre strojové učenie je možné vykonávať ako úlohy, tak klasifikáciu a regresiu. Koná pomocou dvojstupňového kroku. Výstupný model je binárny strom. Funkcia plot () sa používa na vykreslenie výstupného výsledku. Existuje aj alternatívna funkcia prp (), ktorá je flexibilnejšia a výkonnejšia ako základná funkcia plot ().

Funkcia rpart () sa používa na vytvorenie vzťahu medzi nezávislými a závislými premennými. Syntax je:

rpart (vzorec, údaje =, metóda =, kontrola =)

kde vzorec je kombináciou nezávislých a závislých premenných, dáta sú názov množiny údajov, metóda je cieľom a kontrola je vašou systémovou požiadavkou.

Dokumentácia

5. KernLab


Ak chcete vyvinúť svoj projekt na základe algoritmov strojového učenia založených na jadre, môžete tento balík R použiť na strojové učenie. Tento balík sa používa na SVM, analýzu funkcií jadra, algoritmus klasifikácie, primitívne produkty bodových produktov, Gaussov proces a mnoho ďalších. KernLab je široko používaný pre implementácie SVM.

K dispozícii sú rôzne funkcie jadra. Tu sú uvedené niektoré funkcie jadra: polydot (funkcia polynomiálneho jadra), tanhdot (funkcia hyperbolického tangenta jadra), laplacedot (funkcia laplaciánskeho jadra) atď. Tieto funkcie sa používajú na vykonávanie problémov s rozpoznávaním vzorov. Používatelia však môžu používať svoje funkcie jadra namiesto preddefinovaných funkcií jadra.

Dokumentácia

6. nnet


Ak chcete vyvinúť svoju aplikáciu strojového učenia pomocou umelej neurónovej siete (ANN), môže vám pomôcť tento balík nnet. Je to jeden z najpopulárnejších a najjednoduchších spôsobov implementácie balíka neurónových sietí. Ale je to obmedzenie, že je to jedna vrstva uzlov.

Syntax tohto balíka je:

nnet (vzorec, údaje, veľkosť)

Dokumentácia

7. dplyr


Jeden z najbežnejšie používaných balíkov R pre dátovú vedu. Poskytuje tiež niektoré ľahko použiteľné, rýchle a konzistentné funkcie na manipuláciu s údajmi. Hadley Wickham píše tento programovací balík r pre dátovú vedu. Tento balík pozostáva zo sady slovies i.e., mutovať (), vybrať (), filtrovať (), sumarizovať () a usporiadať ().

Ak chcete nainštalovať tento balík, musíte napísať tento kód:

Inštalácia.balíčky („dplyr“)

Ak chcete načítať tento balík, musíte napísať túto syntax:

knižnica (dplyr)

Dokumentácia

8. ggplot2


Ďalším z najelegantnejších a najestetickejších grafických balíkov R pre dátovú vedu je ggplot2. Je to systém vytvárania grafiky založený na gramatike grafiky. Syntax inštalácie pre tento balík vedeckých údajov je:

Inštalácia.balíčky („ggplot2“)

Dokumentácia

9. Wordcloud


Ak jeden obrázok pozostáva z tisícov slov, potom sa nazýva Wordcloud. V zásade ide o vizualizáciu textových údajov. Tento balík strojového učenia používajúci R sa používa na vytvorenie reprezentácie slov a vývojár môže prispôsobiť Wordcloud podľa svojich preferencií, ako je napríklad spoločné usporiadanie slov s rovnakou frekvenciou alebo vysokofrekvenčné slová v strede atď.

V jazyku R strojového učenia sú na vytvorenie wordcloudu k dispozícii dve knižnice: Wordcloud a Worldcloud2. Tu si ukážeme syntax pre WordCloud2. Ak chcete nainštalovať WordCloud2, musíte napísať:

1. require (devtools)
2. install_github („lchiffon / wordcloud2“)

Alebo ho môžete použiť priamo:

knižnica (wordcloud2)

Dokumentácia

10. tidyr


Ďalším široko používaným balíkom r pre dátovú vedu je tidyr. Cieľom tohto programovania v oblasti dátovej vedy je upratovanie údajov. V poriadku je premenná umiestnená do stĺpca, pozorovanie je umiestnené do riadku a hodnota je v bunke. Tento balík popisuje štandardný spôsob triedenia údajov.

Na inštaláciu môžete použiť tento fragment kódu:

Inštalácia.balíčky („tidyr“)

Pre načítanie je kód:

knižnica (tidyr)

Dokumentácia

11. lesklý


Balík R, Shiny, je jedným z rámcov webových aplikácií pre dátovú vedu. Pomáha to bez námahy vytvárať webové aplikácie z jazyka R. Vývojár môže nainštalovať softvér na každý klientsky systém alebo počítač, ktorý je hostiteľom webovej stránky. Vývojár tiež môže vytvárať dashboardy alebo ich vložiť do dokumentov R Markdown.

Lesklé aplikácie je možné navyše rozšíriť o rôzne skriptovacie jazyky, ako sú html widgety, témy CSS a akcie JavaScriptu. Jedným slovom môžeme povedať, že tento balík je kombináciou výpočtovej sily R s interaktivitou moderného webu.

Dokumentácia

12. tm


Netreba dodávať, že dolovanie textu je v dnešnej dobe objavujúcou sa aplikáciou strojového učenia. Tento balík strojového učenia R poskytuje rámec pre riešenie úloh ťažby textu. V aplikácii na dolovanie textu, t.j.e., na základe analýzy sentimentu alebo klasifikácie správ má vývojár rôzne druhy namáhavej práce, ako je odstraňovanie nechcených a irelevantných slov, odstraňovanie interpunkčných znamienok, odstraňovanie zastávkových slov a mnoho ďalších.

Balík tm obsahuje niekoľko flexibilných funkcií, vďaka ktorým bude vaša práca bez námahy, ako napríklad removeNumbers (): na odstránenie čísel z daného textového dokumentu, weightTfIdf (): pre výraz Frequency a inverzná frekvencia dokumentu, tm_reduce (): kombinovanie transformácií, removePunctuation () na odstrániť interpunkčné znamienka z daného textového dokumentu a mnoho ďalších.

Dokumentácia

13. Balík MICE


Balík strojového učenia s R, MICE označuje viacrozmernú imputáciu prostredníctvom reťazených sekvencií. Vývojár projektu takmer vždy čelí spoločnému problému s množinou údajov strojového učenia, ktorý predstavuje chýbajúcu hodnotu. Tento balík je možné použiť na imputovanie chýbajúcich hodnôt pomocou viacerých techník.

Tento balík obsahuje niekoľko funkcií, ako napríklad kontrola chýbajúcich vzorov údajov, diagnostika kvality imputovaných hodnôt, analýza dokončených súborov údajov, ukladanie a export imputovaných údajov v rôznych formátoch a mnoho ďalších.

Dokumentácia

14. igraf


Balík sieťovej analýzy, igraph, je jedným z výkonných balíkov R pre dátovú vedu. Je to súbor výkonných, efektívnych, ľahko použiteľných a prenosných nástrojov na analýzu siete. Tento balík je tiež otvorený a bezplatný. Okrem toho je možné program igraphn programovať v programoch Python, C / C ++ a Mathematica.

Tento balík obsahuje niekoľko funkcií na generovanie náhodných a pravidelných grafov, vizualizáciu grafu atď. Pomocou tohto balíka R môžete tiež pracovať s veľkým grafom. Na použitie tohto balíka existujú určité požiadavky: pre Linux sú potrebné kompilátory C a C ++.

Inštalácia tohto programovacieho balíka R pre dátovú vedu je:

Inštalácia.balíčky („igraf“)

Pre načítanie tohto balíka musíte napísať:

knižnica (igraf)

Dokumentácia

15. ROCR


Balík R pre dátovú vedu, ROCR, sa používa na vizualizáciu výkonu bodovacích klasifikátorov. Toto balenie je flexibilné a ľahko použiteľné. Potrebné sú iba tri príkazy a predvolené hodnoty pre voliteľné parametre. Tento balík sa používa na vývoj medzných parametrických 2D kriviek výkonu. V tomto balíku je niekoľko funkcií ako predikcia (), ktoré sa používajú na vytváranie predikčných objektov, performance () slúžiacich na vytváranie výkonnostných objektov atď.

Dokumentácia

16. DataExplorer


Balík DataExplorer je jedným z najrozšírenejšie ľahko použiteľných balíkov R pre dátovú vedu. Medzi početnými úlohami v oblasti dátovej vedy je jednou z nich aj exploratívna analýza dát (EDA). Pri prieskumnej analýze údajov musí analytik údajov venovať väčšiu pozornosť údajom. Nie je ľahká práca skontrolovať alebo spracovať údaje ručne alebo použiť nesprávne kódovanie. Je potrebná automatizácia analýzy údajov.

Tento balík R pre dátovú vedu poskytuje automatizáciu prieskumu údajov. Tento balík sa používa na skenovanie a analýzu každej premennej a na jej vizualizáciu. Je to užitočné, keď je dátový súbor rozsiahly. Takže analýza dát dokáže efektívne a bez námahy extrahovať skryté vedomosti o dátach.

Balík je možné nainštalovať z CRANu priamo pomocou nasledujúceho kódu:

Inštalácia.balíčky („DataExplorer“)

Ak chcete načítať tento balík R, musíte napísať:

knižnica (DataExplorer)

Dokumentácia

17. mlr


Jedným z najneuveriteľnejších balíkov strojového učenia R je balíček mlr. Tento balík šifruje niekoľko úloh strojového učenia. To znamená, že môžete vykonať niekoľko úloh iba pomocou jedného balíka a nie je potrebné použiť tri balíčky pre tri rôzne úlohy.

Balenie mlr je rozhraním pre početné techniky klasifikácie a regresie. Medzi tieto techniky patria strojovo čitateľné popisy parametrov, klastrovanie, generické opätovné vzorkovanie, filtrovanie, extrakcia funkcií a mnoho ďalších. Je možné vykonávať aj paralelné operácie.

Pri inštalácii musíte použiť nasledujúci kód:

Inštalácia.balenia („mlr“)

Načítanie tohto balíka:

knižnica (mlr)

Dokumentácia

18. arules


Balík arules (pravidlá asociácie ťažby a časté položky) je rozsiahle používaný balík strojového učenia R. Použitím tohto balíka je možné vykonať niekoľko operácií. Operácie sú reprezentácia a transakčná analýza údajov a vzorov a manipulácia s údajmi. K dispozícii sú aj C implementácie algoritmov ťažby asociácií Apriori a Eclat.

Dokumentácia

19. mboost


Ďalším balíkom strojového učenia R pre dátovú vedu je mboost. Tento podporný balík založený na modeli má algoritmus zostupu funkčného gradientu na optimalizáciu funkcií všeobecného rizika využitím regresných stromov alebo odhadov najmenších štvorcov podľa jednotlivých komponentov. Poskytuje tiež model interakcie s potenciálne vysokodimenzionálnymi údajmi.

Dokumentácia

20. večierok


Ďalším balíkom v oblasti strojového učenia s R je párty. Táto výpočtová sada nástrojov sa používa na rekurzívne rozdelenie na oddiely. Hlavnou funkciou alebo jadrom tohto balíka strojového učenia je ctree (). Je to rozsiahle používaná funkcia, ktorá znižuje čas tréningu a zaujatosti.

Syntax ctree () je:

 ctree (vzorec, údaje)

Dokumentácia

Končiace myšlienky


R je taký prominentný programovací jazyk, ktorý na skúmanie údajov využíva štatistické metódy a grafy. Netreba dodávať, že tento jazyk má niekoľko počtov balíkov strojového učenia R, neuveriteľný nástroj RStudio a ľahko pochopiteľnú syntax na vývoj pokročilých projektov strojového učenia. V balení R ml sú niektoré predvolené hodnoty. Pred použitím v programe musíte byť podrobne informovaný o rôznych možnostiach. Použitím týchto balíkov strojového učenia môže každý vytvoriť efektívny model strojového učenia alebo dátovej vedy. A nakoniec, R je open-source jazyk a jeho balíčky sa neustále rozširujú.

Ak máte nejaké návrhy alebo otázky, zanechajte komentár v našej sekcii komentárov. Tento článok môžete tiež zdieľať so svojimi priateľmi a rodinou prostredníctvom sociálnych médií.

Hry Nainštalujte si najnovšiu strategickú hru OpenRA na Ubuntu Linux
Nainštalujte si najnovšiu strategickú hru OpenRA na Ubuntu Linux
OpenRA je herný engine Libre / Free Real Time Strategy, ktorý obnovuje rané hry z Westwoodu, ako napríklad klasické Command & Conquer: Red Alert. Dist...
Hry Nainštalujte si najnovší Dolphin Emulator pre Gamecube a Wii na Linuxe
Nainštalujte si najnovší Dolphin Emulator pre Gamecube a Wii na Linuxe
Emulátor Dolphin vám umožní hrať vybrané hry Gamecube a Wii na osobných počítačoch Linux (PC). Emulátor Dolphin, ktorý je voľne dostupným emulátorom ...
Hry Ako používať GameConqueror Cheat Engine v Linuxe
Ako používať GameConqueror Cheat Engine v Linuxe
Tento článok obsahuje sprievodcu používaním cheatovacieho modulu GameConqueror v systéme Linux. Mnoho používateľov, ktorí hrajú hry v systéme Windows,...