DSTK - Data Science Toolkit 3 este un set de software de date și miniere de text, urmând modelul CRISP DM. DSTK oferă înțelegerea datelor utilizând analiza statistică și text, pregătirea datelor utilizând normalizarea și procesarea textului, modelarea și evaluarea pentru învățarea în mașină și algoritmi de învățare statistică.
DSTK 3 va oferi caracteristici atractive cum ar fi Rețeaua Deep Neural (Deep Learning), Analiza Legăturii Text cu Vizualizări, Clustering KMeans. Unele dintre aceste caracteristici pot fi prezentate într-o versiune mai veche, dar deoarece algoritmii sunt rescrisi pentru a reduce utilizarea bibliotecilor externe ca Weka pentru a reduce dimensiunea fișierului, avem nevoie de mai mult timp pentru a le dezvolta. Motorul DSTK este încă în stadiu beta, prin urmare, pot exista unele bug-uri și inexactități.
DSTK 3 constă din Motorul DSTK, DSTK ScriptWriter, DSTK Studio și DSTK Text Explorer. Motorul DSTK este R simplificat, concentrându-se pe Data Mining. DSTK ScriptWriter oferă GUI pentru a scrie un script pentru motorul DSTK. DSTK Studio oferă statistici SPSS precum GUI pentru miniere de date, iar DSTK Text Explorer oferă GUI pentru Exploatarea Texturilor.
Cerințe :
Java Runtime Environment, Microsoft. Net Framework
Limitări :
Procesul de 10 utilizări
Comentariile nu a fost găsit