DSTK - Data Science Toolkit 3 är en uppsättning program för data- och textmining, som följer CRISP DM-modellen. DSTK erbjuder data förståelse med statistisk och textanalys, databehandling med normalisering och textbehandling, modellering och utvärdering för maskininlärning och statistisk inlärningsalgoritmer.
DSTK 3 kommer att erbjuda attraktiva funktioner som Deep Neural Network (Deep Learning), Text Link Analysis med visualiseringar, KMeans Clustering. Några av dessa funktioner kan presenteras i äldre versioner, men eftersom algoritmerna omskrivs för att minska användningen av externa bibliotek som Weka för att minska filstorleken, behöver vi mer tid att utveckla dem. DSTK Engine är fortfarande i beta-scenen, så det kan finnas några fel och felaktigheter.
DSTK 3 består av DSTK Engine, DSTK ScriptWriter, DSTK Studio och DSTK Text Explorer. DSTK Engine är R förenklad, med inriktning på data mining. DSTK ScriptWriter erbjuder GUI för att skriva skript för DSTK Engine. DSTK Studio erbjuder SPSS-statistik som GUI för data mining, och DSTK Text Explorer erbjuder GUI för textmining.
Krav :
Java Runtime Environment, Microsoft. Net Framework
Begränsningar :
10-försök
Kommentarer hittades inte