DSTK - Data Science Toolkit 3 é um conjunto de software de mineração de dados e texto, seguindo o modelo CRISP DM. O DSTK oferece compreensão de dados usando análise estatística e de texto, preparação de dados usando normalização e processamento de texto, modelagem e avaliação para aprendizado de máquina e algoritmos de aprendizado estatístico.
O DSTK 3 oferecerá recursos atraentes, como Deep Neural Network (Deep Learning), Text Link Analysis com Visualizations, KMeans Clustering. Alguns desses recursos podem ser apresentados em versões mais antigas, mas como os algoritmos são reescritos para reduzir o uso de bibliotecas externas, como a Weka, para reduzir o tamanho do arquivo, precisamos de mais tempo para desenvolvê-los. DSTK Engine ainda está em fase beta, portanto, pode haver alguns erros e imprecisões.
O DSTK 3 consiste em DSTK Engine, DSTK ScriptWriter, DSTK Studio e DSTK Text Explorer. O DSTK Engine é simplificado, com foco na mineração de dados. O DSTK ScriptWriter oferece GUI para escrever scripts para o mecanismo DSTK. O DSTK Studio oferece estatísticas do tipo SPSS como GUI para data mining, e o DSTK Text Explorer oferece GUI para Text Mining.
Requisitos :
Java Runtime Environment, da Microsoft. Net Framework
Limitações :
10-use julgamento
Comentários não encontrado