Contem Varios Algoritmos Otimo Pra Quem Tah Começando Baixaki nOTA [10]
Weka é um pacote desenvolvido pela Universidade de Waikato, em 1993, com o intuito de agregar algoritmos para mineração de dados na área de Inteligência Artificial. O software é licenciado pela General Public License sendo, assim, possível a alteração do seu código-fonte. Weka é elaborado em linguagem Java.
Possui uma série de heurísticas para mineração de dados relacionadas à classificação, regressão, clusterização, regras de associação e visualização, entre elas: NaiveBayes, Linear Regression, IB1, Bagging, LogistBoot, Part, Ridor, ID3 e LMT.
Por se tratar de um pacote, contém 10 bases de dados prontas para serem mineradas e testadas. A visualização das Árvores de Decisões já ocorre com a poda, e a Matriz de Confusão é apresentada apontando os erros e acertos considerados pelo sistema.
O download é rápido e simples, mas vale ressaltar que para que uma base de dados seja carregada no software, é necessário que o arquivo esteja no formato .arff, formato de leitura para o Weka.
Após a formatação da sua base de dados, clique em Open File para selecionar a base de dados que deseja carregar. Você terá a opção de visualizar, em forma gráfica, como está a distribuição das classes da sua base de dados.
Clique, na aba superior, em Classify. Escolha em Choose a heurística que deseja testar. Selecione na caixa Test Options uma das opções: Use Training Set (Estabeler Treinamento de Uso), Supplied Test Set (Estabeler Teste Fornecido), Cross Validation (Validação Cruzada), Percentage Split (Divisão da Porcentagem). Estas são opções para determinar o tipo de teste que deseja realizar. Clique em Start e aguarde o resultado.
O tempo de processamento das heurística varia de acordo com: o tipo de heurística que você selecionar, a quantidade escolhida para validação cruzada e o tamanho da sua base de dados.
Por exemplo, uma base de dados, com 8100 instâncias (linhas) e com a opção de validação cruzada de 10 partições, faz a mineração dos dados da seguinte forma: divide as 8100 linhas em 10 pedaços de 810. O software treina 9 desses pedaços e testa 1 deles. Esse processo repete-se 10 vezes.
Assim sendo, a mineração pode levar alguns segundos, como levar algumas horas para que o processo seja completo.
O processo de Extração do Conhecimento é composto por cinco etapas:
Excelente software para analistas da informação, profissionais da área de informática ou áreas relacionadas que necessitem minerar e extrair conhecimentos.
Antes de instalar o " Weka " você pode criar um ponto de restauração do Windows, assim, se não gostar do programa ou se ele não funcionar corretamente, você pode simplesmente restaurar o sistema para um ponto anterior à instalação do programa.Clique aqui e aprenda a criar um ponto de restauração.
Acima você conferiu uma descrição completa sobre o Weka e suas funcionalidades, saiba agora o que achamos dele
O Weka se destaca como a ferramenta mais utilizada para mineração de dados. E não é para menos, pois traz uma lista completa de heurísticas para que o usuário possa tratar os dados de sua base.
O usuário do software necessita ter um conhecimento intermediário de mineração de dados e de informática, visto que, apesar de uma interface simples e fácil de utilizar, a mineração dos dados requer algumas características específicas. Alguns detalhes, como saber qual das classes da sua base de dados é a determinante, são primordiais. Caso você não defina isto corretamente, carregará uma classe que não lhe oferece o verdadeiro resultado para análise.
Nunca é demais reforçar que cada base de dados tem suas especificidades e características. Desta forma, pode-se confirmar que a falta de conhecimento de algoritmos prejudica na utilização do Weka, já que você dispõe de dezenas de heurísticas e deve ter noção de qual delas é melhor ou pior para a mineração dos seus dados.
No geral, o Weka é uma ferramenta indispensável para profissionais que trabalham com Inteligência Artificial, ou aqueles que necessitam traçar o perfil de um consumidor. Por exemplo, dependendo dos dados da sua base, você obtém as combinações possíveis para determinar características essenciais do consumidor.
Contem Varios Algoritmos Otimo Pra Quem Tah Começando Baixaki nOTA [10]
Prós: Contém uma quantidade enorme de algoritmos que podem ser utilizados. Contém por exemplo, algoritmos como redes neurais, árvore de decisão, k-NN, entre muitos outros.
Contras: Não que seja ruim, mas é necessário saber como funciona os algoritmos.
Java 1.4 ou superior
FirebirdGratuitoFamoso banco de dados relacional com muitos recursos ANSI SQL.
MySQL for WindowsGratuitoServidor de banco de dados SQL multi-recursos.
SQL Server 2008Gratuito para testarAtualize seu SQL Server 2000 ou 2005 e teste as novas funcionalidades do SQL Server 2008.