Encerrado

DataMining Project

Este projeto recebeu 7 ofertas de freelancers talentosos com uma oferta média de preço de $64 USD.

Obtenha orçamentos gratuitos para um projeto como este
Empregado trabalhando
Orçamento do projeto
$10 - $30 USD
Total de Ofertas
7
Descrição do projeto

There are two sets of Wikipedia articles. The first set is from Wikipedia featured articles of a

certain type. The first set becomes class Featured. The second set of articles are Wikipedia (non-

featured) articles of similar type to featured articles. The second set becomes class Non-Featured.

We are dealing with a binary classification problem. 

To create attributes, extract all possible tokens from the entire dataset after stemming and stop-

word removal. Create 1-gram, 2-gram and 3-grams from these tokens. Use these n-grams as the

attributes for ARFF files. 

Perform attribute selection on each of 1-gram, 2gram, 3-gram an using information gain and gain

ratio. Perform classification using decision tree, and naïve Bayes. 

Make a Wiki report on your finding including various statistical evaluation measures given by WEKA for each classifier.

Habilidades requeridas

Querendo fazer dinheiro?

  • Defina seu orçamento e o prazo de entrega
  • Descreva sua proposta
  • Receba pelo seu trabalho

Contratar freelancers que também ofereça neste projeto

    • Forbes
    • The New York Times
    • Time
    • Wall Street Journal
    • Times Online