Análise das Correlações entre as Métricas de Avaliação de Desempenho
dos Classificadores Multirrótulo.
Métricas de Avaliação de Desempenho, Métodos de Transformação do Problema, Classificadores Multirrótulo, Correlação de Pearson, Correlação de Spearman.
A classificação multirrótulo é uma tarefa de aprendizado de máquina em
que objetos podem estar associados a mais de uma classe. É uma tarefa
que necessita de algoritmos de classificação os quais requerem a utilização
de métricas para avaliar o desempenho. Na literatura de aprendizado de
máquina não foram identificados estudos na área os quais apontam a
existência de correlações entre as métricas de avaliação de desempenho
dos classificadores multirrótulo. Esses estudos são importantes, pois
podem auxiliar os pesquisadores da área no suporte a tomada de decisão
de quais algoritmos podem ser escolhidos ou considerados para
determinados métodos de transformação do problema. Neste contexto,
este trabalho realizou um estudo sobre as métricas de avaliação de
desempenho dos algoritmos de classificação multirrótulo com o intuito de
identificar possíveis correlações existentes entre elas. O objetivo principal
desta pesquisa foi calcular as correlações entre as métricas de avaliação de
desempenho dos classificadores multirrótulo. Para que o objetivo fosse
atingido foram utilizadas dez bases de dados multirrótulo; cinco métodos
de transformação do problema multirrótulo para monorrótulo (BR, CC, LP,
PS e RAkEL); e cinco classificadores base (J48, KNN, NB, SVM e RIPPER). A
metodologia de validação utilizada foi a validação cruzada com dez folds e,
para a execução dos experimentos e o cálculo das métricas, a biblioteca
MULAN. As correlações foram calculadas por meio dos coeficientes de correlação linear de Pearson e de correlação não linear de Spearman. Apósa análise dos resultados, percebeu-se que existem tantocorrelaçõeslineares quanto correlações não lineares entre as métricas selecionadas e elas possibilitaram identificar potenciais algoritmos de classificação que podem ser escolhidos ou considerados para serem utilizados juntamente com os métodos de transformação do problema.