TAXONOMIA DE MÉTRICAS DE DESEMPENHO PARA CLASSIFICADORES MULTIRRÓTULO.
Métricas de avaliação de desempenho; Classificadores multirrótulo; Classificação plana; Taxonomia de métricas.
Recentemente, a aprendizagem de máquina tem se tornado uma área fundamental para o mundo contemporâneo devido estar contribuindo com diversos domínios do conhecimento mediante a utilização de algoritmos indutivos. Os algoritmos permitem que os computadores aprendam a partir de conjuntos de dados, específicos de algum domínio, por meio da indução de hipóteses. Cada algoritmo tem uma representação específica para a hipótese induzida e suas aplicações são baseadas nos seguintes critérios: número de rótulos de cada exemplo, grau de supervisão adotado e total de níveis dos rótulos. Em relação ao número de rótulos, uma aplicação pode ser monorrótulo ou multirrótulo. No que diz respeito ao grau de supervisão, a aplicação pode apresentar um dos seguintes paradigmas de aprendizado: supervisionado, não-supervisionado ou semi-supervisionado. Os paradigmas possuem diferentes tarefas de aprendizado (classificação, agrupamento, descrição simples, etc). Quanto ao nível dos rótulos, uma aplicação pode ser plana ou hierárquica. Ademais, é importante citar que tais algoritmos necessitam de métricas de avaliação de desempenho para verificar a precisão da tarefa de aprendizado que foi aplicada a a um problema específico. Neste contexto, o trabalho de dissertação em desenvolvimento foca-se no estudo das métricas de avaliação de desempenho de algoritmos de classificação plana e multirrótulo com o intuito de identificar possíveis correlações entre elas. O objetivo principal da pesquisa é elaborar uma taxonomia para as métricas utilizando uma ontologia, a qual se baseará nas correlações encontradas por meio dos coeficientes de correlação de Pearson e de Spearman. A taxonomia das métricas auxiliará os pesquisadores da área no suporte a tomada de decisão de quais algoritmos de classificação poderão ser utilizados em determinados problemas com base na análise de sensibilidade de tais algoritmos. A análise de sensibilidade auxiliará na identificação de algoritmos que poderão ser utilizados, pois trata de problemas havendo incertezas. Portanto, espera-se que após a pesquisa ser concluída, a taxonomia possa ser utilizada para identificar potenciais algoritmos de classificação multirrótulo a serem utilizados em diversos.