UMA ABORDAGEM POR HIPERHEURÍSTICA COM APRENDIZADO PARA O PROBLEMA DE ROTEAMENTO DE VEÍCULOS COM JANELA DE TEMPO
Hiperheurística com aprendizado, Metaheurística GRASP, Problema de Roteamento de Veículos com Janela de Tempo (PRVJT), Aprendizado por Reforço.
O conceito de hiperheurística é um tanto novo no ramo da otimização, esse método propõe como estratégia para solucionar problema de ordem combinatória, um método que opere em um novo nível de abstração, sem a utilização de informações específicas do problema tratado. Sendo capaz de oferecer uma solução através do gerenciamento de um conjunto de métodos heurísticos disponíveis, no qual mecanismos de aprendizado e/ou treinamento podem ser empregados. Essas características permitem que esse tipo de abordagem possa se adaptar a diversos domínio de problemas ou diferentes classes de instância. Esse tipo de abordagem pode ser utilizada em problemas onde dispondo de um conjunto de métodos não se sabe que técnica de resolução é mais adequada a um dado problema ou classe de instância. O presente trabalho é uma proposta de uma abordagem hiperheurística com aprendizado integrada à Metaheurística GRASP (Greedy Randomized Adaptive Search) Procedure para uma variante do clássico Problema de Roteamento de Veículos (PRV), o Problema de Roteamento de Veículos com Janela de Tempo (PRVJT). Apresentando um referencial teórico para o entendimento da proposta, que tem como mecanismo de aprendizado uma técnica de Aprendizado por Reforço (AR), o algoritmo Q-Learning, que terá a tarefa de decidir que método irá compor a fase construtiva do GRASP. Além de apresentar uma visão geral da proposta do trabalho, em estratégia de solução para o PRVJT, instâncias a serem utilizadas e sugestões de comparações a serem feita com os resultados obtidos com o trabalho.