GESTÃO EM TRANSPORTE MARÍTIMO: OTIMIZAÇÃO DE ALOCAÇÃO DE CONTÊINERES VAZIOS UTILIZANDO GRASP REATIVO COM APRENDIZADO POR REFORÇO
Reposicionamento de contêiner vazio, Metaheurística, GRASP, Aprendizado por reforço.
O reposicionamento de contêineres vazios entre os portos apresenta um custo elevado para os embarcadores e ocorre quando as quantidades de cargas exportadas e importadas são diferentes em uma determinada área de comércio marítimo, fazendo com que sobrem contêineres vazios em alguns portos e faltem em outros. Para atender à demanda dos clientes, as companhias podem desenvolver ações que causam prejuízo, como, por exemplo, repassar seus clientes para outras companhias quando não houver disponibilidade de contêiner vazio ou alugar contêineres vazios, se disponíveis, no porto de demanda. Desta forma, faz-se necessária a realização de estudos que apresentem soluções para o problema de reposicionamento de contêiner vazio, com o objetivo de minimizar os custos envolvidos nesta atividade. O presente estudo propõe uma solução algorítmica para o referido problema, utilizando método aproximativo (metaheurística), especificamente o algoritmo Greedy Randomized Adaptive Search Procedure-GRASP Reativo, conjugando a técnica de Aprendizado por Reforço (Reinforcement Learning) com o algoritmo Q-Learning. Este algoritmo é capaz de aprender diretamente a partir de experiências anteriores, o que minimiza a quantidade de cálculos a posteriori, otimizando, assim, o processamento computacional. Utilizou-se uma série de instâncias encontradas na literatura chamadaCarbin na realização dos testes. Estes apontaram avanços (melhores soluções) em relação aos resultados obtidos por Coelho (2015) cujo trabalho também tratou o problema de reposicionamento de contêineres vazios, implementado com o algoritmo GRASP tradicional.