10 mar 2021
14:00 Defesa de Mestrado Integralmente a distância
Tema
Selecting Efficient Virtual Machines for Training Deep Learning Models on the Cloud
Aluno
Eva Maia Malta
Orientador / Docente
Edson Borin (Orientador) / Sandra Eliza Fontes de Avila (Coorientadora)
Breve resumo
Modelos de Aprendizado Profundo têm sido cada vez mais utilizados para a resolução de problemas complexos. Sua característica de análise hierárquica da informação permite a extração de relações complexas existentes em um conjunto de dados. No entanto, com o aumento da complexidade dos modelos e da quantidade de dados, o treinamento destes modelos tem exigido o uso de sistemas computacionais cada vez mais poderosos e com alto custo de aquisição. A Nuvem Computacional é um modelo de negócios que permite o acesso a diversos tipos de sistemas computacionais, incluindo sistemas de alto desempenho, mediante o pagamento pelo uso, sem que o usuário tenha que arcar com o custo de aquisição do equipamento. Contudo, escolher corretamente o sistema computacional mais adequado para o treinamento de um modelo de Aprendizado profundo na nuvem é um desafio, pois a escolha deve levar em consideração fatores como tempo de execução e custo, por exemplo. Pensando nisso, este trabalho apresenta um estudo sobre o comportamento do treinamento de modelos de Aprendizado Profundo em máquinas virtuais com GPU na nuvem computacional. Nesse estudo, nós observamos que a configuração do batch size afeta o tempo de treinamento do modelo e o número de épocas necessárias para que a acurácia do modelo estabilize. Além disso, observamos que os tempos de execução das iterações e dos processos de validação de cada época do treinamento são estáveis, com exceção da primeira iteração e da validação da primeira época. A partir destas observações, propusemos duas metodologias para identificar o tipo de máquina virtual ideal para treinar um dado modelo de Aprendizado Profundo na nuvem computacional. Por fim, validamos a acurácia das metodologias propostas com duas aplicações de Aprendizado Profundo distintas e mostramos que, em ambos os casos, as metodologias foram capazes de identificar o tipo de máquina virtual com menor custo e/ou mais rápida para realizar o treinamento.
Banca examinadora
Titulares:
Edson Borin IC/UNICAMP
João Paulo Papa DCo/UNESP
Lúcia Maria de Assumpção Drummond IC/UFF
Suplentes:
Edmundo Roberto Mauro Madeira IC/UNICAMP
Moacir Antonelli Ponti ICMC/USP