10 mar 2021
14:00 Defesa de Mestrado Integralmente a distância
Tema
Selecting Efficient Virtual Machines for Training Deep Learning Models on the Cloud
Aluno
Eva Maia Malta
Orientador / Docente
Edson Borin (Orientador) / Sandra Eliza Fontes de Avila (Coorientadora)
Breve resumo
Modelos de Aprendizado Profundo têm sido cada vez mais utilizados para a resolução de problemas complexos.
Sua característica de análise hierárquica da informação permite a extração de relações complexas existentes em um conjunto de dados.
No entanto, com o aumento da complexidade dos modelos e da quantidade de dados, o treinamento destes modelos tem exigido o uso de sistemas computacionais cada vez mais poderosos e com alto custo de aquisição.
A Nuvem Computacional é um modelo de negócios que permite o acesso a diversos tipos de sistemas computacionais, incluindo sistemas de alto desempenho, mediante o pagamento pelo uso, sem que o usuário tenha que arcar com o custo de aquisição do equipamento.
Contudo, escolher corretamente o sistema computacional mais adequado para o treinamento de um modelo de Aprendizado profundo na nuvem é um desafio, pois a escolha deve levar em consideração fatores como tempo de execução e custo, por exemplo.
Pensando nisso, este trabalho apresenta um estudo sobre o comportamento do treinamento de modelos de Aprendizado Profundo em máquinas virtuais com GPU na nuvem computacional.
Nesse estudo, nós observamos que a configuração do batch size afeta o tempo de treinamento do modelo e o número de épocas necessárias para que a acurácia do modelo estabilize.
Além disso, observamos que os tempos de execução das iterações e dos processos de validação de cada época do treinamento são estáveis, com exceção da primeira iteração e da validação da primeira época.
A partir destas observações, propusemos duas metodologias para identificar o tipo de máquina virtual ideal para treinar um dado modelo de Aprendizado Profundo na nuvem computacional.
Por fim, validamos a acurácia das metodologias propostas com duas aplicações de Aprendizado Profundo distintas e mostramos que, em ambos os casos, as metodologias foram capazes de identificar o tipo de máquina virtual com menor custo e/ou mais rápida para realizar o treinamento.
Banca examinadora
Titulares:
Edson Borin | IC/UNICAMP |
João Paulo Papa | DCo/UNESP |
Lúcia Maria de Assumpção Drummond | IC/UFF |
Suplentes:
Edmundo Roberto Mauro Madeira | IC/UNICAMP |
Moacir Antonelli Ponti | ICMC/USP |