30 abr 2025
14:00 Defesa de Mestrado Sala 85 do IC2
Tema
Computação na borda para análise de imagens em cidades inteligentes
Aluno
Gabriel Massuyoshi Sato
Orientador / Docente
Juliana Freitag Borin - Coorientador: Luis Fernando Gomez Gonzalez
Breve resumo
De acordo com o relatório Mundial das Cidades de 2022, publicado pela ONU-Habitat, 68% da população mundial viverá em áreas urbanas até 2050. O relatório de 2024 destaca um aumento alarmante da temperatura, prevendo uma elevação de 0,5 graus Celsius até 2040. Como destaque, as cidades possuem extrema importância nas discussões climáticas e na sustentabilidade. Diante disso, a criação de cidades inteligentes se torna uma necessidade para a busca da sustentabilidade, qualidade de vida, urbanização e inteligência nas áreas urbanas. Para que as infraestruturas se conectem e se tornem mais inteligentes, o conceito de Internet das Coisas (IoT) é essencial. Seu maior benefício é a detecção antecipada de diferentes problemas, seja trânsito, falta de energia e água, segurança ou até mesmo infraestrutural. Em conjunto a IoT, a Computação na Borda surge para mitigar alguns desafios das aplicações, como o alto consumo de largura de banda e latência. O conceito de trazer parte do processamento do sistema para perto dos usuários finais torna eficiente a manipulação da grande quantidade de dados que o meio urbano produz. Em contrapartida, os dispositivos da borda possuem recursos restritos comparados à nuvem, sendo um desafio realizar tarefas complexas. O aprendizado de máquina vem sendo utilizado cada vez mais combinado com a Computação na Borda para elevar o nível da complexidade das tarefas que os dispositivos conseguem executar. Essa dissertação tem como objetivo integrar os conceitos de Internet das Coisas, Computação na Borda e Aprendizado de Máquina, propondo soluções para cidades inteligentes, em especial, com análise de imagens. Serão propostos dois estudos de caso de aplicações reais, sendo um estacionamento inteligente e um sistema de contagem de pessoas. Para o primeiro caso, será apresentada uma solução utilizando câmeras, que tiram fotos periodicamente, e resultam no número de vagas disponíveis do local. Dessa forma, a aplicação se mostra mais escalável e de menor custo, comparada às soluções que utilizam sensores. O segundo estudo de caso apresentará um sistema de contagem de pessoas da fila da entrada do restaurante universitário da Unicamp. Atualmente, a solução existente já utiliza câmeras para detecção de pessoas, embora o processamento seja feito na nuvem. Movendo a análise para a borda, o consumo de banda diminui e a privacidade aumenta, sendo dispensáveis transmissões de fotos para o servidor. Por fim, um último experimento será conduzido onde ocorrerá o treinamento do algoritmo de aprendizado profundo YOLOv8, em sua versão "n", nos dispositivos escolhidos de 64 bits. Os estudos de caso mostraram a viabilidade dos quatro dispositivos escolhidos para realizar análise de imagens em cenários reais de cidades inteligentes. Os tempos de análise das imagens foram entre aproximadamente 0,4 a 100 segundos, mostrando a possibilidade de utilizar os modelos escolhidos em todos os dispositivos, com exceção da Youit Tx2 que possui compatibilidade apenas com modelos TFLite. O treinamento se mostrou eficiente, com mAP 50-95 superior a 90% e acurácias superiores a 99% para o estacionamento em questão, levando aproximadamente 2,5 a 7 dias.
Banca examinadora
Titulares:
Juliana Freitag Borin IC/UNICAMP
Marcio Seiji Oyamada CCET/UNIOESTE
Allan Mariano de Souza IC/UNICAMP
Suplentes:
Sandro Rigo IC/UNICAMP
Denis Lima do Rosário ICEN/UFPA