14abr2026
09:00 Defesa de Mestrado Sala 85 do IC
Tema
Seleção e Otimização de Modelos Pré-Treinados de Aprendizado Profundo para Sistemas de Estacionamentos Inteligentes Baseados em Câmeras em Dispositivos de Borda
Aluno
Gustavo Pessoa Caixeta Pinto da Luz
Orientador / Docente
Juliana Freitag Borin - Coorientador: Luis Fernando Gomez Gonzalez
Breve resumo
O crescimento urbano e o aumento do número de veículos circulando em cidades, juntamente com o tempo gasto na busca por vagas de estacionamentos, contribuem para o aumento do consumo de combustível e das emissões de carbono. Sistemas de estacionamentos inteligentes surgem como uma solução no contexto de internet das coisas (IoT), tradicionalmente baseado em sensores em cada uma das vagas. Outra abordagem possível é utilizar câmeras combinadas com modelos de aprendizado profundo para analisar a disponibilidade de vagas. Estacionamentos inteligentes baseados em câmeras apresentam desafios, como possuir uma boa capacidade de detecção de veículos em diferentes cenários e a necessidade de realizar o processamento local sem enviar imagens para servidores externos. Uma abordagem possível para contornar esse problema é utilizar modelos pré-treinados executados em dispositivos na borda. Apesar da ampla literatura na área, ainda não existe uma metodologia clara para orientar a seleção, avaliação, e otimização desses modelos em sistemas de estacionamento inteligentes com inferência na borda.
Esta tese propõe uma metodologia inspirada no CRISP-DM, que consiste em preparação de dados, seleção de componentes do sistema, execução de um benchmark, avaliação de cada arquitetura para responder perguntas de pesquisa e busca por arquitetura compatível com dispositivos com restrições computacionais. O método foi validado em dois estudos de caso em estacionamentos da Universidade Estadual de Campinas (Unicamp), atingindo um erro médio absoluto (MAE) menor que três veículos em cinco câmeras com características distintas, e um tempo de inferência na borda inferior a um minuto.
No primeiro estudo de caso no estacionamento de baixa complexidade do Instituto de Computação, o uso da seleção de região de interesse (ROI) como um pós-processamento reduziu o MAE em até 96,6%. Modelos com um maior número de parâmetros não foram compatíveis com todos os dispositivos de borda, enquanto modelos mais leves alcançaram tempos de inferência inferiores a 2 segundos. O modelo YOLOv11m apresentou o melhor equilíbrio entre acurácia e tempo de inferência, atingindo um MAE de 0,08 veículos com o tempo de inferência de 8,5 segundos em um dispositivo de borda, quando combinado com técnicas de melhoramento e otimização.
No segundo estudo de caso no estacionamento da Reitoria, que possui mais de 100 vagas e alta complexidade, as técnicas Patching e Slicing Aided Hyper Inference (SAHI) permitiram que modelos de aprendizado profundo mais leves alcançassem desempenho comparável a modelos maiores, reduzindo o MAE em até 73,1%. No entanto, essa melhoria de acurácia é acompanhada por um aumento de tempo de inferência, evidenciado principalmente em modelos Transformers. O modelo YOLOv11m novamente apresentou o melhor equilíbrio em dispositivos de borda, alcançando um MAE variando de 1 a 2,95 veículos, com tempos de inferência entre 3,47 e 39,15 segundos. Por fim, foi proposta uma estratégia de inferência que reduziu a carga computacional do sistema, economizando até 10 horas de tempo de inferência por dia, mantendo um MAE médio entre as quatro câmeras de 1,61 veículos.
Banca examinadora
Titulares:
| Juliana Freitag Borin | IC/UNICAMP |
| Luis Henrique Maciel Kosmalski Costa | POLI/UFRJ |
| Hélio Pedrini | IC/UNICAMP |
Suplentes:
| Allan Mariano de Souza | IC/UNICAMP |
| Rodolfo Ipolito Meneguette | ICMC/USP |