29 abr 2025
09:00 Defesa de Doutorado Sala 85 do IC 2
Tema
Inter-node message passing in the optical disaggregated memory scenario
Aluno
Maurício Gagliardi Palma
Orientador / Docente
Rodolfo Jardim de Azevedo
Breve resumo
Memória é um recurso de grande importância no ambiente computacional. Ela deve apresentar baixos tempos de acesso, alta largura de banda e espaço de armazenamento suficiente para execução das aplicações. Adicional a isso, é comum que usuários não saibam com precisão a demanda de espaço de armazenamento de suas aplicações, o que os leva a superestimar o requerimento deste recurso, pois a insuficiência de memória degrada substancialmente o desempenho ou mesmo provoca a falha do programa. Dessa maneira, a boa gestão da utilização de memória em um cluster de computadores se torna um desafio. Uma solução que busca melhorar esta utilização é desagregar (separar) a memória dos computadores dos demais componentes, permitindo que consigamos conectar e desconectar essas memórias de uma melhor maneira, adaptando esse recurso para específicamente o necessário para cada aplicação. Na prática, o desagregar neste contexto se traduz em permitir que memórias externas, além das já conectadas à placa-mãe do computador, sejam alocadas ao computador. Isto não é algo trivial, considerando os padrões de desempenho que são impostos ao canal de memória. Neste documento, são apresentadas duas pesquisas que buscam contribuir com a adoção de memória desagregada. A primeira envolve a avaliação de uma solução para desagregar a memória, chamada Optically Connected Memory (OCM), que consiste em criar uma conexão óptica entre o controlador de memória, que se encontra no processador, e a memória principal. OCM permite que o canal de memória tenha um comprimento na ordem de metros (até 6 metros contando a ida e a volta em nossa avaliação) mantendo os requisitos de largura de banda impostos pelo padrão DDR. Nossos resultados mostram que a OCM consegue ter um desempenho até 5,5x maior quando comparada à desagregar a memória utilizando uma rede convencional com desempenho de 40 Gb. A segunda pesquisa é sobre o protocolo Flexible Memory Unit (FMU), que é um novo protocolo de envio de mensagem entre computadores. O protocolo FMU utiliza de memórias desagregadas via OCM. Dessa maneira, ele é capaz de utilizar a largura de banda do padrão DDR para efetuar essa comunicação, acelerando o envio de mensagens. Adicional à esse ganho na largura de banda, a memória desagregada serve como um buffer dedicado para o armazenamento de mensagens, o que permite que os envios das mensagens sejam feitos de forma imediata pelo computador que as envia. Em nossos resultados, o protocolo FMU apresentou ganhos de até 5,18x na execução de aplicações totalmente dependentes do desempenho da comunicação, e ganhos de até 1,22x na execução de aplicações em que a comunicação tem menor impacto no desempenho.
Banca examinadora
Titulares:
Rodolfo Jardim de Azevedo IC/UNICAMP
Alfredo Goldman vel Lejbman IME/USP
Alexandro José Baldassin IGCE/UNESP
Hervé Cédric Yviquel IC/UNICAMP
Lucas Francisco Wanner IC/UNICAMP
Suplentes:
Sandro Rigo IC/UNICAMP
Paulo Sérgio Lopes de Souza ICMC/USP
Hermes Senger CCET/UFSCar