07 abr 2021
14:00 Defesa de Doutorado Integralmente a distância
Tema
Protocolos para Intersecção Privada de Conjuntos (PSI) e para Classificação Privada baseada no Naive Bayes
Aluno
Amanda Cristina Davi Resende
Orientador / Docente
Diego de Freitas Aranha
Breve resumo
Devido ao cuidado em controlar o acesso às informações sensíveis/confidenciais, existe uma grande preocupação em construir sistemas computacionais que mantenham a privacidade das entidades que as fornecem. Assim, esse trabalho apresenta protocolos para Intersecção Privada de Conjuntos (PSI) e Aprendizado de Máquina preservando a privacidade. Protocolos para PSI permitem que duas partes calculem a intersecção de seus conjuntos privados sem revelar nenhuma informação adicional além do resultado da intersecção, para uma parte (unidirecional) ou ambas as partes (mútua). Apesar dos diversos protocolos PSI disponíveis na literatura, apenas recentemente técnicas têm sido aplicadas aos protocolos existentes com o objetivo de torná-los mais eficientes quando uma das partes detém um conjunto de elementos muito menor que a outra. Este é um cenário realista em muitos casos, caracterizando uma configuração desbalanceada. Assim, construímos com base em técnicas modernas de engenharia criptográfica e propomos otimizações para promissores protocolos PSI unidirecionais baseados em criptografia de chave pública que são seguros tanto contra adversários semi-honestos quanto maliciosos. Mostramos que nossas melhorias e otimizações geram protocolos que melhoram a complexidade de comunicação e o tempo de execução de propostas anteriores na configuração desbalanceada.
Além disso, propomos um classificador Naive Bayes que preserva a privacidade e o aplicamos ao problema de classificação de texto privado. Nesse cenário, uma parte (Alice) possui uma mensagem de texto, enquanto outra parte (Bob) segura um classificador. No final do protocolo, Alice aprenderá apenas o resultado do classificador aplicado à sua entrada de texto e Bob não aprenderá nada. Nossa solução é baseada em Computação Segura Multiparte (MPC) e fornece uma solução rápida e segura para a classificação de texto não estruturado. Aplicando nossa solução para o caso de detecção de spam (a solução é genérica, podendo ser utilizada em qualquer outro cenário em que o classificador Naive Bayes possa ser empregado), podemos classificar um SMS como spam ou não spam (ham) em menos de 340 ms no caso em que o tamanho do dicionário do modelo de Bob inclui todas as palavras (n = 5200) e o SMS de Alice tem no máximo m = 160 unigramas. No caso de n = 369 e m = 8 (a média de um SMS de spam no banco de dados), nossa solução leva apenas 21 ms.
Com base em nossos resultados, acreditamos que nossas propostas são alternativas práticas para as soluções atualmente em vigor para preservar a privacidade, especialmente, mas não apenas, em aplicações como descoberta de contatos em redes sociais existentes e na classificação de um SMS como spam ou não spam (ham).
Banca examinadora
Titulares:
Diego de Freitas Aranha | IC/UNICAMP - AUNIV |
Marco Aurélio Amaral Henriques | FEEC/UNICAMP |
Jeroen Antonius Maria van de Graaf | DCC/UFMG |
Marcos Antonio Simplicio Junior | PCS/EPUSP |
Conrado Porto Lopes Gouvêa | Kryptus |
Suplentes:
Julio Cesar Lopez Hernandez | IC/UNICAMP |
Anderson Clayton Alves Nascimento | UW |
Mário Sérgio Ferreira Alvim Júnior | DCC/UFMG |