Defesa de Doutorado de Amanda Cristina Davi Resende

07 abr 2021

14:00 Defesa de Doutorado Integralmente a distância

Relacionado

Tema

Protocolos para Intersecção Privada de Conjuntos (PSI) e para Classificação Privada baseada no Naive Bayes

Aluno

Amanda Cristina Davi Resende

Orientador / Docente

Diego de Freitas Aranha

Breve resumo

Devido ao cuidado em controlar o acesso às informações sensíveis/confidenciais, existe uma grande preocupação em construir sistemas computacionais que mantenham a privacidade das entidades que as fornecem. Assim, esse trabalho apresenta protocolos para Intersecção Privada de Conjuntos (PSI) e Aprendizado de Máquina preservando a privacidade. Protocolos para PSI permitem que duas partes calculem a intersecção de seus conjuntos privados sem revelar nenhuma informação adicional além do resultado da intersecção, para uma parte (unidirecional) ou ambas as partes (mútua). Apesar dos diversos protocolos PSI disponíveis na literatura, apenas recentemente técnicas têm sido aplicadas aos protocolos existentes com o objetivo de torná-los mais eficientes quando uma das partes detém um conjunto de elementos muito menor que a outra. Este é um cenário realista em muitos casos, caracterizando uma configuração desbalanceada. Assim, construímos com base em técnicas modernas de engenharia criptográfica e propomos otimizações para promissores protocolos PSI unidirecionais baseados em criptografia de chave pública que são seguros tanto contra adversários semi-honestos quanto maliciosos. Mostramos que nossas melhorias e otimizações geram protocolos que melhoram a complexidade de comunicação e o tempo de execução de propostas anteriores na configuração desbalanceada. Além disso, propomos um classificador Naive Bayes que preserva a privacidade e o aplicamos ao problema de classificação de texto privado. Nesse cenário, uma parte (Alice) possui uma mensagem de texto, enquanto outra parte (Bob) segura um classificador. No final do protocolo, Alice aprenderá apenas o resultado do classificador aplicado à sua entrada de texto e Bob não aprenderá nada. Nossa solução é baseada em Computação Segura Multiparte (MPC) e fornece uma solução rápida e segura para a classificação de texto não estruturado. Aplicando nossa solução para o caso de detecção de spam (a solução é genérica, podendo ser utilizada em qualquer outro cenário em que o classificador Naive Bayes possa ser empregado), podemos classificar um SMS como spam ou não spam (ham) em menos de 340 ms no caso em que o tamanho do dicionário do modelo de Bob inclui todas as palavras (n = 5200) e o SMS de Alice tem no máximo m = 160 unigramas. No caso de n = 369 e m = 8 (a média de um SMS de spam no banco de dados), nossa solução leva apenas 21 ms. Com base em nossos resultados, acreditamos que nossas propostas são alternativas práticas para as soluções atualmente em vigor para preservar a privacidade, especialmente, mas não apenas, em aplicações como descoberta de contatos em redes sociais existentes e na classificação de um SMS como spam ou não spam (ham).

Banca examinadora

Titulares:

Diego de Freitas Aranha	IC/UNICAMP - AUNIV
Marco Aurélio Amaral Henriques	FEEC/UNICAMP
Jeroen Antonius Maria van de Graaf	DCC/UFMG
Marcos Antonio Simplicio Junior	PCS/EPUSP
Conrado Porto Lopes Gouvêa	Kryptus

Suplentes:

Julio Cesar Lopez Hernandez	IC/UNICAMP
Anderson Clayton Alves Nascimento	UW
Mário Sérgio Ferreira Alvim Júnior	DCC/UFMG

Defesa de Doutorado de Amanda Cristina Davi Resende

Relacionado

Notícias

IC abre Concurso Público para Professor Doutor na Área de Inteligência Artificial

IC tem verba para Apoio para Atividades de Extensão em 2025

Chamada para Projetos de Extensão do IC – 1s2025

Parceiros