Aprendizado de Máquina Ético (2022/2023) - Ethical ML

A disciplina capacita alunos a identificar e mitigar impactos negativos de dados e ferramentas de aprendizado de máquina em grupos vulneráveis, promovendo transparência e soluções éticas. Envolve análise de dados, aplicação de modelos de aprendizado de máquina e compreensão de problemas de otimização, com uma avaliação inicial e aulas niveladoras para garantir a base necessária.

Objetivos Terminais

O aluno deverá ser capaz de identificar o uso de dados e de ferramentas de aprendizado de máquina que gerem danos a indivíduos e grupos vulneráveis e utilizar e propor ferramentas que reduzam o impacto e aumentem a transparência de tais dados e ferramentas.

Pré-requisitos

Abaixo estão listadas as capacidades desejáveis para o aluno, estas não são mandatórias, mas aumentarão a probabilidade na absorsão de conhecimento do aluno.

  • Ser capaz de realizar uma análise descritiva de dados (estatísticas básicas, visualização de dados).
  • Ser capaz de aplicar e descrever características de modelos de aprendizado de máquina (regressão logística, árvores de decisão e ensembles) em dados tabelados.
  • Ser capaz de aplicar modelos de aprendizado profundo em dados de natureza diversa.
  • Ser capaz de entender e modelar problemas de otimização no contexto de aprendizado de máquina.

Avaliação diagnóstica

Ao início do semestre será feita uma avaliação diagnóstica para tomar conhecimento dos pré-requisitos da turma.

  • Projeto a ser executado entre a primeira e segunda semana, contendo tarefas que induzam a demonstração de cada um dos desempenhos listados acima.
  • Exercício prático, individual, a ser executado entre a primeira e segunda semana, contendo tarefas que induzam a demonstração de cada um dos desempenhos listados acima.
  • Serão ministradas quatro aulas adicionais através de videoconferência/híbrido (para facilitar adesão dos alunos), sendo uma de cada tópico, para nivelar desempenho mínimo de cada conhecimento requerido.

Conteúdos

  • Unidade 1. Introdução: Leis de dados, Criando confiança, Ciclo de ML, e Segurança. (2 semanas)
    • Objetivo: O aluno deverá ser capaz de enumerar os principais atributos desejáveis de um modelo de aprendizado de máquina que seja ético, transparente e confiável.
  • Unidade 2. Dados: Fontes de dados, modalidades, vieses, privacidade e consentimento. (1 semana)
    • Objetivo: O aluno deverá ser capaz de preparar dados que sejam confiáveis e menos enviesados, preservando a privacidade e consentimento do usuário.
  • Unidade 3. Modelagem básica: Conceitos básicos de aprendizado de máquina, aprendizado supervisionado, modelos causais. (1 semana, com mais 1 se necessário)
    • Objetivo: O aluno deverá ser capaz escolher e potencialmente criar modelos de aprendizado de máquina que sejam mais adequados para os dados preparados.
  • Unidade 4. Confiabilidade e Imparcialidade: Detecção e promoção de imparcialidade em máquinas de aprendizado, manutenção de confiabilidade em cenários sob mudança ou ataque. (3 semanas)
    • Objetivo: O aluno deverá ser capaz de escolher e potencialmente criar/modificar modelos de aprendizado de máquina mais confiáveis e imparciais.
  • Unidade 5. Interação: Interpretabilidade em aprendizado de máquina, e criação de mecanismos de intervenção nas máquinas de aprendizado. (3 semanas)
    • Objetivo: O aluno deverá ser capaz de detectar e modificar uma máquina de aprendizado que falhe ao empoderar tomadores de decisão de compreendê-la e detectar falhas na sua confiabilidade e imparcialidade.
  • Unidade 6. Propósito: Bem social, influência dos tomadores de decisão no desenho de produtos de aprendizado de máquina, desafios em aprendizado de máquina. (1 semana)
    • Objetivo: O aluno deverá ser capaz de enumerar os problemas éticos no seu contexto de aplicação, harmonizar com o ambiente na qual está inserido, e conceber um arcabouço que reduza tais problemas em busca do bem social.

Referências

  • Divulgação geral:
    • Algoritmos de Destruição em Massa: Livro que apresenta diversos exemplos de algoritmos anti-éticos
    • The Ethical Algorithm: The Science of Socially Aware Algorithm Design: Livro que apresenta as principais áreas de ética em ML (Fairness, Transparency e Privacy) para o público geral
    • Coded Bias: Documentário da Netflix que pode servir de motivação para o curso
  • Referência principal:
  • Referências adicionais:
    • Fairness and machine learning: Livro disponibilizado gratuitamente que foi feito em conjunto por três professores de universidades diferentes que dão disciplinas de Fairness ou Ética em ML. No site estão disponíveis as páginas das respectivas matérias
    • Practical Fairness: Livro de Fairness da O’Reilly que adicionei na lista só pra avisar que não vale muito a pena. Ele usa nomenclaturas diferentes das mais utilizadas na literatura e não apresenta bem a parte matemática
  • Recursos gerais:
    • Trustworthy ML Initiative: Possui diversos recursos de Trustworthy ML, como livros de divuldação geral, textbooks, documentários e sites de disciplinas.
Marcos M. Raimundo
Marcos M. Raimundo
Professor of Machine Learning and Optimization

My research interests include Machine Learning, Multi-objective Optimization, Ethical AI, mathematical programming.