Quais habilidades serão desenvolvidas no curso?

O Curso de Difusão em Ciência de Dados tem como objetivo capacitar profissionais para o mercado de trabalho atual, possibilitando encontrar novas oportunidades de negócio através da análise de dados e da criação de modelos preditivos, utilizando os métodos mais modernos de aprendizado de máquina.

INF-0123

Curso de Difusão

Modalidade Extensão Universitária

E-mail: datascience@ic.unicamp.br

Telefone: (19) 3521-5883 / 3521-5861

Realização:

Sobre o curso

Formato

O Curso de Difusão em Ciência de Dados é composto por 5 módulos que ensinam os principais conceitos exigidos pelo mercado de trabalho, perfazendo uma carga horária total de 100 horas, sendo 80 horas de aulas e 20 horas de atividades supervisionadas.

Certificado

Os alunos aprovados terão direito ao certificado de participação do Curso de Difusão em Ciência de Dados, emitido pela Escola de Extensão da Unicamp.

Professores

O corpo de docentes do Curso de Difusão em Ciência de Dados é composto por professores e pesquisadores da Unicamp, com grande experiência na área, todos com doutorado.



  • Módulos

  • ANÁLISE DE DADOS
    Introdução à Análise de Dados usando a Linguagem R. Tipos de dados (vetores, listas, matrizes, data frames, etc). Funções pré-definidas. Implementação de funções em R. Tratamento, análise e visualização de dados.

    APRENDIZADO DE MÁQUINA NÃO SUPERVISIONADO
    Descoberta do conhecimento. Compreensão e prospecção de informação. Análise exploratória de dados. Detecção de anomalias. Regras de associação. Redução de dimensionalidade. Seleção de atributos. Técnicas de agrupamento.

    APRENDIZADO DE MÁQUINA SUPERVISIONADO I
    Problemas de classificação. Fronteiras de decisão. Classificadores lineares e não lineares, regressão logística, árvores de decisão e random forests. Overfitting e validação. Métodos de ensemble: bagging, boosting e stacking. Validação cruzada. Desbalanceamento, diagnóstico de viés e variância. Medidas de avaliação. Interpretação de modelos (X-AI) e classificação em cenário aberto (open-set).

    APRENDIZADO DE MÁQUINA SUPERVISIONADO II
    Máquinas de Suporte de Vetores (SVMs): kernels (lineares e não lineares), SVRs e SVM one-class. Técnicas de regularização. grid-search e random-search. Redes neurais: tipos de redes, forward e backward propagation, e funções de ativação. Testes estatísticos.

    DEEP LEARNING
    Deep learning e redes neurais convolucionais (CNN). Convolução: padding e stride. Funções de perda (loss functions). Treinamento: funções de ativação, pré-processamento, data augmentation, inicialização de pesos e otimização de parâmetros. Regularização. Transferência de aprendizado. Redes Neurais Recorrentes (RNN). Transformers. Detecção e Segmentação. Generative Adversarial Networks (GAN). Interpretabilidade (X-AI). Ferramentas: TensorFlow e Keras.




  • Informações

  • Pré-requisito: Conhecimento básico de programação.
    Público-alvo: Profissionais de Informática, formados em Computação ou áreas afins (Engenharias ou Exatas).
    Tipo de curso: Curso de Difusão - Modalidade Extensão Universitária.
    Material necessário: Por ser um curso com enfoque prático, todos alunos devem usar seus notebooks nas aulas.
    Coordenador do curso: Prof. Dr. Zanoni Dias.
    Oferecimento: Exclusivamente no modelo "in company" (fechado para empresas). Solicite um orçamento por email.

    Anualmente oferecemos o Curso de Aperfeiçoamento em Mineração de Dados Complexos, uma versão expandida do Curso de Difusão em Ciência de Dados. Saiba mais no site do curso.




  • Clientes