A pós graduação em Ciência de Dados visa formar especialistas e líderes na área, promovendo uma educação de excelência em ciência de dados, combinando teoria e prática com foco em inovação e na resolução de problemas.
Duração: 18 meses
Modalidade: Online com aulas gravadas.
Carga Horária: 400 h/a
Início das aulas: Janeiro 2025
Fim das inscrições: 01/12/2024
Especialize-se em Ciência de Dados
O curso de Pós-Graduação Lato Sensu em Ciência de Dados da Comunidade DS é oferecido na modalidade de Educação a Distância (EaD), com duração entre 16 a 18 meses e carga horária total de 400 horas, distribuídas entre aulas teóricas e práticas. Nosso programa visa formar especialistas na área, promovendo uma educação de excelência em ciência de dados, combinando teoria e prática com foco em inovação e resolução de problemas.
Pré-requisito: O candidato deve possuir diploma de graduação reconhecido pelo Ministério da Educação (MEC) em qualquer área do conhecimento.
Desenvolva Habilidades Essenciais
O curso oferece aos alunos uma base sólida e avançada, capacitando-os com competências técnicas e práticas. São incentivadas habilidades como a comunicação eficaz, visualização de dados, e a tomada de decisões fundamentadas em análises críticas e éticas dos dados. O curso ainda propõe projetos práticos que abordam problemas reais, estimulando a interdisciplinaridade e inovação no uso da ciência de dados.
Objetivos do Curso
Capacitar profissionais para aplicação de metodologias e melhores práticas da ciência de dados.
Promover a integração de diferentes áreas do conhecimento.
Estimular a criação de projetos inovadores que contribuam com o mercado.
Capacitar na análise crítica e resolução de problemas.
Incentivar a continuidade dos estudos e a atualização constante.
Organização Acadêmica
A coordenação do curso é responsável pelo planejamento e gestão acadêmica, monitorando a qualidade de ensino, avaliação e atualização de conteúdo. O corpo docente é composto por especialistas experientes na área de dados, e cada disciplina conta com monitor para suporte acadêmico.
Metodologia e Avaliação
O Ambiente Virtual de Aprendizagem (AVA) centraliza todos os recursos do curso. Avaliações incluem atividades finais e projetos práticos, com notas baseadas em atividades avaliativas e provas substitutivas, sempre com o objetivo de garantir a aplicação dos conceitos estudados. A nota mínima para aprovação é de 6,0.
A quem se destina
Este curso é ideal para profissionais que buscam aprimorar conhecimentos em ciência de dados, análise e interpretação de informações, e decisões estratégicas baseadas em dados, aplicáveis em diversas áreas.
Certificação: Centro Universitário UNIFAAT (Instituição Educacional Atibaiense Ltda.)
Portaria nº 258, de 22 de março de 2018. / Portaria nº 1.850, de 24 de outubro de 2019.
Conceito MEC: Nota 4
Registro e-MEC: https://emec.mec.gov.br/emec/consulta-cadastro/detalhamento/d96957f455f6405d14c6542552b0f6eb/NTMxMg==/93916316abe23148507bd4c260e4b878/MjI2NzIy
Conteúdos Abordados
MÓDULO I
Este módulo oferece uma introdução fundamental nas áreas de programação, estatística e ciência de dados. Ele foi projetado para desenvolver habilidades essenciais de programação e estatística, bases fundamentais para o domínio de técnicas avançadas de análise de dados e machine learning. Este módulo visa fornecer uma base sólida que permitirá ao aluno construir algoritmos, manipular dados e desenvolver uma visão analítica robusta, indispensável para as próximas etapas do curso.
Lógica de programação
Introdução à linguagem Python
Manipulação de dados com DataFrames, JSON, visualização de dados e princípios de ETL.
Estrutura de consultas SQL, subconsultas, funções de janela e operações de união de tabelas.
Aprendizado supervisionado e não supervisionado, algoritmos baseados em árvores e técnicas de agrupamento.
Medidas de dispersão, associações entre variáveis, probabilidade, inferência estatística e identificação de outliers.
Etapas de um projeto de ciência de dados, engenharia de atributos, treinamento de algoritmos de machine learning e interpretação de erros.
MÓDULO II
Neste módulo, aprofundamos os conhecimentos técnicos e práticos necessários para o desenvolvimento de projetos de ciência de dados de forma escalável e alinhada ao ambiente de negócios. Este módulo capacita os alunos a trabalhar com ambientes de desenvolvimento controlados, versionamento de código e fundamentos de negócios. Além disso, aborda o aprimoramento de habilidades em machine learning e a aplicação prática de algoritmos de regressão, considerando os desafios de dados reais. O módulo também inclui um projeto integrador que permite ao aluno aplicar esses conhecimentos em problemas de negócio mais complexos, com foco em dados desbalanceados e multi-classes.
Introdução ao versionamento de código com Git
Fundamentos do versionamento
Gerenciamento de ambientes virtuais com pyenv e IDEs
Boas práticas para desenvolvimento e versionamento
Modelos de negócio
Métricas para análise de modelos de negócio
Projeto profissional em ciência de dados
Análise descritiva e exploratória dos dados
Treinamento e ajuste de parâmetros de algoritmos de regressão
Métricas de avaliação para modelos multi-classes>
Treinamento e ajustes de algoritmos para dados desbalanceados
Publicação do modelo em produção
MÓDULO III
Este módulo é focado em soluções avançadas de computação em nuvem e gerenciamento de machine learning para transformar projetos de análise de dados em produtos de dados escaláveis. Os alunos serão capacitados a utilizar serviços de nuvem da AWS e GCP, aplicar técnicas de MLOps para gestão de algoritmos em produção e interpretar modelos de machine learning com foco em explicabilidade. O módulo culmina em um projeto integrador que possibilita a aplicação de todo o aprendizado em um problema real de negócios, envolvendo desde a análise exploratória até a publicação de modelos em ambientes de produção.
Introdução à computação em nuvem na AWS
Serviços da Cloud AWS e Sagemaker
Introdução ao conceito de MLOps
Uso do MLFlow para gestão de modelos
Desenvolvimento, experimentação e publicação de modelos<
Monitoramento de desempenho em produção
Aplicação do método SHAP para interpretabilidade de modelos
Implementação de modelos com Regressão Logística, XGBoost e Árvores Aleatórias
Métricas de desempenho (Curva ROC, Precisão e Recall)
Publicação de modelos em produção com Docker e Streamlit
Técnicas de clusterização e análise exploratória
Treinamento e ajuste de parâmetros em algoritmos de clusterização
Introdução à Cloud GCP e seus serviços para ciência de dados
Desenvolvimento de projetos de dados e transformação em produtos
Fluxo de integração e entrega contínua (CI/CD) com Github Actions
Consumo de modelos de machine learning no Looker
Corpo Docente
MEIGAROM LOPES: Coordenador, Professor e criador da maior comunidade prática de Ciências de Dados do Brasil – a Comunidade DS. Meigarom possui grande experiência profissional como Cientista de Dados em empresas como a 99Taxis, a Easynvest (adquirida pelo Nubank), a AMARO e a Loft - a maior empresa do ramo imobiliário do país. Além disso, Meigarom conta com experiência na aplicação de metodologias de aprendizagem para adultos. Meigarom possui graduação em Engenharia Elétrica pela Universidade de São Paulo - USP.
Linkedin: https://www.linkedin.com/in/meigarom/
BRUNO CÉSAR PASQUINI: Professor, Estatístico e Cientista de Dados. Possui ampla experiência de mercado em análise e modelagem de dados (seja fazendo ele mesmo, seja formando e liderando equipes para fazerem o mesmo) em empresas tais como Unibanco, Itaú Seguros, Equifax do Brasil (hoje parte da Boa Vista Serviços), Nextel Telecomunicações (hoje parte da Claro), CREFISA, Bayer, dentre outras. Atualmente, Bruno atua como Analista/Cientista de Dados para uma empresa norte-americana de tecnologia que presta serviços para seguros-saúde nos Estados Unidos, onde aplica toda sua experiência acumulada ao longo desta trajetória.
Linkedin: https://www.linkedin.com/in/brunopasquini/
MATHEUS DE OLIVEIRA ALVES: Professor na CDS e Cientista de Dados. Possui experiência de mercado em empresas como a NTT Data (Business Intelligence), ClickBus (como analista de dados) e Méliuz (como cientista de dados). Atualmente, Matheus atua como consultor de ciência de dados em uma empresa do ramo financeiro, onde aplica todo o aprendizado e expertise acumulados ao longo desses anos de experiência.
Linkedin: https://www.linkedin.com/in/matheus-de-oliveira-alves/
EDNEIDE RAMALHO: Professora na CDS, licenciada em física, mestre e doutora em biometria e estatística aplicada. Possui experiência em docência e é consultora de estatística freelancer há 7 anos. Movida a desafios e adora resolver problemas.
Linkedin: https://www.linkedin.com/in/edneide-ramalho/
CAETANO BERNAL: Professor na CDS e Cientista de Dados Sênior na empresa de consultoria Elogroup (+2000 projetos e +300 clientes). Caetano possui vasta experiência profissional atuando em diversos projetos privados e governamentais em diferentes indústrias como: E-commerce, Mídia e Telecom, hotelaria, regulatório, transporte e logística. Caetano possui graduação em Engenharia de Produção pela Pontifícia Universidade Católica do Rio de Janeiro PUC-RJ.
Linkedin: https://www.linkedin.com/in/caetano-bernal-490ab3187/
WILIAN UHLMANN: Professor e Cientista de Dados. Possui graduação em Ciências da Computação e possui MBA em Data Science pela FIAP.Wilian possui mais de 10 anos de experiência na área de tecnologia, é especialista em Data Science na cloud AWS possuindo 2 certificações na plataforma onde uma é de especialista em machine learning. Atualmente, trabalha como Cientista de Dados na Darede.
Linkedin: https://www.linkedin.com/in/wiliancesaruhlmann/
JONAS BARLETTA: Professor de matemática, Professor CDS e Cientista de Dados. Possui licenciatura e Mestrado em em Matemática pela Universidade Estadual de Campinas. Jonas possui mais de 7 anos de experiência na licenciatura e desde 2022 desenvolve projetos de Ciência de Dados. Atualmente, trabalha como Analista de Inteligência de Dados na Vitrio.
Linkedin: https://www.linkedin.com/in/jonasbarletta/
THALES HENRIQUE: Professor na CDS e Cientista de Dados Sênior. Bacharel Interdisciplinar em Ciência e Tecnologia pela Universidade Estadual do Pampa e Graduado em Sistemas da Informação pela UNESP. Thales trabalha com tecnologia desde 2016, passando por estágios e programas de bolsa até atuações com análise e modelagem de dados na iniciativa privada, nas funções de analista e cientista de Dados. Atualmente, trabalha como Cientista de Dados Sênior na Radix.
Linkedin: https://www.linkedin.com/in/thales-henrique-dias/
Público Alvo
Público alvo: Profissionais graduados em qualquer área do conhecimento que desejem aprimorar as habilidades para comunicação eficaz, visualização de dados, e a tomada de decisões fundamentadas em análises críticas e éticas dos dados. O curso ainda propõe projetos práticos que abordam problemas reais, estimulando a interdisciplinaridade e inovação no uso da ciência de dados.