Cientista de Dados do zero ao PRO - curso RUB 233.640. da SkillFactory, treinamento 24 meses, data 15 de agosto de 2023.
Miscelânea / / November 29, 2023
Após o curso básico, você poderá escolher uma especialização mais restrita em Ciência de Dados - Engenheiro de ML, Engenheiro de CV ou Engenheiro de PNL
Engenheiro ML — Desenvolvedor de aprendizado de máquina
Desenvolva um modelo de previsão de classificação de crédito
Resolva o problema de classificação de mensagens SMS de spam
Desenvolva um sistema para recomendar produtos adequados no momento da compra
Construa um modelo para aumentar as vendas no varejo
Crie imagens com base na descrição do texto usando a rede neural DALL-E
Engenheiro de CV — Especialista em visão computacional
Aprenda a resolver todos os problemas básicos da área de Visão Computacional
Você adquirirá conhecimento do fluxo real de trabalho com modelos de CV, abordagens atuais e ferramentas avançadas necessárias para a criação de serviços de CV
No projeto final, crie um treinador virtual capaz de avaliar a correção dos exercícios em vídeo
Engenheiro de PNL — Especialista em processamento de linguagem natural
Conheça o processamento de linguagem natural
Compreenda as tarefas da PNL - classificação, resumo e geração de texto, criação de sistemas para tradução automática e sistemas de resposta a perguntas
No projeto final, você desenvolverá de forma independente ferramentas para busca automatizada de contextos sobre determinados temas.
BASE
Nesta fase, você aprenderá o básico da programação em Python, aprenderá como pré-processar e analisar dados e também se familiarizará com as principais tarefas de um cientista de dados.
Introdução - 1 semana
Você será capaz de formular metas reais de aprendizagem para si mesmo, descobrir qual é o valor do DS para os negócios, conhecer as principais tarefas de um cientista de dados e entender como funciona o desenvolvimento de qualquer Projeto DS.
INTRODUÇÃO-1. Como estudar de forma eficaz - integração no treinamento
INTRODUÇÃO-2. Visão geral da profissão. Tipos de problemas em Ciência de Dados. Etapas e abordagens para desenvolver um projeto de Ciência de Dados
Design de desenvolvimento - 5 semanas
Você aprenderá a trabalhar com tipos de dados básicos usando Python e será capaz de usar construções de loop, instruções condicionais e funções em seu trabalho diário.
PITÃO-1. Noções básicas de Python
PITÃO-2. Mergulhando nos tipos de dados
PITÃO-3. Declarações condicionais
PITÃO-4. Ciclos
PITÃO-5. Funções e programação funcional
PITÃO-6. Prática
PITÃO-7. Guia de estilo Python (bônus)
Matemática Básica - 7 semanas
MATEMÁTICA-1. Números e Expressões
MATEMÁTICA-2. Equações e desigualdades
MATEMÁTICA-3. Conceitos básicos da teoria das funções
MATEMÁTICA-4. Noções básicas de geometria: planimetria, trigonometria e estereometria
MATEMÁTICA-5. Conjuntos, lógica e elementos de estatística
MATEMÁTICA-6. Combinatória e fundamentos da teoria das probabilidades
MATEMÁTICA-7. Solução de problemas
Trabalhando com dados – 8 semanas
Nesta fase, você dominará habilidades básicas de dados: como preparar, limpar e transformar dados para que sejam adequados para análise. Falando em análise: você analisará dados usando as bibliotecas populares Matplotlib, Seaborn, Plotly.
PITÃO-8. Ferramentas de ciência de dados
PITÃO-9. Biblioteca NumPy
PITÃO-10. Introdução aos pandas
PITÃO-11. Técnicas básicas para trabalhar com dados no Pandas
PITÃO-12. Técnicas avançadas de dados em Pandas
PITÃO-13. Limpeza de dados
PITÃO-14. Visualização de dados
PITÃO-15. Princípios de POO em Python e código de depuração (módulo opcional)
Projeto 1. Análise de conjunto de dados sobre problemas encerrados
Carregamento de dados – 6 semanas
Você poderá baixar dados de diferentes formatos e fontes. E o SQL, uma linguagem de consulta estruturada, vai te ajudar nisso. Você aprenderá a usar funções agregadas, junções de tabelas e junções complexas.
PITÃO-16. Como baixar dados de arquivos de diferentes formatos
PITÃO-17. Recuperando dados de fontes da web e APIs
SQL-0. Olá SQL!
SQL-1. Noções básicas de SQL
SQL-2. Funções agregadas
SQL-3. Unindo tabelas
SQL-4. Junções complexas
Projeto 2. Carregando novos dados. Refinando a análise
Análise de dados estatísticos - 7 semanas
Análise de Dados de Inteligência (EDA) é o seu foco. Você se familiarizará com todas as etapas dessa análise e aprenderá como conduzi-la usando as bibliotecas Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Além disso, você poderá trabalhar no Kaggle, popular serviço de participação em competições.
EDA-1. Introdução à análise de dados de inteligência. Algoritmos e Métodos EDA
EDA-2. Estatística matemática no contexto da EDA. Tipos de recursos
EDA-3. Engenharia de recursos
EDA-4. Análise estatística de dados em Python
EDA-5. Análise estatística de dados em Python. Parte 2
EDA-6. Projeto de experimentos
EDA-7. Plataforma Kaggle
Projeto 2
Introdução ao aprendizado de máquina - 9 semanas
Você se familiarizará com bibliotecas de ML para modelar dependências de dados. Você poderá treinar os principais tipos de modelos de ML, realizar validações, interpretar os resultados do trabalho e selecionar recursos importantes (importância do recurso).
ML-1. Teoria do aprendizado de máquina
ML-2. Aprendizagem Supervisionada: Regressão
ML-3. Aprendizagem Supervisionada: Classificação
ML-4. Aprendizagem não supervisionada: técnicas de agrupamento e redução de dimensionalidade
ML-5. Validação de dados e avaliação de modelo
ML-6. Seleção e seleção de características
ML-7. Otimizando hiperparâmetros do modelo
ML-8. Livro de receitas de ML
Projeto 3. Problema de classificação
UNIDADE PRINCIPAL
Álgebra linear, análise matemática, matemática discreta – parece assustador, mas não se assuste: vamos analisar todos esses assuntos e te ensinar como trabalhar com eles! Na segunda etapa, você mergulhará na matemática e nos fundamentos do aprendizado de máquina, aprenderá mais sobre as profissões de DS e, por meio de orientação profissional, selecionará um curso de segundo ano.
Matemática e aprendizado de máquina. Parte 1 - 6 semanas
Você poderá resolver problemas práticos utilizando cálculo manual e Python (cálculos vetoriais e matriciais, trabalho com conjuntos, estudo de funções por meio de análise diferencial).
MATEMÁTICA E ML-1. Álgebra linear no contexto dos métodos lineares. Parte 1
MATEMÁTICA E ML-2. Álgebra linear no contexto dos métodos lineares. Parte 2
MATEMÁTICA E ML-3. Análise matemática no contexto de um problema de otimização Parte 1
MATEMÁTICA E ML-4. Análise matemática no contexto de um problema de otimização. Parte 2
MATEMÁTICA E ML-5. Análise matemática no contexto de um problema de otimização. Parte 3
Projeto 4. Problema de regressão
Matemática e aprendizado de máquina. Parte 2 - 6 semanas
Você se familiarizará com os conceitos básicos da teoria das probabilidades e estatística matemática, algoritmos clustering, e também aprender a avaliar a qualidade do clustering realizado e apresentar os resultados em forma gráfica.
MATEMÁTICA E ML-6. Teoria da probabilidade no contexto de um classificador Naive Bayes
MATEMÁTICA E ML-7. Algoritmos baseados em árvores de decisão
MATEMÁTICA E ML-8. Impulsionando e empilhando
MATEMÁTICA E ML-9. Técnicas de agrupamento e redução de dimensionalidade. Parte 1
MATEMÁTICA E ML-10. Técnicas de agrupamento e redução de dimensionalidade. Parte 2
Projeto 5. Métodos de conjunto
Matemática Discreta - 4 semanas
MATH&MGU-1 Conjuntos e combinatória
Lógica MATEMÁTICA e MGU-2
Gráficos MATH&MGU-3. Parte 1
Gráficos MATH&MGU-4. Parte 2
ML nos negócios - 8 semanas
Você aprenderá a usar bibliotecas de ML para resolver problemas de séries temporais e sistemas de recomendação. Você poderá treinar um modelo de ML e validá-lo, bem como criar um protótipo funcional e executar o modelo na interface web. E também adquira habilidades de teste A/B para poder avaliar o modelo.
MATEMÁTICA E ML-11. Série temporal. Parte 1
MATEMÁTICA E ML-12. Série temporal. Parte 2
MATEMÁTICA E ML-13. Sistemas de recomendação. Parte 1
MATEMÁTICA E ML-14. Sistemas de recomendação. Parte 2
PROD-1. Preparando o modelo para produção
PROD-2. ProtótipoStreamlit + Heroku
PROD-3. Entendimento empresarial. Caso
Projeto 6. Tópico para escolher: séries temporais ou sistemas de recomendação
NÍVEL PRO
Na terceira etapa, você se familiarizará com um dos métodos de aprendizado de máquina - aprendizado profundo (DL). E também um bloco completo da especialização escolhida espera por você: você pode dominar as habilidades de aprendizado de máquina (ML), conheça a rotina de CV (visão computacional) ou aprimore em PNL*, processamento natural linguagem.
Segundo ano de estudo - 3 especializações para escolher
Orientação profissional
ML, CV ou PNL: nesta fase você finalmente terá que escolher qual caminho seguir. Falaremos sobre cada especialização e lhe ofereceremos a solução de diversos problemas práticos para facilitar sua decisão.
Rastrear ML - engenheiro
No curso de ML, você aprenderá a resolver problemas profundos de aprendizado de máquina, dominar as competências de um engenheiro de dados e aprimorar suas habilidades no trabalho com bibliotecas Python. Você também aprenderá como criar um MVP (versão mínima viável de um produto), aprenderá todas as complexidades de enviar um modelo de ML para produção e aprenderá como os engenheiros de ML trabalham na vida real.
Introdução ao aprendizado profundo
Noções básicas de engenharia de dados
Capítulos adicionais de Python e ML
Avaliação econômica dos efeitos e desenvolvimento do MVP
ML para produção
Estudo aprofundado do desenvolvimento de ML e projeto de graduação sobre um tema escolhido
Acompanhar CV - engenheiro
Na trilha CV você aprenderá a resolver problemas de visão computacional, como classificação de imagens, segmentação e detecção, geração e estilização de imagens, restauração e melhoria de qualidade fotografias. Além disso, você aprenderá como implementar redes neurais em produção.
Introdução ao aprendizado profundo
Noções básicas de engenharia de dados
Capítulos adicionais de Python e ML
Avaliação econômica dos efeitos e desenvolvimento do MVP
ML para produção
Estudo aprofundado do desenvolvimento de ML e projeto de graduação sobre um tema escolhido
Acompanhar PNL - engenheiro
Durante o treinamento na trilha de PNL, você aprenderá como resolver os principais problemas de processamento de linguagem natural, em incluindo classificação, resumo e geração de texto, tradução automática e criação de diálogo sistemas
Introdução ao aprendizado profundo
Matemática de redes neurais para PNL
Hard & Software para resolver problemas de PNL
Tarefas e algoritmos de PNL
Redes Neurais em Produção
Estudo aprofundado do desenvolvimento de PNL e projeto de graduação sobre um tema escolhido
Se você escolher a especialização CV ou ML, poderá fazer o curso de PNL sem suporte de mentor gratuitamente.
Aprendizado profundo e redes neurais
Onde as redes neurais são usadas? Como treinar uma rede neural? O que é aprendizagem profunda? Você encontrará as respostas a essas perguntas na seção de bônus do DL.
Introdução à Engenharia de Dados
Você aprenderá a diferença entre as funções de um cientista de dados e de um engenheiro de dados, quais ferramentas este último utiliza em seu trabalho e quais tarefas ele resolve no dia a dia. As palavras “floco de neve”, “estrela” e “lago” ganharão novos significados :)