Matemática e aprendizado de máquina para ciência de dados - curso RUB 50.040. da SkillFactory, treinamento de 5,5 meses, Data: 13 de agosto de 2023.
Miscelânea / / November 29, 2023
Você poderá estudar de qualquer lugar do mundo. Novos módulos serão abertos uma vez por semana. Conteúdo especialmente elaborado e materiais adicionais ajudarão você a entender o tópico.
A prática consiste em três partes: realização de exercícios simples de cálculo; realizando exercícios baseados em Python; resolver problemas da vida na área de análise, previsão e otimização de dados.
Você se comunicará constantemente com seus colegas em canais privados do Slack. Se você não entende alguma coisa ou não consegue realizar uma tarefa, nós o ajudaremos a descobrir.
Ao final do curso, você receberá uma tarefa especial na qual poderá aplicar todas as habilidades adquiridas e confirmar o sucesso no aprendizado do material.
Programa do curso de matemática
Parte 1 - Álgebra Linear
- Estudamos vetores e tipos de matrizes
- Aprendendo a realizar operações em matrizes
- Determinando a dependência linear usando matrizes
- Estudamos matrizes inversas, singulares e não singulares
- Estudamos sistemas de equações lineares, números próprios e complexos
- Dominando matriz e decomposição singular
- Resolvendo problemas de dependência linear usando matrizes
- Otimizando usando o método do componente principal
- Reforçando os fundamentos matemáticos da regressão linear
Parte 2 - Noções básicas de análise matemática
- Estudamos funções de uma e muitas variáveis e derivadas
- Dominando o conceito de gradiente e descida gradiente
- Treinamento em problemas de otimização
- Estudamos o método do multiplicador de Lagrange, o método de Newton e o recozimento simulado
- Resolvemos problemas de previsão e busca de uma estratégia vencedora usando métodos derivativos e de otimização numérica
- Reforçando a matemática por trás da descida gradiente e do recozimento simulado
Parte 3 - Fundamentos de probabilidade e estatística
- Estudamos os conceitos gerais de estatística descritiva e matemática
- Dominando combinatória
- Estudamos os principais tipos de distribuições e correlações
- Compreendendo o Teorema de Bayes
- Aprendendo um classificador Naive Bayes
- Resolvemos problemas de combinatória, validade e previsão usando estatística e teoria de probabilidade
- Consolidamos os fundamentos matemáticos da classificação e regressão logística
Parte 4 - Séries temporais e outros métodos matemáticos
- Apresentando a análise de série temporal
- Dominando tipos mais complexos de regressões
- Previsão do orçamento usando séries temporais
- Reforçando os fundamentos matemáticos dos modelos clássicos de aprendizado de máquina
Breve programa do curso sobre aprendizado de máquina
Assistência do tutor durante o treinamento
Módulo 1 - Introdução ao aprendizado de máquina
Conhecemos as principais tarefas e métodos de aprendizado de máquina, estudamos casos práticos e aplicamos o algoritmo básico para trabalhar em um projeto de ML
Resolvemos mais de 50 problemas para reforçar o tema
Módulo 2 - Métodos de pré-processamento de dados
Estudamos tipos de dados, aprendemos a limpar e enriquecer dados, usamos visualização para pré-processamento e dominamos a engenharia de recursos
Resolvemos mais de 60 problemas para reforçar o tema
Módulo 3 - Regressão
Dominamos a regressão linear e logística, estudamos os limites de aplicabilidade, inferência analítica e regularização. Modelos de regressão de treinamento
Resolvemos mais de 40 problemas para reforçar o tema
Módulo 4 - Clustering
Dominamos a aprendizagem sem professor, praticamos seus diversos métodos, trabalhamos com textos usando ML
Resolvemos mais de 50 problemas para reforçar o tema
Módulo 5 - Algoritmos baseados em árvores: introdução às árvores
Vamos nos familiarizar com as árvores de decisão e suas propriedades, dominar as árvores da biblioteca sklearn e usar árvores para resolver um problema de regressão
Resolvemos mais de 40 problemas para reforçar o tema
Módulo 6 - Algoritmos baseados em árvore: conjuntos
Estudamos as características dos conjuntos de árvores, praticamos o boosting, usamos o conjunto para construir regressão logística
Resolvemos mais de 40 problemas para reforçar o tema
Estamos participando de uma competição no kaggle para treinar um modelo baseado em árvore
Módulo 7 - Avaliando a Qualidade dos Algoritmos
Estudamos os princípios de divisão de amostras, sub e overfitting, avaliamos modelos usando várias métricas de qualidade, aprendemos a visualizar o processo de aprendizagem
Avaliando a qualidade de vários modelos de ML
Resolvemos mais de 40 problemas para reforçar o tema
Módulo 8 - Séries Temporais em Aprendizado de Máquina
Vamos nos familiarizar com a análise de séries temporais em ML, dominar modelos lineares e XGBoost, estudar os princípios de validação cruzada e seleção de parâmetros
Resolvemos mais de 50 problemas para reforçar o tema
Módulo 9 - Sistemas de recomendação
Estudamos métodos para construção de sistemas de recomendação, dominamos o algoritmo SVD, avaliamos a qualidade das recomendações do modelo treinado
Resolvemos mais de 50 problemas para reforçar o tema
Módulo 10 - Hackathon Final
Aplicamos todos os métodos estudados para obter a máxima precisão das previsões do modelo no Kaggle