Curso “Especialista em Ciência de Dados” - curso 112.000 rublos. do Yandex Workshop, treinamento 8 meses, data 30 de novembro de 2023.
Miscelânea / / November 28, 2023
O que os cientistas de dados fazem?
Analise grandes quantidades de dados, desenvolva modelos e aplique aprendizado de máquina para fazer previsões e identificar padrões. Eles são necessários em diversas áreas onde há necessidade de armazenar e processar dados.
Nos bancos
Analise dados sobre clientes e determine quais indicadores afetam sua capacidade de crédito, preveja a probabilidade de o cliente deixar o banco
Na industria
Usando aprendizado de máquina, eles prevêem quando o equipamento irá falhar e em qual depósito a mineração trará maior lucro.
Em marketing e comércio
Eles ajudam a encontrar pontos de crescimento analisando a sazonalidade, os dias de pico de vendas e criando um sistema de recomendação
No setor de transportes
Otimize o funcionamento dos semáforos, avalie a carga nas estradas e ajude a ajustar os planos de reparação
Programa completo do curso em Ciência de Dados
Nós o atualizamos regularmente para garantir que atenda às necessidades da indústria e dos empregadores. Ou seja, você aprende apenas o que com certeza será útil no seu trabalho.
Noções básicas de Python e análise de dados: curso introdutório gratuito:
Aprenda os conceitos básicos de análise de dados e entenda o que os analistas e cientistas de dados fazem. Resolva cinco casos de trabalho com dados de diferentes áreas:
- descobrir o motivo do colapso massivo dos gadgets,
- verificar o retorno da publicidade em aplicativos móveis,
- encontrar a melhor localização para uma nova loja,
- ajudá-lo a escolher uma estratégia de desenvolvimento para uma startup de IA,
- avaliar a eficácia dos robôs no serviço de suporte.
Ao resolver casos, você aprenderá o básico do Python e da biblioteca pandas, aprenderá como construir alguns gráficos e interpretá-los corretamente.
Introdução à profissão “Especialista em Ciência de Dados”
O que é um especialista em ciência de dados?
Como ensinamos.
Python básico:
Aprofunde-se na linguagem de programação Python e na biblioteca pandas.
+1 projeto no portfólio
Compare os dados do usuário Yandex. Música por cidade e dia da semana.
Pré-processamento de dados:
Aprenda a limpar dados de valores discrepantes, omissões e duplicatas, bem como converter diferentes formatos de dados.
+1 projeto no portfólio
Analise dados sobre clientes bancários e determine a parcela de clientes com capacidade de crédito.
Análise exploratória de dados:
Aprenda o básico de probabilidade e estatística. Use-os para explorar as propriedades básicas dos dados, procurando padrões, distribuições e anomalias. Conheça as bibliotecas scipy e matplotlib. Desenhe diagramas e pratique a análise de gráficos.
+1 projeto no portfólio
Explore o arquivo de anúncios de venda de imóveis em São Petersburgo e na região de Leningrado.
Teoria da probabilidade. Curso adicional
Lembre-se ou reconheça os termos básicos da teoria das probabilidades: eventos independentes, opostos, incompatíveis, etc. Usando exemplos simples e problemas divertidos, você praticará o trabalho com números e a construção da lógica das soluções.
Este é um sprint opcional. Isso significa que cada aluno escolhe uma das opções:
- Faça um curso adicional de dez lições curtas, aprimore a teoria e resolva problemas.
- Abra apenas o bloco com tarefas de entrevista, lembre-se da prática sem teoria.
- Pule o curso completamente ou retorne quando houver tempo e necessidade.
Projeto final do primeiro módulo
Aprenda como conduzir pesquisas preliminares de dados e formular e testar hipóteses.
+1 projeto no portfólio
Encontre padrões que determinem o sucesso do jogo.
Introdução ao aprendizado de máquina:
Domine os conceitos básicos de aprendizado de máquina. Conheça a biblioteca Scikit-Learn e utilize-a para criar seu primeiro projeto de machine learning.
+1 projeto no portfólio
Desenvolver um sistema de recomendação tarifária para uma operadora móvel.
Treinamento tutorado:
Mergulhe mais fundo na área mais importante do aprendizado de máquina: o aprendizado supervisionado. Aprenda como lidar com dados desequilibrados.
+1 projeto no portfólio
Preveja a probabilidade de um cliente deixar o banco.
Aprendizado de máquina nos negócios:
Aprenda como o aprendizado de máquina (abr. MO) ajuda a empresa sobre como coletar dados e como as métricas do produto se relacionam com as métricas do MO. Aprenda a lançar novas funcionalidades de serviço usando ML. Aprenda o que são métricas de negócios, KPIs e testes A/B.
+1 projeto no portfólio
Treine um modelo que ajude a identificar um novo local para produção de petróleo com o menor risco de perda.
Projeto final do segundo módulo:
Prepare dados para aprendizado de máquina. Usando o modelo, avalie sua qualidade.
+1 projeto no portfólio
Simule o processo de fundição do minério de ouro para melhorar o funcionamento do empreendimento.
Álgebra Linear:
Dê uma olhada em alguns dos algoritmos que você aprendeu até agora e entenda melhor como usá-los. Na prática, domine do zero os principais conceitos da álgebra linear: espaços lineares, operadores lineares, espaços euclidianos.
+1 projeto no portfólio
Use o método de conversão de dados para proteger as informações pessoais dos clientes das seguradoras.
Métodos numéricos:
Você analisará vários algoritmos e os adaptará para resolver problemas práticos usando métodos numéricos. Domine cálculos aproximados, estimativas de complexidade de algoritmos e gradiente descendente. Aprenda como as redes neurais são treinadas e o que é o aumento de gradiente.
+1 projeto no portfólio
Desenvolva um modelo para determinar o custo de um carro usado.
Série temporal:
As séries temporais descrevem como os parâmetros, como o consumo de eletricidade ou o número de ordens de táxi, mudam ao longo do tempo. Você aprenderá a analisar séries, procurar tendências e identificar sazonalidades. Aprenda como criar dados tabulares e um problema de regressão de série temporal.
+1 projeto no portfólio
Crie um modelo e preveja os picos de carga de táxi.
Aprendizado de máquina para textos:
Aprenda a criar vetores numéricos a partir de textos e a resolver problemas de classificação e regressão para eles. Aprenda como os recursos do TF-IDF são calculados e familiarize-se com as representações da linguagem word2vec e BERT.
+1 projeto no portfólio
Acelere a moderação de comentários em sua comunidade automatizando avaliações de toxicidade.
SQL básico:
Aprenda os conceitos básicos da linguagem de consulta SQL e da álgebra relacional para trabalhar com bancos de dados. Familiarize-se com os recursos de trabalho no PostgreSQL, um popular sistema de gerenciamento de banco de dados (abr. SGBD). Aprenda a escrever consultas de vários níveis de complexidade e a traduzir problemas de negócios em SQL.
Você trabalhará com um banco de dados de uma loja online especializada em filmes e música.
+1 projeto no portfólio
Escreva uma série de consultas de complexidade variada em um banco de dados que armazena dados sobre investidores de risco, startups e investimentos neles.
Visão computacional:
Aprenda a resolver problemas simples de visão computacional usando redes neurais prontas e a biblioteca Keras. Conheça o aprendizado profundo.
+1 projeto no portfólio
Construa um modelo para determinar a idade aproximada de uma pessoa a partir de uma fotografia.
Aprendizagem não supervisionada:
O aprendizado não supervisionado é um dos métodos de aprendizado de máquina em que o sistema resolve um problema sem dados pré-rotulados com base em seus recursos e estrutura. Saiba mais sobre problemas de clustering e detecção de anomalias.
Projeto de graduação:
No último projeto, confirme que você domina uma nova profissão. Esclareça a tarefa do cliente e passe por todas as etapas de análise de dados e aprendizado de máquina. Agora não há aulas ou trabalhos de casa - tudo é como um trabalho de verdade.
+1 projeto no portfólio
Projeto à sua escolha:
- Construir um modelo que preveja a rotatividade de clientes de uma empresa de telecomunicações.
- Construir um modelo que preveja os parâmetros do processo tecnológico numa planta metalúrgica.
D
daryamanannikova
01.10.2020 G.
Exemplo de cursos online ideais
Em Yandex. Durante o workshop, estou estudando a profissão de DataScience, uma direção bastante em voga atualmente e, como descobri, é bastante difícil, como dizem, difícil de aprender - fácil de combater. (adsbygoogle = window.adsbygoogle || []).push({}); Foram muitas as dificuldades no meu caminho, não tive tempo (estava tirando o diploma e trabalhando), a força para entender as estatísticas me abandonava periodicamente, o coronavírus trancou todos nós em casa...
S
sergen355
14.07.2021 G.
Ótimo projeto educacional
Vantagens: simulador próprio, análises de projetos, consultas, comunidade no Slack, ajuda em todos os assuntos. Desvantagens: o único aspecto negativo é que em alguns tópicos não há material completo no simulador, é necessário mais tempo para buscar informações de forma independente. Estudei na Faculdade de Ciência de Dados. Bom formato de treinamento. Alguns entram, outros não. Mas para mim isso é o máximo...