Especialização "Analista de Dados" - curso 2.900 rublos. de Stepik, treinando 36 aulas, Data: 29 de outubro de 2023.
Miscelânea / / December 05, 2023
Analista de dados, analista de produtos, analista de base de clientes, analista de CRM, cientista de dados – todas essas profissões estão relacionadas à análise de dados.
🎯 Requisitos PRINCIPAIS para estas profissões:
- Conhecimento de SQL e experiência trabalhando com bancos de dados;
- Conhecimento da sintaxe básica do Python e conhecimento da biblioteca Pandas;
- Conhecimento de estatística e capacidade de aplicá-la na análise de dados;
- Pensamento analítico.
Essa não é uma lista completa. Por exemplo, os analistas da web precisam conhecer o Google Analytics e o Yandex. Métricas e para cientistas de dados - aprendizado de máquina. Mas dei os requisitos básicos que estão presentes em 70-80% das vagas.
A especialização Data Analyst consiste atualmente em dois cursos:
1️⃣ SQL para todos
Durante o curso, você dominará SQL ao nível de escrever consultas SQL complexas e praticará o uso de dados de uma empresa comercial em um dos sistemas de gerenciamento de banco de dados mais populares.
O curso é voltado para iniciantes que desejam dominar SQL, bem como para aqueles que conhecem SQL em nível básico, mas desejam preencher lacunas e consolidar seus conhecimentos na prática.
2️⃣ Python: análise de dados com Pandas
O curso é dedicado ao trabalho prático com Pandas. Você receberá a teoria necessária e a reforçará com um grande número de problemas práticos.
O curso é adequado para quem já está familiarizado com a sintaxe básica do Python:
- Conhece tipos básicos de dados (incluindo listas e dicionários) e operações sobre eles;
- Tem uma compreensão do que são uma função e um método.
O curso pode ser feito até mesmo por iniciantes que conseguem descobrir de forma independente como instalar o Python e a biblioteca Pandas. Mas, se você está apenas começando com Python, terá que aprender algumas coisas básicas por conta própria à medida que o curso avança. A propósito, você pode obter conhecimentos básicos da sintaxe Python neste curso. Então aprender Pandas será muito mais fácil.
O conceito dos cursos é baseado em três princípios:
Simplicidade
A apresentação do material é acessível e consistente - isso permitirá que você forme passo a passo a base de conhecimento necessária.
Prática
Muita atenção é dada à prática - para que você não apenas resolva os problemas do curso, mas também possa aplicar o conhecimento no futuro, em projetos reais.
Apoiar
Fique à vontade para tirar dúvidas nos comentários, é importante para mim que todo o material seja aprendido. Eu respondo aos comentários dentro de um dia.
A ordem em que os cursos são realizados não é importante.
1. SQL para todos
Operações em uma tabela
1. Introdução ao banco de dados
2. Filtrando linhas WHERE. Expressões regulares LIKE. E e OU
3. Classificando strings ORDER BY
4. Funções de agregação: COUNT, SUM, MIN, MAX, AVG. Apelido
5. Agrupamento de linhas GROUP BY e HAVING. Gerando relatórios
6. Prática com base nos resultados do 1º módulo
Operações em múltiplas tabelas
1. Conceitos de chave primária e chave estrangeira. Tipos de relacionamentos no banco de dados
2. Gerando consultas de várias tabelas. INNER JOIN e Aliases
3. LEFT JOIN e outros tipos de JOINs
4. Unindo várias tabelas usando UNION e UNION ALL
5. Subconsultas
6. Prática com base nos resultados do 2º módulo
Tópicos Importantes Adicionais
1. Expressão CASO
2. Funções populares para trabalhar com strings
Tarefas práticas para reforçar o material do curso
1. Consultas simples
2. Consultas complexas
3. Conclusão
2. Python: análise de dados com Pandas
Analisando dataframes individualmente
1. Lendo dados de arquivos
2. Introdução expressa aos dados
3. Saída da coluna
4. Tipos de dados
5. Filtrando linhas
6. Expressões regulares
7. Classificando strings
8. Funções de agregação
9. Agrupamento de linhas
Análise de vários dataframes relacionados
1. Mesclar um. k. uma junção
2. Concatenação
Módulo adicional necessário
1. Trabalhando com datas e horas
2. Tabelas dinâmicas
3. Novas maneiras de criar dataframes
4. Categorização de características nominais
5. Substituindo valores em um dataframe
6. Visualização em pandas
7. Fatiamento
8. Conclusão