Modelos lineares generalizados - curso 3600 rublos. de Educação aberta, treinamento de 3 semanas, cerca de 6 horas por semana, Data 29 de novembro de 2023.
Miscelânea / / December 01, 2023
Uma das condições para a aplicabilidade dos modelos lineares convencionais é a independência das observações entre si, com base na qual o modelo é selecionado. No entanto, na prática, muitas vezes há situações em que o desenho da coleta de materiais é tal que a violação desta condição é inevitável. Imagine que você decidiu construir um modelo que descreve a relação entre o desempenho em educação física e as pontuações nos testes de QI entre os alunos. Para resolver esse problema, você fez inúmeras amostras em diversas instituições. É possível combinar esses dados em uma análise construída de acordo com o esquema tradicional? Claro que não. Os alunos de cada universidade podem ser semelhantes entre si em alguns aspectos. Mesmo a natureza da relação entre as quantidades em estudo pode ser um pouco diferente. Este tipo de dados, em que existem correlações intragrupos, devem ser analisados através de modelos lineares mistos. Mostraremos que alguns preditores devem ser incluídos no modelo como os chamados “fatores aleatórios”. Você aprenderá que fatores aleatórios podem ser subordinados hierarquicamente. Discutiremos como tais modelos mistos podem ser construídos para variáveis dependentes que seguem diferentes tipos de distribuições. Além disso, mostraremos que a parte aleatória do modelo pode ser ainda mais complexa – pode ter um componente que modele o comportamento da variância em resposta à influência de uma covariável. Ao final do curso, você encontrará um projeto no qual poderá praticar a construção de modelos mistos escolhendo um dos vários conjuntos de dados. Com base na análise desses dados, é possível criar um relatório na tradição da pesquisa reproduzível.
Professor Associado, Departamento de Zoologia de Invertebrados, Faculdade de Biologia, Universidade Estadual de São Petersburgo, Ph.D.
Interesses científicos: estrutura e dinâmica das comunidades bentônicas marinhas, escalas espaciais, sucessão, interespecífica e intraespecífica interações bióticas, crescimento e reprodução de invertebrados marinhos, estrutura demográfica das populações, microevolução, bioestatística.
O curso consiste em 4 módulos:
1) Introdução aos modelos lineares generalizados
Modelos lineares generalizados (GLMs) permitem modelar o comportamento de quantidades que não seguem uma distribuição normal. Para facilitar seus primeiros passos no mundo do GLM, analisaremos sua estrutura usando o exemplo do GLM para quantidades normalmente distribuídas - desta forma você pode traçar paralelos com modelos lineares simples. Você aprenderá o que é uma função de link, como funciona a máxima verossimilhança e como testar hipóteses GLM usando testes de Wald e testes de razão de verossimilhança.
2) Problema de seleção de modelo
Neste módulo falaremos sobre questões metodológicas associadas à construção de modelos. Um modelo é uma representação simplificada da realidade, e escolher entre diferentes métodos concorrentes de tal simplificação é uma tarefa frequente do analista. Neste módulo, você aprenderá a comparar modelos usando critérios de informação. Discutiremos as principais opções de análise na escolha dos modelos e falaremos sobre as dificuldades que surgem em relação à multiplicidade oculta de modelos. Por fim, ensinaremos você a reconhecer os principais tipos de abusos na seleção de modelos (pesca de dados, p-hacking).
3) Modelos lineares generalizados para contagem de dados
Neste módulo discutiremos métodos básicos para modelar quantidades contáveis. Primeiro, discutiremos por que os modelos lineares convencionais não são adequados para contagem de dados. As propriedades das distribuições contáveis ajudarão você a compreender as diferenças entre os tipos de GLM para dados contáveis e os recursos de seus diagnósticos. Você verá a função de link em funcionamento ao visualizar as previsões do GLM na escala da função de link e na escala da variável de resposta.
4) Modelos lineares generalizados com resposta binária
Às vezes há necessidade de simular se algum evento ocorreu ou não, se o time de futebol ou perdido, se o paciente se recuperou ou não após o tratamento, se o cliente cometeu comprar ou não. Os modelos lineares convencionais não são adequados para modelar tais dados binários (eventos com dois resultados), mas isso pode ser feito facilmente usando modelos lineares generalizados. Neste módulo, você aprenderá a modelar as probabilidades de ocorrência de eventos, representando-as como probabilidades. Veremos como funciona a função de ligação logit e como os coeficientes GLM são interpretados quando ela é usada. Finalmente, você poderá praticar a análise de modelos lineares generalizados com diferentes distribuições concluindo um projeto de análise de dados. Os resultados desta análise deverão ser apresentados como um relatório em formato html, escrito usando rmarkdown/knitr.
• Aprenda quais habilidades são necessárias para começar em análise e ciência de dados • Aprenda a usar Excel, SQL, Power BI e Google Data Studio para trabalhar dados e escreva seu primeiro código em Python• Obtenha um guia passo a passo e aprenda como entrar no campo da ciência de dados e escolher uma função em Ciência de Dados
4,4
1 490 ₽