Estatística e Análise de Dados com R
Objetivos do curso são dar ferramentas necessárias para que o público-alvo consiga, com recurso ao software R,: proceder à importação/exportação de informação presente em diversas plataformas, proceder à realização de análise estatística (uni e multivariada), realizar inferência estatística com recurso a testes de hipóteses paramétricos e não paramétricos, realizar modelação estatística e explorar a componente gráfica do R quer na vertente descritiva quer como suporte à metodologia estatística implementada.
Sendo o R um software originalmente concebido com linhas de comandos, serão explorados plug-ins que traduzem as escolhas efetuadas em diferentes menus para a linguagem de scripts. Será dada particular atenção às condições de aplicabilidade das várias metodologias estatísticas propostas, sendo veiculados os aspetos quantitativos/matemáticos essenciais, assim como uma rigorosa e detalhada interpretação dos outputs. Todos os conteúdos ministrados serão acompanhados por conjuntos de dados fornecidos durante a formação bem como de material pedagógico desenvolvido e concebido para o efeito.
A quem se destina: Estudantes de mestrado e doutoramento, investigadores, docentes que necessitam de realizar análises estatísticas que visam suportar a sua tomada de decisão.
Objetivos concretos: Pretende-se que os formandos se tornem progressivamente autónomos na realização de análise de dados com o software R.
Duração: 18 horas
Formador: Ricardo São João (GADES Solutions)
É licenciado em Matemáticas Aplicadas, ramo Estatística e Investigação Operacional e Mestre em Matemática Aplicada às Ciências Biológicas. O interesse pela área da saúde levou-o a concluir a sua pós-graduação em Epidemiologia e o seu PhD em Ciências da Vida na especialidade de Bioestatística. Ricardo São João tem-se dedicado à modelação estatística com um elevado background computacional. É professor no Ensino Superior desde 2001, ministra cursos graduados, pós-graduados e de curta duração com especial ênfase na manipulação de software estatístico (SPSS e R). É membro do CEAUL com interesses de investigação em: Estatística Multivariada e Espacial, Bioestatística e Epidemiologia. Colabora com a GADES Solutions. No âmbito dessa parceria lecionou diversos cursos de Estatística com R e SPSS, tendo também colaborado em diversos projetos de consultoria.
Programa:
1. Introdução ao R:
- Descrição do ambiente R e primeiros passos;
- Conceitos básicos para manipulação da informação;
- Importação/exportação da informação;
- Armazenamento (tipo de dados e variáveis) e plug-ins do R.
2. Determinação no software R das principais medidas de localização de tendência central e não central, medidas de dispersão absolutas e adimensionais. Para as referidas medidas serão abordados dados simples e agrupados.
3. Testes de hipóteses: Paramétricos e Não Paramétricos
- Formulação de hipóteses, Tipologia de Erros, Regra de Decisão;
- Testes de Ajustamento (Kolmogorov Smirnov e Shapiro Wilk);
- Uma Amostra: teste ao valor médio; teste à proporção e teste à variância;
- Duas Amostras Independentes: Teste t-student; Teste de Mann-Whitney; Teste de Welch;
- Duas Amostras Emparelhadas: Teste t-pares; Teste dos Sinais, Teste de Wilcoxon;
- Mais de duas Amostras: Anova e Kruskal Wallis.
4. Análise Bivariada.
- Tabelas de Contingência
- Testes de associação para variáveis em escala nominal e ordinal (Qui-Quadrado, Teste Exato de
Fisher) dispostas em tabelas de contingência;
- Medidas de associação (Phi, V de Cramer, Coeficiente de Contingência de Pearson; Tschuprow)
para tabelas de contingência;
- Testes de correlação para variáveis em escala ordinal e de intervalo (Pearson e Spearman)
- Medidas de correlação (paramétrica- coeficiente de Correlação de Pearson e não paramétrica-
Coeficiente de Correlação de Spearman)
5. Análise de regressão linear
- Análise de Regressão Linear Simples
- Análise de Regressão Linear Múltipla
6. Construção de gráficos no software R (por exemplo: gráfico caixa-de-bigodes, caule e folhas, histograma, barras, circular, dispersão, mosaico, linhas)
7. Análise de Clusters – Introdução e contextualização
- Medidas de Similaridade (distância, correlação e associação)
- Métodos hierárquicos, não hierárquicos e mistos
- Critérios de (des)agregação
- Determinação do número de clusters
- Validação de clusters
Serão utilizadas bases de dados com exemplos diversificados implementados no software R para ilustrar cada um dos modelos em análise.
Os formandos serão “desafiados” tendo como base “Estudo de Casos” para darem resposta a diferentes problemas com recurso à metodologia ministrada.
Certificação: No final do workshop será entregue um certificado GADES Solutions e DGERT aos participantes.
Preço: 150 euros
Data e horário: 5, 6, 12, 13, 19 e 20 de abril de 2022, das 18h às 21h
Formato: O workshop irá decorrer em formato ONLINE.
Inscrição: Os candidatos deverão candidatar-se até ao dia 29 de março de 2022, através do preenchimento do Formulário de Inscrição.
*Número limitado de inscrições.
Mais informações: mare@ipleiria.pt e aqui
Inscrições aqui