Estatísticas e Análise de Dados com R

Estatística e Análise de Dados com R

 

Objetivos do curso são dar ferramentas necessárias para que o público-alvo consiga, com recurso ao software R,: proceder à importação/exportação de informação presente em diversas plataformas, proceder à realização de análise estatística (uni e multivariada), realizar inferência estatística com recurso a testes de hipóteses paramétricos e não paramétricos, realizar modelação estatística e explorar a componente gráfica do R quer na vertente descritiva quer como suporte à metodologia estatística implementada.

Sendo o R um software originalmente concebido com linhas de comandos, serão explorados plug-ins que traduzem as escolhas efetuadas em diferentes menus para a linguagem de scripts. Será dada particular atenção às condições de aplicabilidade das várias metodologias estatísticas propostas, sendo veiculados os aspetos quantitativos/matemáticos essenciais, assim como uma rigorosa e detalhada interpretação dos outputs. Todos os conteúdos ministrados serão acompanhados por conjuntos de dados fornecidos durante a formação bem como de material pedagógico desenvolvido e concebido para o efeito.

 

A quem se destina: Estudantes de mestrado e doutoramento, investigadores, docentes que necessitam de realizar análises estatísticas que visam suportar a sua tomada de decisão. Workshop Dados R

 

Objetivos concretos: Pretende-se que os formandos se tornem progressivamente autónomos na realização de análise de dados com o software R.

 

Duração: 18 horas

 

Formador: Ricardo São João (GADES Solutions)

É licenciado em Matemáticas Aplicadas, ramo Estatística e Investigação Operacional e Mestre em Matemática Aplicada às Ciências Biológicas. O interesse pela área da saúde levou-o a concluir a sua pós-graduação em Epidemiologia e o seu PhD em Ciências da Vida na especialidade de Bioestatística. Ricardo São João tem-se dedicado à modelação estatística com um elevado background computacional. É professor no Ensino Superior desde 2001, ministra cursos graduados, pós-graduados e de curta duração com especial ênfase na manipulação de software estatístico (SPSS e R). É membro do CEAUL com interesses de investigação em: Estatística Multivariada e Espacial, Bioestatística e Epidemiologia. Colabora com a GADES Solutions. No âmbito dessa parceria lecionou diversos cursos de Estatística com R e SPSS, tendo também colaborado em diversos projetos de consultoria.

 

Programa:

1. Introdução ao R:
- Descrição do ambiente R e primeiros passos;
- Conceitos básicos para manipulação da informação;
- Importação/exportação da informação;
- Armazenamento (tipo de dados e variáveis) e plug-ins do R.

2. Determinação no software R das principais medidas de localização de tendência central e não central, medidas de dispersão absolutas e adimensionais. Para as referidas medidas serão abordados dados simples e agrupados.

3. Testes de hipóteses: Paramétricos e Não Paramétricos
- Formulação de hipóteses, Tipologia de Erros, Regra de Decisão;
- Testes de Ajustamento (Kolmogorov Smirnov e Shapiro Wilk);
- Uma Amostra: teste ao valor médio; teste à proporção e teste à variância;
- Duas Amostras Independentes: Teste t-student; Teste de Mann-Whitney; Teste de Welch;
- Duas Amostras Emparelhadas: Teste t-pares; Teste dos Sinais, Teste de Wilcoxon;
- Mais de duas Amostras: Anova e Kruskal Wallis.

4. Análise Bivariada.
- Tabelas de Contingência
- Testes de associação para variáveis em escala nominal e ordinal (Qui-Quadrado, Teste Exato de
Fisher) dispostas em tabelas de contingência;
- Medidas de associação (Phi, V de Cramer, Coeficiente de Contingência de Pearson; Tschuprow)
para tabelas de contingência;
- Testes de correlação para variáveis em escala ordinal e de intervalo (Pearson e Spearman)
- Medidas de correlação (paramétrica- coeficiente de Correlação de Pearson e não paramétrica-
Coeficiente de Correlação de Spearman)

5. Análise de regressão linear
- Análise de Regressão Linear Simples
- Análise de Regressão Linear Múltipla

6. Construção de gráficos no software R (por exemplo: gráfico caixa-de-bigodes, caule e folhas, histograma, barras, circular, dispersão, mosaico, linhas)

7. Análise de Clusters – Introdução e contextualização
- Medidas de Similaridade (distância, correlação e associação)
- Métodos hierárquicos, não hierárquicos e mistos
- Critérios de (des)agregação
- Determinação do número de clusters
- Validação de clusters
 
Serão utilizadas bases de dados com exemplos diversificados implementados no software R para ilustrar cada um dos modelos em análise.

Os formandos serão “desafiados” tendo como base “Estudo de Casos” para darem resposta a diferentes problemas com recurso à metodologia ministrada.

 

Certificação: No final do workshop será entregue um certificado GADES Solutions e DGERT aos participantes.

 

Preço: 150 euros

 

Data e horário: 5, 6, 12, 13, 19 e 20 de abril de 2022, das 18h às 21h

 

Formato: O workshop irá decorrer em formato ONLINE.

 

Inscrição: Os candidatos deverão candidatar-se até ao dia 29 de março de 2022, através do preenchimento do Formulário de Inscrição.
 
*Número limitado de inscrições.

 

Mais informações: mare@ipleiria.pt e aqui

Inscrições aqui
 

Date: 
Tuesday, 5 April, 2022 to Wednesday, 20 April, 2022
Workshop