Análise de Dados como Método de Apoio às Políticas Públicas
Análise Multivariada
Professora
- Adriana Andrade (DEMAT/ICE/UFRRJ) (andrade.ufrrj@gmail.com)
Objetivo da Disciplina
Apresentar uma visão geral de algumas técnicas de análise multivariada, disciplina que proporciona recursos para explorar, resumir e interpretar dados de múltiplas variáveis simultaneamente.
A disciplina se inicia com uma revisão de álgebra linear, da distribuição Normal Multivariada e estatísticas descritivas para dados multivariados. Dentre os tópicos de análise multivariada serão apresentados métodos de redução de dimensionalidade, incluindo análise de componentes principais e análise fatorial, além de técnicas de agrupamento, como a análise hieárquica de agrupamentos e o método de k-médias. O curso contempla a aplicação dessas técnicas na identificação de padrões, simplificação dos dados e segmentação de grupos homogêneos com base em características observadas.
Pacote estatístico R
- Neste curso também está previsto a utilização do pacote estatístico R. O pacote estatístico R é uma linguagem de programação estatística e gráfica direcionada para a manipulação, visualização e análise estatística de dados. A linguagem ainda possui como diferencial a facilidade no aprendizado, mesmo para aqueles que nunca tiveram contato anterior com programação. O pacote estatístico R é um software livre (free) e de código aberto (open source) para análise de dados e pode ser encontrado no site oficial do projeto CRAN (link)..
- Na disciplina a linguagem R será utilizada através da interface gráfica RStudio (link), que é uma IDE ou ambiente de desenvolvimento integrado, para o pacote R. Com sua utilização gratuita, o RStudio é uma excelente ferramenta para trabalhar com o R.
- Material sobre estatística descritiva aplicada no R no site praticaR
Programa da Disciplina
| Tópicos | Conteúdo |
|---|---|
| 1 | Introdução |
| 1.1 | Revisão de Álgebra Linear |
| 1.2 | Estatísticas Descritivas de dados multivariados |
| 1.3 | Distância e Similaridade |
| 1.4 | Densidade Normal Multivariada |
| 2 | Análise de Componentes Principais |
| 2.1 | Obtenção das componentes principais |
| 2.3 | Definição do número de componentes principais |
| 2.4 | Análise dos Resultados |
| 3. | Análise Fatorial |
| 3.1 | Introdução |
| 3.2 | Adequação do Modelo Fatorial |
| 3.3 | Obtenção dos Fatores |
| 3.4 | Rotação dos Fatores |
| 3.5 | Resultados |
| 3.6 | Escores Fatoriais |
| 4. | Análise de Agrupamentos |
| 4.1 | Definição, objetivo e aplicação |
| 4.2 | Medidas de dissimilaridade e similaridade |
| 4.3 | Métodos hierárquicos |
| 4.4 | Métodos não hierárquicos |
| 4.5 | Validação e qualidade do agrupamento |
Funcionamento da Discplina
Neste site se encontra todo o conteúdo da disciplina de Análise Multivariada. A disciplina está divida em quatro blocos, um por semana, segundo o Programa da disciplina.
A cada semana, você deverá fazer um estudo dirigido com base nos materiais disponibilizados. No decorrer da semana, teremos um encontro síncrono, por vídeoconferência, no qual serão apresentados alguns aspectos teóricos do tópico semanal e a realização de uma prática com análise de dados no software R. Esta aula será gravada e disponibilizada posteriormente no site. Recomendo fortemente realizar o estudo dirigido antes do encontro síncrono.
LINK DA SALA DE VÍDEOCONFERÊNCIA: https://conferenciaweb.rnp.br/sala/adriana-oliveira-andrade
Avaliação da Disciplina
A avaliação da disciplina será realizada por duas atividades:
- Excercícios de Fixação - Um a cada bloco
Esses exercícios foram elaborados com base no materiais disponibilizados em cada tópico. Uma vez que você realizou o estudo dirigido, terá condições de realizar o exercício. Cada Exercício é composto por 10 questões de múltipla escolha.
- Avaliação Prática com R
Você deverá com realizar uma Análise de Componentes Principais utilizando os códigos disponibilizados na Prática realizada no curso com o conjunto de dados link. Orientações para a produção do relatório link.
Essa avaliação deverá ser entregue pelo SIGAA em Tarefas. Não serão aceitos trabalhos entregues por email.
A Nota Final será obtida pela média simples entre as atividades.
A realização dos exercícios e a entrega do Relatório deverão ser realizadas até 10/abril/2026.
Bibliografia
JOHNSON, R. A.; WINCHERN, D. W. Applied Multivariate Statistical Analysis. Prentice Hall, 2007
ARTES, Rinaldo; BARROSO, Lúcia Pereira. Métodos multivariados de análise estatística. São Paulo: Blucher, 2023.
FÁVERO, Luiz; FÁVERO, Patrícia. Análise de dados: técnicas multivariadas exploratórias com SPSS e STATA. Elsevier Brasil, 2017.
Cronograma das Aulas Síncronas
A cada encontro síncrono será apresentado um breve resumo dos aspectos teóricos do tópico semanal com uma análise de dados no R.
LINK DA SALA DE VÍDEOCONFERÊNCIA: https://conferenciaweb.rnp.br/sala/adriana-oliveira-andrade
Cada encontro terá duração de 2h e será realizados às quintas feiras às 19hs. Atenção: o último encontro será realizado na terça-feira, dia 31/março, em razão do feriado da Semana Santa.
| Data | Aula | Descrição |
|---|---|---|
| 12/03/2025 | 1 | Apresentação e Introdução |
| 19/03/2025 | 2 | Análise de Componentes Principais |
| 26/03/2025 | 3 | Análise Fatorial |
| 31/03/2025 | 4 | Análise de Agrupamentos |
ESTUDO DIRIGIDO - Orientações e Materiais
Aula 1: Introdução
Nessa aula será realizada a apresentação e uma introdução da disciplina.
Os materiais de aula para o estudo dirigido apresentam alguns conceitos e fundamentos das técnicas de Análise Multivariada.
Destaco a aula de revisão de álgebra linear. Caso você nao seja familiarizado com esse conteúdo, não se preocupe, pois você ainda assim conseguirá acompanhar a disciplina.
- Assista à aula Síncrona;
- Faça o estudo dirigido dos materiais;
- Faça a prática no R;
- Responda ao exercício avaliativo de compreensão do conteúdo.
| Material | Links |
|---|---|
| Introdução à Análise Multivariada | Aula |
| Revisão de Álgebra Linear | Aula |
| Análise Descritiva | Aula |
| Distância e Similaridade Descritiva | Aula |
| Normal Multivariada | Aula |
| Pratica com R | link |
| Gravação da Aula Síncrona | link |
Aula 2: Análise de Componenes Principais
Nessa aula iremos abordar a técnica multivariada mais utilizada, a Análise de Componentes Principais. Na aula síncrona serão abordados os aspectos teóricos fundamentais e uma aplicação prática no R.
- Assista à aula Síncrona;
- Faça o estudo dirigido dos materiais;
- Faça a prática no R;
- Responda ao exercício avaliativo de compreensão do conteúdo.
| Material | Links |
|---|---|
| Introdução à Análise de Componentes Principais | Aula |
| Obtenção das Componentes Principais | Aula |
| Número de Componentes Principais | Aula |
| Resultados da Análise das Componentes Principais | Aula |
| Pratica com R | link |
| Artigo | link |
| Gravação da Aula Síncrona | link |
Aula 3: Análise Fatorial
Nessa aula iremos analisar uma técnica recorrentemente utilizada nos estudos comportamentais, a Análise Fatorial. Na aula síncrona serão abordados os aspectos teóricos fundamentais e uma aplicação prática no R.
- Assista à aula Síncrona;
- Faça o estudo dirigido dos materiais;
- Faça a prática no R;
- Responda ao exercício avaliativo de compreensão do conteúdo.
| Material | Links |
|---|---|
| Introdução | Aula |
| Adequação do Modelo Fatorial | Aula |
| Obtenção dos Fatores | Aula |
| Resultados | Aula |
| Pratica com R | link |
| Artigo | link |
| Gravação da Aula Síncrona | link |