class: center, middle, title-slide .title[ # Aula 13 - Análise de dados - Parte II ] .subtitle[ ## Jornalismo de Dados ] .author[ ### Leonardo Mancini ] .date[ ### 2024 ] --- # Análise Exploratória de Dados - A Análise Exploratória de Dados (AED) nos permite analisar conjuntos de dados e resumir suas principais características. - É uma espécie de sondagem do terreno, uma forma de tentar ouvir o que os dados podem nos contar. - Após a AED, podemos partir para análises mais complexas, como inferência, modelagem e predição. --- # Rotina de Análise Exploratória de Dados Cada variável de seu _dataset_ de ser analisada individualmente para que possamos entender o que ela representa e quais são suas características. Depois, é importante analisar as relações entre as variáveis, para entender como elas se relacionam entre si, principlamente como elas se relacionam com a variável de interesse. - **Variável dependende**: é a variável que queremos explicar ou prever. - **Variáveis independentes**: são as variáveis que usaremos para explicar ou prever a variável dependente. --- # Como analisar cada variável individualmente - **Variáveis numéricas**: podemos usar medidas de tendência central (média, mediana), medidas de dispersão (desvio padrão, variância), distribuições (IQR, boxplot, gráficos de densidade ou histogramas). - **Variáveis categóricas**: podemos usar tabelas de frequência, percentuais de linha ou coluna, e gráficos de barras. É importante indicar o número de observações e o número de valores faltantes de cada variável. --- # Como analisar a relação entre duas variáveis - **Categórica com categórica**: tabelas de contingência e gráficos de barras. - **Numérica com categórica**: boxplots, gráficos de densidade, gráficos de barra. - **Numérica com numérica**: gráficos de dispersão. - **Variáveis temporais**: podemos usar gráficos de linha e gráficos de barras. --- # Exercício Vamos pegar o arquivo que vocês limparam no exercício do OpenRefine. [deste link](./data/emissoes-fake-csv-limpo.xlsx).