class: center, middle, title-slide .title[ # Aula 3 - Tipos de dados ] .subtitle[ ## Jornalismo de Dados ] .author[ ### Leonardo Mancini ] .date[ ### 2025 ] --- # Métodos quali x quanti - **Quantitativos**: - Permitem reprodução e checagem dos achados. - Generalização dos resultados. - Vão usar técnicas de análise e coleta de informações da matemática e da estatística: _surveys_, testes de hipóteses, regressão, etc. - **Qualitativos**: - Dependem do contexto em que os dados são coletados e da interpretação do pesquisador. - Não permitem generalização, mas aprofundam o entendimento do fenômeno. - Vão usar métodos das ciências humanas: entrevistas, observação participante, análise de conteúdo, etc. ??? Posso ter abordagens metodológicas quanti ou quali para o mesmo tema. Desempenho escolar, por exemplo. --- # Variáveis Em estatística, uma variável é uma característica, propriedade ou atributo de um indivíduo, objeto ou evento que pode assumir diferentes valores. Servem para organizar as informações. - **Quantitativas ou numéricas**: são aqueles que expressam uma quantidade numérica. - Exemplos: idade, peso, altura, temperatura, salário, etc. - **Qualitativas ou categóricas**: são aqueles que expressam percepções de pessoas ou grupos. - Exemplos: sentimentos, religião, raça, etc. Para cada tipo, há um tratamento estatístico e uma forma de visualização adequada. ??? A sua pergunta de pesquisa vai determinar o tipo de dados que você vai coletar e analisar. Há algumas variáveis que assumem características de ambos os grupos. --- # Variáveis Numéricas (quantitativas) São aqueles que representam valores numéricos, como idade, peso, altura, salário, etc. Podem ser inteiros (ou reais), contínuos (ou discretos). - Inteiros / Discretos: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 - Reais / Contínuos: 1.5, 2.3, 3.7, 4.1, 5.0, 6.2, 7.8, 8.9, 9.4, 10.0 --- # Como analisar variáveis numéricas? Medidas que nos ajudam a entender a distribuição dos dados numéricos: - Média: a média aritmética - Mediana: o valor que divide os dados em duas partes iguais - Máximo e mínimo: os valores extremos - Desvio padrão: a dispersão dos dados em torno da média - Moda: o valor que mais se repete (ninguém se importa muito...) - Correlação: a relação entre duas variáveis numéricas Fundamental entender a distribuição! --- # Visualizando dados contínuos: .center[ <!-- --> ] --- # Variáveis Categóricas São aquelas que representam categorias, como sexo, cor, estado civil, etc. Medidas: - Tabela de frequência <br> <table class="table table-condensed"> <thead> <tr> <th style="text-align:right;"> Cilindradas </th> <th style="text-align:right;"> Número </th> <th style="text-align:right;"> Percentual </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 4 cilindros </td> <td style="text-align:right;"> 11 </td> <td style="text-align:right;"> 34.4% </td> </tr> <tr> <td style="text-align:right;"> 6 cilindros </td> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 21.9% </td> </tr> <tr> <td style="text-align:right;"> 8 cilindros </td> <td style="text-align:right;"> 14 </td> <td style="text-align:right;"> 43.8% </td> </tr> </tbody> </table> --- # Visualizando dados categóricos .center[ <!-- --> ] --- class: inverse # Juntando variáveis .center[  ] --- # Texto São aqueles que representam palavras ou frases. Podemos usar técnicas de variáveis categóricas para analisar textos. Medidas: - Contagem de palavras - Análise de sentimento - Classificação de texto - Processamento de linguagem natural (PLN) Formas de visualização: - Nuvem de palavras - Clusters - Redes Exemplo: [Nexo e a constituição](https://www.nexojornal.com.br/grafico/2018/10/05/30-anos-o-quanto-a-constituicao-preserva-de-seu-texto-original) --- # Exemplo de texto: <small> > Estudar jornalismo na ESPM Rio é mergulhar em um ambiente vibrante e inovador, onde a teoria encontra a prática de forma integrada. A instituição, reconhecida pela excelência acadêmica, oferece um curso que combina fundamentos sólidos do jornalismo com as mais modernas ferramentas e tecnologias, preparando os estudantes para os desafios do mercado atual. Na ESPM Rio, os alunos têm a oportunidade de vivenciar o jornalismo em todas as suas dimensões, desde a produção de conteúdo até a análise crítica dos meios de comunicação. > Um dos grandes diferenciais da ESPM Rio é a proximidade com o mercado e com os grandes nomes do jornalismo. Através de parcerias, palestras e workshops, os estudantes têm acesso direto a profissionais de destaque, que compartilham suas experiências e conhecimentos, enriquecendo a formação acadêmica. Esse contato constante com o mercado garante que os alunos estejam sempre atualizados com as tendências e práticas mais relevantes da profissão. </small> --- # Nuvem de palavras <!-- --> --- # Data São aqueles que representam datas e horas. Geralmente utilizamos um conjunto de técnicas específico chamado análise de séries temporais. Podemos usar medidas de variáveis numéricas para analisar datas, como média, mediana, desvio padrão, etc. Em alguns contextos, datas são tratadas como variáveis categóricas. Representação visual mais comum é o gráfico de linha (com o tempo sempre no eixo x). --- #Lógicos São aqueles que representam valores lógicos, como verdadeiro ou falso, 0 ou 1. Medidas: - Proporção Visualização (as mesmas de variáveis categóricas): - Tabela de frequência - Gráfico de barras --- # Espaciais São aqueles que representam coordenadas geográficas (latitude e longitude). Medidas: - Distância entre pontos - Área de polígonos Visualização: - Mapas