class: center, middle, title-slide .title[ # Aula 3 - Tipos de dados ] .subtitle[ ## Jornalismo de Dados ] .author[ ### Leonardo Mancini ] .date[ ### 2024 ] --- # Quantitativos x Qualitativos Existem dois tipos de dados que você pode coletar e analisar: - **Quantitativos**: são aqueles que expressam uma quantidade numérica. - Exemplos: idade, peso, altura, temperatura, salário, etc. - **Qualitativos**: são aqueles que expressam qualidades, significados, percepções de pessoas ou grupos. Não são possíveis de serem mensurados numericamente e são mais dificeis de serem verificados / reproduzidos. - Exemplos: sentimentos, hábitos, percepções, etc. A sua pergunta de pesquisa vai determinar o tipo de dados que você vai coletar e analisar. --- # Exemplo: Desempenho escolar **Abordagem quantitativa:** - Caracteristicas e comportamentos dos estudantes indicam quais as características daqueles que têm desempenho superior (considerando que a melhor proxy para desempenho seja nota e taxa de aprovação) - notas, faltas, taxa de empréstimo de livros, consultas a base de dados, reprovações, **Abordagem qualitativa: ** - A maneira como estudantes percebem a instituição e as disciplinas permitem entender os motivos por detrás dessas diferenças de comportamento - Percepção dos alunos sobre a instituição, sobre as disciplinas; motivação para estudar; dificuldades encontradas; relação com professores e colegas; expectativas para o futuro. Em geral, abordagens mistas permitem obter uma visão mais completa do fenômeno. ??? Não há uma abordagem melhor que outra --- # Métodos quali x quanti - **Quantitativos**: - São percebidos como mais objetivos. - Permitem reprodução e checagem dos achados. - Vai buscar a generalização dos resultados. - Vão usar técnicas de análise e coleta de informações da matemática e da estatística: _surveys_, testes de hipóteses, análise de dados, etc. - **Qualitativos**: - São percebidos como mais subjetivos. - Dependem do contexto em que os dados são coletados e da interpretação do pesquisador. - Não permitem generalização, mas aprofundam o entendimento do fenômeno. - Vão usar métodos das ciências humanas: entrevistas, observação participante, análise de conteúdo, etc. ??? A análise qualitativa se baseia em técnicas interpretativas para compreender a subjetividade e complexidade do que se quer estudar. Por exemplo, “o que os clientes estão achando do novo canal de atendimento?”, ou “quais são as prioridades dos colaboradores nos próximos meses?”, são perguntas que ela pode responder. --- # Dados qualitativos .pull-left[ **Fontes** - Transcrições de entrevistas. - Pesquisas de clima. - Anotações de observações em um ambiente de pesquisa ou notas de campo. - Relatos pessoais. - Respostas de questionários em texto. - Comentários em redes sociais. - Registros de conversas em chats ou e-mails. - Entrevistas em profundidade. - Avaliações e feedbacks de clientes. ] .pull-right[ **Métodos** - Análise qualitativa de texto. - Análise do discurso - Entrevistas em profundidade - Etnografia / Observação participante ] --- # Dados quantitativos Dados quantitativos podem ser de várias naturezas. É importante saber identificar cada um deles para que possamos escolher a maneira correta de analisar e visualizar esses dados. Tipos de dados quantitativos: - Numéricos (inteiros ou reais, contínuos ou discretos) - Categóricos (ordenados ou não) - Texto (strings) - Data (tempo, data e hora) - Lógicos (TRUE ou FALSE, 0 ou 1) - Espaciais (coordenadas geográficas, polígonos, etc.) - Imagens Cada um tem caraterísticas e tratamentos específicos. --- # Dados numéricos São aqueles que representam valores quantitativos, como idade, peso, altura, salário, etc. Podem ser inteiros ou reais, contínuos ou discretos. - Inteiros / Discretos: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 - Reais / Contínuos: 1.5, 2.3, 3.7, 4.1, 5.0, 6.2, 7.8, 8.9, 9.4, 10.0 --- # Como analisar dados numéricos? Medidas que nos ajudam a entender a distribuição dos dados numéricos: - Média: a média aritmética - Mediana: o valor que divide os dados em duas partes iguais - Máximo e mínimo: os valores extremos - Desvio padrão: a dispersão dos dados em torno da média - Moda: o valor que mais se repete (ninguém se importa muito...) - Correlação: a relação entre duas variáveis numéricas Fundamental entender a distribuição dos dados! --- # Visualizando dados contínuos: .center[ ![](Aula-3---tipos-de-dados_files/figure-html/unnamed-chunk-1-1.png)<!-- --> ] --- # Dados Categóricos São aqueles que representam categorias, como sexo, cor, estado civil, etc. Medidas: - Tabela de frequência <br> <table class="table table-condensed"> <thead> <tr> <th style="text-align:right;"> Cilindradas </th> <th style="text-align:right;"> Número </th> <th style="text-align:right;"> Percentual </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 4 cilindros </td> <td style="text-align:right;"> 11 </td> <td style="text-align:right;"> 34.4% </td> </tr> <tr> <td style="text-align:right;"> 6 cilindros </td> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 21.9% </td> </tr> <tr> <td style="text-align:right;"> 8 cilindros </td> <td style="text-align:right;"> 14 </td> <td style="text-align:right;"> 43.8% </td> </tr> </tbody> </table> --- # Visualizando dados categóricos .center[ ![](Aula-3---tipos-de-dados_files/figure-html/unnamed-chunk-3-1.png)<!-- --> ] --- class: inverse # Juntando variáveis .center[ ![:scale 55%](./imagens/idade_perc_sexo-nexo.png) ] --- # Texto São aqueles que representam palavras ou frases. Podemos usar técnicas de variáveis categóricas para analisar textos. Medidas: - Contagem de palavras - Análise de sentimento - Classificação de texto - Processamento de linguagem natural (PLN) Formas de visualização: - Nuvem de palavras - Clusters - Redes Exemplo: [Nexo e a constituição](https://www.nexojornal.com.br/grafico/2018/10/05/30-anos-o-quanto-a-constituicao-preserva-de-seu-texto-original) --- # Exemplo de texto: <small> > Estudar jornalismo na ESPM Rio é mergulhar em um ambiente vibrante e inovador, onde a teoria encontra a prática de forma integrada. A instituição, reconhecida pela excelência acadêmica, oferece um curso que combina fundamentos sólidos do jornalismo com as mais modernas ferramentas e tecnologias, preparando os estudantes para os desafios do mercado atual. Na ESPM Rio, os alunos têm a oportunidade de vivenciar o jornalismo em todas as suas dimensões, desde a produção de conteúdo até a análise crítica dos meios de comunicação. > Um dos grandes diferenciais da ESPM Rio é a proximidade com o mercado e com os grandes nomes do jornalismo. Através de parcerias, palestras e workshops, os estudantes têm acesso direto a profissionais de destaque, que compartilham suas experiências e conhecimentos, enriquecendo a formação acadêmica. Esse contato constante com o mercado garante que os alunos estejam sempre atualizados com as tendências e práticas mais relevantes da profissão. </small> --- # Nuvem de palavras ![](Aula-3---tipos-de-dados_files/figure-html/unnamed-chunk-4-1.png)<!-- --> --- # Data São aqueles que representam datas e horas. Geralmente utilizamos um conjunto de técnicas específico chamado análise de séries temporais. Podemos usar medidas de variáveis numéricas para analisar datas, como média, mediana, desvio padrão, etc. Em alguns contextos, datas são tratadas como variáveis categóricas. Representação visual mais comum é o gráfico de linha (com o tempo sempre no eixo x). --- #Lógicos São aqueles que representam valores lógicos, como verdadeiro ou falso, 0 ou 1. Medidas: - Proporção Visualização (as mesmas de variáveis categóricas): - Tabela de frequência - Gráfico de barras --- # Espaciais São aqueles que representam coordenadas geográficas (latitude e longitude). Medidas: - Distância entre pontos - Área de polígonos Visualização: - Mapas