class: center, middle, title-slide .title[ # Aula 1 - Introdução ] .subtitle[ ## Jornalismo de Dados ] .author[ ### Leonardo Mancini ] .date[ ### 2025 ] --- class: center, middle, inverse # O que é Jornalismo de Dados? --- # O que usa dados? .pull-left[ - O jornalismo, em tese, sempre utilizou dados para construir suas narrativas. - Documentos, fotos, vídeos, áudios, tabelas... ] .pull-right[ .center[  ] ] --- # O que usa mapas e gráficos?  Charles Minard (1869) ??? The numbers of men present are represented by the widths of the colored zones at a rate of one millimeter for every ten thousand men; they are further written across the zones. The red designates the men who enter Russia, the black those who leave it. — The information which has served to draw up the map has been extracted from the works of M. M. Thiers, de Ségur, de Fezensac, de Chambray and the unpublished diary of Jacob, the pharmacist of the Army since October 28th. In order to better judge with the eye the diminution of the army, I have assumed that the troops of Prince Jérôme and of Marshal Davout, who had been detached at Minsk and Mogilev and have rejoined near Orsha and Vitebsk, had always marched with the army. --- # O que usa mapas e gráficos? <br><br>  Van Langren (1644) - variação das estimativas de diferença das longitudes entre Toledo e Roma ??? In 1644, Michael Florent Van Langren, a Flemish astronomer, is believed to have provided the first visual representation of statistical data. This marked a significant shift from purely geographical maps to the visualization of abstract data. The one-dimensional line graph below shows the twelve known estimates at the time of the difference in longitude between Toledo and Rome, as well as the name of each astronomer who provided the estimate. What is notable here is that while Van Langren could have provided this information in a table, it is the use of the graph that really visually displays the wide variations in estimates. This early attempt at data visualization demonstrated the power of graphical representation to convey complex information more intuitively than tables or text. --- class: inverse # O que usa mapas e gráficos? <br> .center[  ] John Snow (1854) - Surto de cólera em Londres ??? This map was revolutionary in its ability to identify the source of the cholera outbreak, demonstrating the power of data visualization in public health. --- # O que usa computadores? .pull-left[ <small> - Jornalismo de precisão: Philip Meyer (1960) define "Jornalismo de Precisão" como aquele que utilizava computadores para análise de dados sociais. - A proposta era utilizar métodos científicos (especialmente estatística) para investigar e reportar notícias. - Reportagens com auxílio de comuptadores (RAC): a partir dos anos 90, integrando computadores ao jornalismo. ]</small> .pull-right[ <img src="https://upload.wikimedia.org/wikipedia/commons/thumb/0/00/Meyer110719a.jpg/400px-Meyer110719a.jpg" width="70% "> ] --- class: inverse # CBS (1952) .center[  ] ??? Virou tradição tentar prever antes de todo mundo o resultado. https://www.life.com/history/election-night-coverage-when-tv-was-young/ --- # Jornalismo de Dados (JD) - **Jornalismo de Dados (JD)** é uma prática jornalística que utiliza dados quantitativos e metodologia científica como base para a construção de narrativas jornalísticas. - Data journalism ou Data driven journalism - herdeiro da tradição do jornalismo de precisão e do RAC. - Não basta usar dados - os dados precisam contar a história. - Difere pela abordagem rigorosa e pela metodologia (herança das ciências sociais), além da utilização de ferramentas computacionais (_data science_) . --- class: inverse, middle .pull-left[  [G1 - Globo](https://g1.globo.com/sp/sao-paulo/noticia/2022/06/09/4-em-cada-10-abortos-legais-no-brasil-sao-feitos-fora-da-cidade-onde-a-mulher-mora-pacientes-percorreram-mais-de-1-mil-km.ghtml) ] .pull-right[ **Metodologia:** > <i> Quase 40% das mulheres que fizeram um aborto autorizado por lei no Brasil entre janeiro de 2021 e fevereiro deste ano realizaram o procedimento fora do município onde moravam, segundo levantamento feito pelo g1 com dados do Sistema Único de Saúde (SUS) obtidos via Lei de Acesso à Informação (LAI). </i> ] --- class: inverse, middle .pull-left[  [InfoAmazônia](https://infoamazonia.org/2024/06/19/gado-ilegal-dispara-na-terra-indigena-arariboia-em-ano-mais-letal-para-os-guajajara/) ] .pull-right[ **Metodologia:** <small> > <i> A Mongabay viajou para a Arariboia em agosto de 2023, onde testemunhamos a criação de gado dentro da terra indígena. Coletamos as coordenadas geográficas, analisamos imagens de satélite e realizamos análises espaciais para investigar as áreas de pastagem e fazendas e criamos um banco de dados de arrendamentos de terras, denúncias de criação ilegal de gado, extração de madeira e caça ilegais, além das bases de dados assassinatos dos indígenas Guajajara na região. </i> ] --- # Jornalismo de Dados (JD) Resultado de uma mudança de contexto: - **Aumento da quantidade de dados disponíveis**: Big Data, Open Data, Web Scraping, APIs. > <small>“When information was scarce, most of our efforts were devoted to hunting and gathering. Now that information is abundant, processing is more important” (Philip Meyer). </small> - **Desenvolvimento de ferramentas e técnicas**: Computadores pessoais robustos, R, Python, Tableau, D3.js. - **Demanda por transparência e precisão**: Combate às fake news, maior exigência do público, Governos abertos e LAI. - **Aproximação dos jornalistas com _hackers_ e cientistas de dados**: Jornalistas aprendendo a programar, cientistas de dados trabalhando em redações. ??? Another difference is that in the past investigative reporters would suffer from a poverty of information relating to a question they were trying to answer or an issue that they were trying to address. While this is of course still the case, there is also an overwhelming abundance of information that journalists don’t necessarily know what to do with. They don’t know how to get value out of data. --- # Jornalismo de Dados (JD) <br> > "Another difference is that in the past investigative reporters would suffer from a poverty of information relating to a question they were trying to answer or an issue that they were trying to address. <br><br>While this is of course still the case, there is also an overwhelming abundance of information that journalists don’t necessarily know what to do with. **They don’t know how to get value out of data**",<br> ([Data Journalism in perspective](https://datajournalism.com/read/handbook/one/introduction/data-journalism-in-perspective), Liliana Bounegru) --- # Jornalismo de Dados (JD) Em resumo: - Transforma dados brutos em informações compreensíveis e acessíveis ao público. - Utiliza técnicas de ciência de dados, estatística e visualização para investigar, analisar e apresentar dados. - Aumenta a transparência e a precisão das reportagens, permitindo uma análise mais aprofundada de questões complexas. - Reduz a dependência das fontes oficiais e permite a produção de reportagens independentes e críticas. ??? Menos adivinhação, menos busca por citações; em vez disso, um jornalista pode construir uma posição forte apoiada por dados, o que pode afetar consideravelmente o papel do jornalismo. encontrar notícias únicas (que não sejam de agências), e executar a função fiscalização do poder. Especialmente em tempos de perigo financeiro, essas metas são bastante importantes para os jornais. --- # Categorias de JD - **Descritivo**: Apresenta dados de forma detalhada para descrever uma situação ou fenômeno. Exemplo: Relatórios sobre a taxa de desemprego ao longo dos anos. - **Exploratório**: Utiliza dados para explorar e identificar padrões ou tendências. Exemplo: Análise de dados de crimes para identificar áreas de maior incidência. - **Explicativo**: Busca explicar as causas e consequências de fenômenos usando dados. Parte de uma questão ou hipótese. Exemplo: Estudo sobre o impacto das mudanças climáticas baseado em dados meteorológicos. - **Investigativo**: Focado na descoberta e análise de dados para revelar **informações ocultas ou pouco conhecidas**. Exemplo: Investigações sobre corrupção usando dados de gastos públicos. ??? Some argue that there is a difference between CAR and data journalism. They say that CAR is a technique for gathering and analyzing data as a way of enhancing (usually investigative) reportage, whereas data journalism pays attention to the way that data sits within the whole journalistic workflow. --- # Jornalismo COM Dados Usa dados de forma: - **Ilustrativa**: Complementar e ilustra uma narrativa que não é centrada nos dados. Exemplo: Reportagem sobre a educação que inclui estatísticas sobre taxas de alfabetização. - **Contextual**: Fornece contexto adicional à reportagem principal. Exemplo: Artigo sobre a pandemia que inclui gráficos de casos diários de COVID-19. --- # Fases de Trabalho com JD **Etapas Principais** 1. Definição do tema 2. Coleta de dados (governos, organizações, _web scraping_) 3. Limpeza (Tratamento e preparação dos dados) 4. Análise (Ferramentas e técnicas analíticas) 5. Visualização e Publicação (Infográficos, _dashboards_, _storytelling_)