class: center, middle, title-slide .title[ # Aula 4 - Fluxo de trabalho ] .subtitle[ ## Jornalismo de Dados ] .author[ ### Leonardo Mancini ] .date[ ### 2025 ] --- # Jornalismo de Dados **Etapas Principais** 1. Definição do tema 2. Coleta de dados 3. Limpeza e organização 4. Análise 5. Visualização e Publicação .footnote[ Referência: "Fluxo de trabalho com dados: do zero à prática", Escola de Dados. ] --- class: inverse, middle center # Definição do tema --- # Definição do tema Tudo começa com uma base disponível ou com uma questão. - Se você encontrou uma base, faça uma limpeza e posterior análise exploratória (AED ou EDA) para entender melhor do que se trata, de que tipo de dados estamos analisando. - Do contráro, formule uma questão ou hipótese e imagine de onde poderíamos obter dados para realizar essa análise. - Quem é a autoridade no assunto? - Quem estuda esse tema? - Quem já publicou a respeito? De onde tirou os dados? No segundo caso, talvez você tenha que montar seu _dataset_, o que vai certamente demandar mais recursos na obtenção e limpeza dos dados. ??? Enquanto você formula e detalha sua pergunta, faça uma pesquisa intensa sobre o assunto do seu interesse. --- # Definindo temas Um bom tema para JD é: <small> 1. **Objetivo**: não pode ser muito amplo, nem muito específico; é delimitado temporalmente, em termos de amostra e de variáveis. 2. **Razoavelmente complexo**: não deve ser senso comum, nem uma pergunta que pode ser respondida com uma busca no Google. 3. **Viável**: considerando os recursos disponíveis, tem que ser realizável. Pes tempo, conhecimento, ferramentas e dados disponíveis. 4. **Original**: Mesmo que você esteja analisando algo que já foi estudado, é importante trazer uma nova perspectiva. 5. **É relevante**: tem que ser importante para ser publicável. Sempre se pergunte "- E daí?". </small> **ATENÇÃO**: evitem juizos de valor (melhor, pior...) e a busca por causalidade. ??? **Exemplo**: Transporte público municipal Como tema, é amplo demais. Quais aspectos? De que período estamos tratando? Reflita sobre os incômodos: custo? frequência? violência? carteis? É complexo, demanda conhecer regulação, processos licitatórios. o que entendemos como empresas atuante no mercado rodoviário da cidade? São aquelas que possuem concessões públicas com a Prefeitura no presente momento? Ou com concessões vencidas também? Os ônibus intermunicipais serão levados em conta? E se a firma dona da concessão for controlada por outra empresa, esta segunda empresa deve entrar em nossa listagem? Por conta de transparência, há bastante dados disponíveis, mas há tb obscuridade por conta da dimensão privada das relações. --- class: inverse # Transporte público RJ .center[  ] ??? A pergunta mencionada sobre o transporte rodoviário foi a questão seminal da investigação realizada por Adriano Belisário (coautor e organizador do ebook) e a equipe da Agência Pública, que resultou em uma série de reportagens publicadas no Especial Catraca. A partir de levantamentos de dados para responder àquela simples pergunta inicial, a investigação revelou relações inéditas entre deputados e empresários do ramo, por exemplo --- class: inverse # Exercício Defina um tema de interesse para você e formule uma questão ou hipótese que você gostaria de analisar. - Qual a questão central que você gostaria de responder? - Por que essa questão é relevante? - Quando, como e onde existe e ocorre? - Quem são os atores envolvidos? - O que significa cada termo da sua pergunta? Tempo: 20 min --- # Melhorando as hipóteses Depois de definido o tema, é importante se aprofundar no assunto. - O que já foi publicado a respeito? - Quais são os termos mais utilizados e quais suas definições? - Quais foram as fontes de dados utilizadas? - Das conclusões, o que é mais relevante para a sua análise? O que é mais robusto e mais frágil? Não se preocupe se suas primeiras hipóteses não forem as melhores. É bem provável que você precise ajustar as questões aos dados encontrados. ??? O mais importante é que você consiga formular perguntas que possam ser respondidas com os dados disponíveis. --- class: inverse, middle, center # Próximo passo: Coleta de dados