NICAR #2

Data de Publicação

5 de março de 2025

Data de Modificação

8 de março de 2025

Nota

Esse post é um work in progress

O primeiro dia de programação do NICAR começou com o painel que apresentei (Everything Everywhere All at Once: Data from Around the World to Report on Global Issues. Slides da minha parte da apresentação:

Meus colegas de painel

Depois tentei ver a oficina Using Python to analyze map data, mas a sala tava lotada e fiquei de fora. Usei o tempo para descansar. Material: bit.ly/nicar25-python-gis

Jonathan Soma tem slides perfeitos. A oficina Passive scraping in social media foi um papo bom sobre soluções de raspagem em redes sociais, seus problemas e a apresentação de uma ferramenta que ele fez para que a gente, que é preguiçoso, consiga extrair informações de um site.

Ele listou as seguintes formas de obtenção de dados do tiktok, insta, X:

  • Use a tool

  • Build a scraper

    • Problem with scrapers - CAPTCHA

    • FORGET SELENIUM, USE PLAYWRIGHT - Soma disse isso tá

  • Undocumented APIs (ver a palestra sobre o tema)

  • Intercepting browser requests

  • Pack-ratting with HAR and WARC/WARCZ files

HAR Data Extractor

jonathansoma.com/har2data

Um papo MUITO bom sobre criar guidelines para o uso de IA no jornalismo. Ouvi uma vez que as redações deveriam usar IA para automatizar tarefas maçantes e deixar a “parte legal” para os jornalistas. Mas “inteligência” artificial não é bagunça!! Dá um pouco de conforto saber que tem gente na comunicação que se dedica mesmo em “policiar” a tecnologia (já que os governos não regulam né)

Dia 2

bit.ly/nicar-25-viz-101 e bit.ly/nicar-25-viz-102

não consegui aproveitar taaaanto pq eu estava nervosa com isso aqui

DAY 3: ggplot2

Customizing ggplot for yourself or your organization — NICAR 2025

pewplots - pacote pra construir gráficos para o Pew Research