Podem ser diversas as motivações que levam a embarcar na viagem do jornalismo de dados. Para confirmar a informação de um press-release, para fundamentar uma matéria ou para partir à descoberta sem preconceitos. O mais provável é chegar ao fim com histórias «na manga» para partilhar com o público. E estas histórias serão, certamente, mais sustentadas e com menor margem de erro e contestação.

DADOS

A denominação não deixa enganar. Os dados são a grande matéria prima desta vertente do jornalismo. Aos princípios do jornalismo alia-se todo o potencial da informação escondida em datasets, folhas de cálculo ou bases de dados.
DATASETS

Um dataset é um conjunto de dados organizado de forma estruturada. Ou seja, vários registos de informação sobre um tema estruturados de forma idêntica. A tabela de uma folha de cálculo será, provavelmente, o formato mais compreensivo de uma estruturação de dados em dataset.

FONTES

Os dados podem ter as origens mais diversas. Por exemplo:

  • Registo Manual: Registo diário dos resultados de uma actividade ou de indicadores;
  • Registo Automático: As respostas armazenadas num inquérito online;
  • Extração: A extração de dados de um site ou de uma tabela em PDF;
  • Download: Download de um ficheiro de dados disponibilizados por uma entidade ou portal de dados abertos;
  • Feed: Sincronização com um feed de dados gerado de forma automática.
FORMATOS

A tabela é um dos formatos mais populares e compreensivos, mas não é a única forma de organizar dados. Dependendo da aplicação ou do serviço online, os dados podem ser estruturados em diferentes formatos e tipos de ficheiros.
Os formatos mais usados são:

  • CSV (Comma-Separated Values): Ficheiro de texto simples com os dados separados por vírgulas (Vários programas);
  • XLS: Tabela de dados estruturados por colunas e linhas (Excel);
  • XML (Extensible Markup Language): Dados estruturados em linguagem semelhante ao HTML (Web, transporte e armazenamento);
  • JSON (JavaScript Object Notation): Formato dados escrito em Javascript, de reduzida dimensão e muito usado na programação;
  • MDB: Formato de dados gerado pela aplicação Microsoft Access Database (MS Access);
  • SQL: Formato standard de sistemas de bases de dados relacionais;
DADOS >>

ANÁLISE

A procura e recolha dos dados é apenas o primeiro passo. Esta é sempre uma viagem trabalhosa que coloca à prova a perícia técnica, a paciência e a determinação de quem se aventura na análise e investigação assente nos dados.
LIMPEZA E NORMALIZAÇÃO

Mesmo em datasets disponíveis para download, nem sempre os dados estão nas melhores condições. É frequente encontrarmos conjuntos de dados a necessitar de um grande esforço de limpeza e normalização nos registos. Inconsistências nos formatos, nas classificações, na agregação de informação, etc. Não será difícil imaginar o desafio de limpeza e normalização destas inconsistências em conjuntos de dados de grande dimensão. Aqui, a folha de cálculo (Excel) continua a ser uma das ferramentas de eleição.

CÁLCULO E ANÁLISE

Com os dados normalizados, estão criadas as condições para retirar conclusões da informação. Os cálculos sobre os dados, com recurso a folhas de cálculo, tabelas dinâmicas ou outras ferramentas, permitem múltiplas análises sobre a informação. E podem converter um vasto conjunto de dados brutos em histórias e retratos surpreendentes.

FERRAMENTAS >>

VISUALIZAÇÃO

O potencial dos dados para descobrir histórias é indiscutível. Mas uma boa história pode perder todo o impacto se não for apresentada da melhor forma. É aqui que a visualização assume um papel decisivo na apresentação de histórias baseadas em dados. Dependendo do suporte de publicação/difusão, seja online, papel ou audiovisual, há várias soluções de visualização que podem dar aos dados uma leitura intuitiva e compreensiva.
Os elementos de visualização mais utilizados são:
GRÁFICOS

Os gráficos são o tipo mais comum de visualização de dados, abrangendo gráficos de barras, de linhas, de bolhas, circulares, radiais, pictoriais, entre muitos outros formatos.

GEOGRÁFICOS

Para a apresentação de dados de âmbito geográfico, os mapas oferecem diversas soluções de visualização, seja para assinalar pontos no mapa, comparar densidades entre regiões, revelar fluxos de circulação, etc.

DIAGRAMAS

Os diagramas são particularmente úteis para demonstrar uma estrutura, uma hierarquia, um modelo de organização, um processo ou um fluxo de trabalho.

TEMPORAIS

Quando os dados têm de ser visualizados no tempo, os elementos de visualização temporais podem ser de grande utilidade. Estamos a falar de timelines e timetables.

Fonte: datavizproject.com

FERRAMENTAS >>

HISTÓRIAS

Esta é a meta final. Contar uma história sustentada em dados fiáveis, aliando a escrita com o impacto dos elementos de visualização.
Na área de Projetos, pode conferir alguns exemplos de histórias contadas com base em jornalismo de dados.
PROJETOS >>