Dados reais do Diario de Justica Eletronico Nacional

Transparencia no Mercado Juridico Brasileiro

Coletamos e arquivamos dados publicos de 96 tribunais brasileiros diariamente. Dados abertos, gratuitos, armazenados permanentemente no Internet Archive.

Ver Publicacoes Saiba Mais

Pipeline ao Vivo

Atualizado a cada 20 min

18 tribunais com dados

de 96 monitorados

3.9K ZIPs coletados

armazenados no Internet Archive

8.8%

Backfill em andamento

5K de 56.9K

Dados Reais do Pipeline

Numeros atualizados automaticamente pelo workflow de coleta

3.9K

ZIPs Arquivados

Tribunais com Dados

21 GB

Volume Arquivado

100%

Dados Publicos

Como Funciona

Pipeline automatizado coleta dados do DJEN a cada 20 minutos e arquiva permanentemente no Internet Archive

1. Coleta Automatica

A cada 20 minutos, o GitHub Actions coleta publicacoes do DJEN de 96 tribunais brasileiros via proxy dedicado.

2. Arquivo Permanente

Cada ZIP e enviado ao Internet Archive, garantindo acesso publico permanente. Ja temos 3.9K arquivos preservados.

3. Catalogo Indexado

Um catalogo em Parquet e gerado automaticamente, permitindo consultas rapidas sobre os dados coletados.

Para Quem?

Dados abertos para todo o ecossistema juridico

🧑‍⚖️

Pesquisadores

Acesse dados estruturados de publicacoes judiciais para pesquisas academicas e analises juridicas.

✓ Dados em formato Parquet
✓ Consultavel via DuckDB
✓ Historico completo preservado

🏢

LegalTechs

Use como base de dados para construir produtos e servicos no mercado juridico brasileiro.

✓ API via Internet Archive
✓ Atualizacao continua
✓ Sem custos de licenciamento

⚖️

Jornalistas

Investigue e analise dados do judiciario brasileiro com transparencia total.

✓ Dados publicos verificaveis
✓ Cobertura de 96 tribunais
✓ Arquivo permanente no IA

100% Aberto e Gratuito

Dados Abertos Para Sempre

Transparencia no judiciario e um direito de todos.
Os dados coletados pelo CausaGanha sao e sempre serao gratuitos e publicos.

Infraestrutura

GitHub Actions para coleta automatica

Internet Archive para armazenamento permanente

DuckDB + Parquet para consultas rapidas

Codigo 100% open source no GitHub

Apoie o Projeto

O CausaGanha e mantido de forma independente. Contribua com uma estrela no GitHub ou ajude a divulgar o projeto.

Estrela no GitHub Ver Publicacoes →

Perguntas Frequentes

De onde vem os dados?

Todos os dados sao extraidos do Diario de Justica Eletronico Nacional (DJEN), que e um registro publico de todas as comunicacoes judiciais do Brasil. Coletamos de 96 tribunais.

Com que frequencia os dados sao atualizados?

O pipeline roda a cada 20 minutos via GitHub Actions. Cada execucao coleta novas publicacoes e envia ao Internet Archive. O dashboard e atualizado automaticamente apos cada coleta.

Como posso acessar os dados?

Os dados estao disponiveis no Internet Archive sob o identificador djen-YYYY-MM-DD. O catalogo indexado em formato Parquet pode ser consultado via DuckDB.

O projeto e open source?

Sim! Todo o codigo esta disponivel no GitHub. Contribuicoes sao bem-vindas.