Skip to main content
Dados reais do Diario de Justica Eletronico Nacional

Transparencia no Mercado Juridico Brasileiro

Coletamos e arquivamos dados publicos de 96 tribunais brasileiros diariamente. Dados abertos, gratuitos, armazenados permanentemente no Internet Archive.

Dados Reais do Pipeline

Numeros atualizados automaticamente pelo workflow de coleta

3.9K
ZIPs Arquivados
18
Tribunais com Dados
21 GB
Volume Arquivado
100%
Dados Publicos

Como Funciona

Pipeline automatizado coleta dados do DJEN a cada 20 minutos e arquiva permanentemente no Internet Archive

1. Coleta Automatica

A cada 20 minutos, o GitHub Actions coleta publicacoes do DJEN de 96 tribunais brasileiros via proxy dedicado.

2. Arquivo Permanente

Cada ZIP e enviado ao Internet Archive, garantindo acesso publico permanente. Ja temos 3.9K arquivos preservados.

3. Catalogo Indexado

Um catalogo em Parquet e gerado automaticamente, permitindo consultas rapidas sobre os dados coletados.

Para Quem?

Dados abertos para todo o ecossistema juridico

🧑‍⚖️

Pesquisadores

Acesse dados estruturados de publicacoes judiciais para pesquisas academicas e analises juridicas.

  • ✓ Dados em formato Parquet
  • ✓ Consultavel via DuckDB
  • ✓ Historico completo preservado
🏢

LegalTechs

Use como base de dados para construir produtos e servicos no mercado juridico brasileiro.

  • ✓ API via Internet Archive
  • ✓ Atualizacao continua
  • ✓ Sem custos de licenciamento
⚖️

Jornalistas

Investigue e analise dados do judiciario brasileiro com transparencia total.

  • ✓ Dados publicos verificaveis
  • ✓ Cobertura de 96 tribunais
  • ✓ Arquivo permanente no IA
100% Aberto e Gratuito

Dados Abertos Para Sempre

Transparencia no judiciario e um direito de todos.
Os dados coletados pelo CausaGanha sao e sempre serao gratuitos e publicos.

Infraestrutura

GitHub Actions para coleta automatica
Internet Archive para armazenamento permanente
DuckDB + Parquet para consultas rapidas
Codigo 100% open source no GitHub

Apoie o Projeto

O CausaGanha e mantido de forma independente. Contribua com uma estrela no GitHub ou ajude a divulgar o projeto.

Perguntas Frequentes

De onde vem os dados?

Todos os dados sao extraidos do Diario de Justica Eletronico Nacional (DJEN), que e um registro publico de todas as comunicacoes judiciais do Brasil. Coletamos de 96 tribunais.

Com que frequencia os dados sao atualizados?

O pipeline roda a cada 20 minutos via GitHub Actions. Cada execucao coleta novas publicacoes e envia ao Internet Archive. O dashboard e atualizado automaticamente apos cada coleta.

Como posso acessar os dados?

Os dados estao disponiveis no Internet Archive sob o identificador djen-YYYY-MM-DD. O catalogo indexado em formato Parquet pode ser consultado via DuckDB.

O projeto e open source?

Sim! Todo o codigo esta disponivel no GitHub. Contribuicoes sao bem-vindas.