Os DOEs (Diários Oficiais dos Estados) são os veículos oficiais de publicação dos atos dos governos estaduais brasileiros. Cada estado possui seu próprio diário oficial, publicando:
Atos de pessoal — nomeações, exonerações, aposentadorias de servidores estaduais
Licitações e contratos — editais, resultados de licitações, contratos
Poder Judiciário — decisões, despachos, intimações dos tribunais de justiça
Órgãos estaduais — atos de secretarias, autarquias e fundações estaduais
O acesso aos DOEs é fragmentado, com cada estado mantendo seu próprio portal. O projeto Querido Diário, da Open Knowledge Brasil, é a principal iniciativa de consolidação e disponibilização estruturada de diários oficiais, com foco em diários municipais (370+ municípios cobertos). A cobertura de diários estaduais é complementar.
Importante: O Querido Diário foca primariamente em diários municipais. A cobertura de diários estaduais é limitada e depende dos portais próprios de cada estado.
import requestsBASE_URL = "https://api.queridodiario.ok.org.br"response = requests.get(f"{BASE_URL}/cities")response.raise_for_status()cidades = response.json()["cities"]print(f"Municípios cobertos: {len(cidades)}")# Filtrar por estadosp = [c for c in cidades if c.get("state_code") == "SP"]print(f"Municípios de SP cobertos: {len(sp)}")for cidade in sp[:5]: print(f" {cidade['territory_name']} ({cidade['territory_id']})")
O Querido Diário cobre primariamente diários municipais (370+ de 5.570 municípios, ~6,6%). A cobertura de diários estaduais é limitada.
Fragmentação
Cada estado e município tem seu próprio portal, sem padronização de formato ou estrutura.
Formato PDF
A maioria dos diários originais é publicada em PDF, exigindo OCR/extração de texto para análise programática.
Sem API oficial dos estados
A maioria dos estados não oferece API oficial para seus diários. O Querido Diário é a principal alternativa programática.
Qualidade da extração
A extração de texto de PDFs pelo Querido Diário pode conter erros de OCR, especialmente em edições mais antigas ou de menor qualidade.
Sem padronização de atos
Cada estado/município classifica seus atos de forma diferente, dificultando comparações automáticas.
Portais estaduais instáveis
Muitos portais de diários oficiais estaduais apresentam instabilidade e funcionalidades limitadas de busca.
Sem dados estruturados
Os diários oficiais são texto livre. Não há campos estruturados padronizados (valores, CNPJs, datas) — a extração de informações específicas requer processamento de linguagem natural.