O Censo Demográfico do IBGE (Instituto Brasileiro de Geografia e Estatística) é a mais ampla pesquisa estatística do Brasil, realizada a cada 10 anos, que conta toda a população do país e coleta informações sobre:
População — contagem total, distribuição por sexo, idade, cor/raça, nacionalidade
Renda — rendimento domiciliar, rendimento per capita, fontes de renda
Trabalho — ocupação, posição na ocupação, setor de atividade
Migração — lugar de nascimento, migração recente
Pessoas com deficiência — tipo e grau de dificuldade
O Censo 2022 (realizado em agosto de 2022) é o mais recente, com resultados sendo divulgados progressivamente pelo IBGE. Os dados estão disponíveis tanto via API SIDRA/Agregados quanto via download de microdados.
import requestsimport pandas as pd# População residente por município (Censo 2022)# Tabela 4714 — População residenteurl = ( "https://servicodados.ibge.gov.br/api/v3/agregados/4714" "/periodos/2022/variaveis/93" "?localidades=N6[all]")response = requests.get(url)response.raise_for_status()dados = response.json()# Extrair dadosregistros = []for resultado in dados[0]["resultados"]: for local_id, valor in resultado["series"][0]["serie"].items(): pass # Estrutura aninhada — veja abaixo# Alternativa mais prática: usar a API SIDRAurl_sidra = ( "https://apisidra.ibge.gov.br/values/t/4714/n6/all/v/93/p/2022")response = requests.get(url_sidra)response.raise_for_status()dados = response.json()# Converter para DataFramedf = pd.DataFrame(dados[1:], columns=[d for d in dados[0].values()])print(f"Total de municípios: {len(df):,}")print(df[["Município", "Valor"]].head(10))
import sidrapy# População por sexo e idade — todos os municípiosdados = sidrapy.get_table( table_code="4714", territorial_level="6", # Município ibge_territorial_code="all", variable="93", # População residente period="2022",)print(f"Total de registros: {len(dados):,}")print(dados[["D1N", "V"]].head(10)) # D1N=Nome do município, V=Valor
O Censo é realizado a cada 10 anos. Dados intercensitários dependem de estimativas e da PNAD.
Divulgação progressiva
Os resultados do Censo 2022 estão sendo divulgados por temas ao longo de 2023-2025. Nem todas as variáveis estão disponíveis na API ainda.
Microdados pesados
Os microdados do Censo são extremamente volumosos (dezenas de GB). Processamento exige infraestrutura robusta.
Dados amostrais
Variáveis detalhadas (renda, migração, trabalho) são coletadas por amostragem, não universo. Estimativas municipais de municípios pequenos têm maior margem de erro.
API pode ser lenta
Consultas a nível municipal para todo o Brasil podem demorar vários segundos.
Código de município
O IBGE usa código de 7 dígitos. Algumas fontes usam 6 dígitos (sem dígito verificador). É necessário harmonizar.
Setores censitários
Dados por setor censitário (nível mais detalhado) são disponibilizados com maior atraso e em formatos diferentes.