Os microdados de Benefícios do INSS (Instituto Nacional do Seguro Social) compreendem informações sobre todos os benefícios previdenciários e assistenciais concedidos e mantidos pelo sistema de seguridade social brasileiro. Os dados são processados pela DATAPREV (Empresa de Tecnologia e Informações da Previdência) e disponibilizados no portal de dados abertos do governo federal.
Os dados cobrem:
Benefícios previdenciários — aposentadorias (por idade, tempo de contribuição, invalidez), pensões por morte, auxílio-doença, auxílio-acidente, salário-maternidade
Benefícios assistenciais (BPC/LOAS) — Benefício de Prestação Continuada para idosos e pessoas com deficiência
Benefícios concedidos — novos benefícios deferidos no mês
Benefícios cessados — benefícios encerrados no mês
Estoque de benefícios — total de benefícios ativos (emitidos em folha de pagamento)
import pandas as pd# Baixar o CSV do portal dados.gov.br# Exemplo: benefícios concedidos em dezembro/2024url = "https://dados.gov.br/dados/conjuntos-dados/inss-beneficios-concedidos"# Após download manual do CSVdf = pd.read_csv( "beneficios_concedidos_202412.csv", sep=";", encoding="latin-1", dtype=str, decimal=",")print(f"Total de benefícios concedidos: {len(df):,}")print(f"Colunas: {list(df.columns)}")# Distribuição por espécie de benefíciocontagem = df["ESPECIE"].value_counts().head(10)print("\nTop 10 espécies de benefício:")print(contagem)
import pandas as pddf = pd.read_csv( "beneficios_emitidos_202412.csv", sep=";", encoding="latin-1", dtype=str, decimal=",")# Converter valor para numéricodf["VALOR"] = pd.to_numeric( df["VALOR"].str.replace(".", "").str.replace(",", "."), errors="coerce")# Total de benefícios e valor médio por UFresumo = ( df.groupby("UF") .agg( total_beneficios=("VALOR", "count"), valor_medio=("VALOR", "mean"), valor_total=("VALOR", "sum"), ) .sort_values("total_beneficios", ascending=False))print("Benefícios emitidos por UF:")print(resumo.head(10))
Os microdados públicos são agregados (não contêm CPF ou dados individuais). Para análises individuais, é necessário acesso via pesquisador credenciado.
Defasagem temporal
Os dados são publicados com ~2 meses de atraso em relação ao mês de competência.
Formato inconsistente
O formato dos CSVs (encoding, separador, nome de colunas) pode variar entre diferentes períodos.
URLs instáveis
Os links de download no dados.gov.br podem mudar periodicamente.
Sem API REST
Não existe API de consulta. Os dados são disponibilizados apenas como arquivos CSV para download.
BPC em base separada
O Benefício de Prestação Continuada (BPC/LOAS) pode estar em conjuntos de dados separados dos benefícios previdenciários.
Revisões retroativas
Os dados de meses anteriores podem ser revisados sem aviso prévio, especialmente benefícios com decisão judicial.