A ANP (Agência Nacional do Petróleo, Gás Natural e Biocombustíveis) disponibiliza dados abertos sobre a indústria de petróleo, gás e combustíveis no Brasil. Os principais conjuntos de dados incluem:
Levantamento de Preços de Combustíveis — preços semanais de gasolina, etanol, diesel, GNV e GLP em postos de revenda de todo o Brasil
Produção de Petróleo e Gás — volumes de produção por campo, bacia, operador
Boletim de Produção — dados mensais de produção de petróleo e gás natural
Distribuição de combustíveis — volumes comercializados por distribuidora
Biocombustíveis — produção de etanol e biodiesel por usina
Royalties — valores pagos às entidades beneficiárias
O Levantamento de Preços é um dos datasets mais utilizados, cobrindo ~27.000 postos pesquisados semanalmente.
import pandas as pd# Download da série histórica de preços# https://dados.gov.br/dados/conjuntos-dados/serie-historica-de-precos-de-combustiveis-e-de-glpdf = pd.read_csv( "precos_combustiveis_2024_01.csv", sep=";", encoding="utf-8", dtype=str, decimal=",")print(f"Total de registros: {len(df):,}")print(f"Colunas: {list(df.columns)}")# Converter preço para numéricodf["Valor de Venda"] = pd.to_numeric( df["Valor de Venda"].str.replace(",", "."), errors="coerce")# Preço médio da gasolina por UFgasolina = df[df["Produto"] == "GASOLINA COMUM"]media_uf = ( gasolina.groupby("Estado - Sigla")["Valor de Venda"] .mean() .sort_values(ascending=False))print("\nPreço médio da gasolina por UF (R$/litro):")print(media_uf.round(3))