Criando DataFrames em Pandas vs Polars

Publicado:
Atualizado:
PorJeferson Peter
2 min de leitura
Polars & Pandas
Compartilhe este post:

Criar um DataFrame é frequentemente o primeiro passo em qualquer fluxo de análise de dados.
Enquanto o Pandas é a biblioteca mais utilizada, o Polars vem ganhando espaço pela velocidade e sintaxe limpa.
Veja como criar DataFrames nas duas bibliotecas, lado a lado.


De um dicionário de listas

# Pandas
import pandas as pd

dados = {"nome": ["Alice", "Bob"], "idade": [25, 30]}
df_pd = pd.DataFrame(dados)
print(df_pd)

#    nome  idade
# 0  Alice     25
# 1    Bob     30

# Polars
import polars as pl

dados = {"nome": ["Alice", "Bob"], "idade": [25, 30]}
df_pl = pl.DataFrame(dados)
print(df_pl)

# shape: (2, 2)
# ┌───────┬────────┐
# │ nome  ┆ idade  │
# │ ---   ┆ ---    │
# │ str   ┆ i64    │
# ╞═══════╪════════╡
# │ Alice ┆ 25     │
# │ Bob   ┆ 30     │
# └───────┴────────┘

✔ Ambas aceitam um dicionário de listas, mas o Polars imprime em um formato tabular mais rico.


De uma lista de dicionários (registros)

# Pandas
registros = [{"nome": "Alice", "idade": 25}, {"nome": "Bob", "idade": 30}]
df_pd = pd.DataFrame(registros)
print(df_pd)

#    nome  idade
# 0  Alice     25
# 1    Bob     30

# Polars
registros = [{"nome": "Alice", "idade": 25}, {"nome": "Bob", "idade": 30}]
df_pl = pl.DataFrame(registros)
print(df_pl)

# shape: (2, 2)
# ┌───────┬────────┐
# │ nome  ┆ idade  │
# │ ---   ┆ ---    │
# │ str   ┆ i64    │
# ╞═══════╪════════╡
# │ Alice ┆ 25     │
# │ Bob   ┆ 30     │
# └───────┴────────┘

✔ Comportamento muito semelhante nas duas bibliotecas.


De uma lista de listas com nomes de colunas

# Pandas
df_pd = pd.DataFrame([[1, "A"], [2, "B"]], columns=["id", "rotulo"])
print(df_pd)

#    id rotulo
# 0   1      A
# 1   2      B

# Polars
df_pl = pl.DataFrame([[1, "A"], [2, "B"]], schema=["id", "rotulo"])
print(df_pl)

# shape: (2, 2)
# ┌─────┬────────┐
# │ id  ┆ rotulo │
# │ --- ┆ ---    │
# │ i64 ┆ str    │
# ╞═════╪════════╡
# │ 1   ┆ A      │
# │ 2   ┆ B      │
# └─────┴────────┘

✔ Pandas usa columns=..., Polars usa schema=....


Conclusão

  • Pandas e Polars compartilham sintaxe muito semelhante para criar DataFrames.
  • Polars fornece uma saída mais rica e melhor performance em grandes volumes de dados.
  • Se você já conhece Pandas, migrar para Polars é bem natural.

👉 Próximo passo: no próximo post, vamos ver como selecionar linhas e colunas em ambas as bibliotecas.

Compartilhe este post: