Tratando Valores Nulos — Pandas vs Polars
Publicado:
Atualizado:
PorJeferson Peter
1 min de leituraPolars & Pandas
Imagine que você está trabalhando com um conjunto de dados que possui valores ausentes em algumas colunas.
Como limpá-los ou preenchê-los? Pandas e Polars oferecem ferramentas simples para tratar nulos.
Dados de exemplo
import pandas as pd
import polars as pl
import numpy as np
dados = {"nome": ["Alice", "Bob", None], "nota": [10, None, 30]}
df_pd = pd.DataFrame(dados)
df_pl = pl.DataFrame(dados)
Removendo nulos
# Pandas
print(df_pd.dropna())
# nome nota
# 0 Alice 10.0
# Polars
print(df_pl.drop_nulls())
# shape: (1, 2)
# ┌───────┬───────┐
# │ nome ┆ nota │
# │ --- ┆ --- │
# │ str ┆ i64 │
# ╞═══════╪═══════╡
# │ Alice ┆ 10 │
# └───────┴───────┘
Preenchendo nulos
# Pandas
print(df_pd.fillna({"nome": "Desconhecido", "nota": 0}))
# nome nota
# 0 Alice 10.0
# 1 Bob 0.0
# 2 Desconhecido 30.0
# Polars
print(df_pl.fill_null(strategy="forward"))
# shape: (3, 2)
# ┌───────┬───────┐
# │ nome ┆ nota │
# │ --- ┆ --- │
# │ str ┆ i64 │
# ╞═══════╪═══════╡
# │ Alice ┆ 10 │
# │ Bob ┆ 10 │
# │ Bob ┆ 30 │
# └───────┴───────┘
Conclusão
- Pandas:
dropna(),fillna()são os principais métodos. - Polars:
drop_nulls(),fill_null()oferecem funcionalidade semelhante. - Ambos fornecem opções flexíveis para lidar com valores ausentes de forma eficiente.