pandas (software)

Origem: Wikipédia, a enciclopédia livre.


pandas
Pandas logo.svg
Autor Wes McKinney
Desenvolvedor projeto comunitário
Plataforma Multiplataforma
Lançamento 11 de janeiro de 2008 (13 anos)
Versão estável 1.2.3[1] (2 de março de 2021; há 2 meses)
Sistema operacional Multiplataforma
Licença BSD
Estado do desenvolvimento corrente
Página oficial pandas.pydata.org

Em programação de computadores, pandas é uma biblioteca de software criada para a linguagem Python para manipulação e análise de dados. Em particular, oferece estruturas e operações para manipular tabelas numéricas e séries temporais. É software livre sob a licensa licença BSD.[2] O nome é derivado do termo inglês "panel data"(dados em painel), um termo usado em estatística e econometria para conjunto de dados que incluem várias unidades amostrais (indivíduos, empresas, etc) acompanhadas ao longo do tempo.[3]

Características[editar | editar código-fonte]

  • Uso do objeto "DataFrame" para manipulação de dados, com indexação integrada.
  • Ferramentas para ler e escrever dados entre diferentes estruturas de dados e formatos de arquivo.
  • Alinhamento de dados e manipulação de dados ausentes.
  • Reformatação e pivoteamento de matrizes (dados).
  • Divisão (slicing), fancy indexing, e subsettingde grandes conjuntos de dados.
  • Inserir e deletar colunas em conjuntos de dados.
  • Ferramentas para fundir(merging) ou juntar(join) conjuntos de dados.
  • Funcionalide para séries temporais (time series): Geração de intervalo de datas(date range)[4] e conversão de frequência, estatística móvel, regressão linear, entre outras.
  • Filtração e limpeza de dados.

Altamente otimizada para performance, a biblioteca pandas tem fortes bases nas linguagens Cython e C.[5]

Dataframes[editar | editar código-fonte]

Pandas é principalmente usado para machine learning(aprendizado de máquina), pela facilidade que o objeto dataframes oferece. Pandas permite a importação de diferentes formatos de arquivo, como csv e excel, para a leitura em dataframes. Também permite diversas operações de álgebra relacional, como projeção, junção, e concatenação, e também funções de limpeza, como por exemplo o preenchimento, substituição ou inserção de valores nulos (null).

História[editar | editar código-fonte]

O desenvolvedor Wes McKinney começou a desenvolver a Pandas em 2008, enquanto trabalhava na empresa AQR Capital Management. A ideia veio quando ele percebeu a necessidade de uma ferramenta flexível e de alta performance para realizar análise quantitativa em dados financeiros. Antes de deixar a AQR, Wes conseguiu convencer a direção da empresa a permití-lo liberar a biblioteca como open-source.

Outro funcionário da AQR, o desenvolvedor Chang She, se tornou em 2012 o segundo maior contribuidor para a biblioteca Pandas.

Ver também[editar | editar código-fonte]

Referências

  1. «What's new in 1.2.3». pandas. 2 de março de 2021. Consultado em 8 de março de 2021 
  2. «License – Package overview – pandas 1.0.0 documentation». pandas. 28 de Janeiro de 2020. Consultado em 30 de Janeiro de 2020 
  3. Wes McKinney (2011). «pandas: a Foundational Python Library for Data Analysis and Statistics» (PDF). Consultado em 2 Agosto de 2018 
  4. «pandas.date_range – pandas 1.0.0 documentation». pandas. 29 de Janeiro de 2020. Consultado em 30 de Janeiro de 2020 
  5. «Python Data Analysis Library – pandas: Python Data Analysis Library». pandas 

Ligações externas[editar | editar código-fonte]