一分钟内:熊猫
#初学者 #python #oneminute #pandas

Pandas是一个用于面板数据操作和分析的Python库,例如:统计,实验科学结果,计量经济学或财务的多维时间序列和横截面数据集。
大熊猫主要使用NumPyCython实施;它旨在与基于数字的科学库非常容易地集成,例如statsmodels

pandas是Python的主要数据科学库之一。

pandas允许从各种文件格式导入数据,例如逗号分隔的值,JSON,Parquet,SQL数据库表或查询以及Microsoft Excel。
熊猫允许各种数据操纵操作,例如合并,重塑,选择以及数据清洁以及数据争吵功能。

主要特点:

  • 数据结构:对于一维标记的数据集(分别为SeriesDataFrames)。他们的一些主要特征包括:
  1. 自动对齐数据和插值
  2. 处理计算中缺少观察
  3. 方便的切片和重塑(“ Reindexing”)功能
  4. Categorical data类型
  5. 通过'集合或转换功能提供'组
  6. 合并和加入数据集的工具
  7. 简单的Matplotlib集成用于绘图和图形
  8. Multi-Indexing为允许表示任意数量的尺寸的指数提供结构。
  • 日期工具:表示日期偏移或生成日期范围的对象。日期可以对齐到特定时区,并在WILL上进行转换或比较
  • 统计模型:方便的普通最小二乘和面板OLS实现样本内或滚动时间序列和横截面回归。希望这些将是实施模型的起点
  • 智能Cython卸载;由于这些优化,复杂的计算迅速进行。
  • 静态和移动统计工具:均值,标准偏差,相关性和协方差
  • Rich User Documentation,使用Sphinx

资源和教程:

图书: