2020.7.21 Pandas

发布于 2020-07-21  25 次阅读


Table of Contents

  • 1.创建DataFrame
    • DataFrame类似numpy的二维数组
    • pd.DataFrame(ndarray)
    • shape,index,columns,values,T
    • head,tail 获取前几行,后几行
  • 2.对应日期创建
    • pd.date_range()
      • start – 开始日期 字符串
      • end – 结束日期
      • periods -- 时间跨度
      • freq – 时间统计方式
  • DataFrame介绍(类比二维数组)

    • 对象属性方式(index不可以修改值,别的没试)
      • shape 获取形状
      • index 获取行索引
      • columns 获取列索引
      • values 获取数据 ndarry数组
      • T 转置
      • head() tail() 获取前几行,后几行
    • dataframe 设置索引
      • 1.修改行列索引必须整体设置
      • 2.重设索引
        • 对象.reset_index()
      • 3.设置新索引
        • 对象.set_index()
        • 如果设置索引是两个的 就是MultiIndex
  • MultiIndex和pannel(类比三维数组)

    • MultiIndex
      • 对象.index
      • 对象.index.names
    • panel 已经弃用
      • 直接没法查看值
      • p[:,:,”frist”=L]
  • Series(类比一维数组)

    • series结构只有行索引
    • 数据对象[‘行索引’][‘具体索引’]
    • 创建(数据是ndarray)
      • pd.Series([数据])
      • pd.Series([数据],index=[索引值])
      • pd.Series({red:10,green:20})
    • 属性
      • series.index
      • series.values
  • 2.扩展延伸知识

    3.灵感代办

    4.复习内容

    5.学习成果&问题