Pandas数据查询的集中实现方法

2023-02-27 17:02:20 pandas 方法 数据查询

Pandas查询数据的几种方法

  • df.loc方法,根据行、列的标签值查询
  • df.iloc方法,根据行、列的数字位置查询
  • df.where方法
  • df.query方法

.loc既能查询,又能覆盖写入,强烈推荐!

Pandas使用df.loc查询数据的方法

  • 使用单个label值查询数据
  • 使用值列表批量查询
  • 使用数值区间进行范围查询
  • 使用条件表达式查询
  • 调用函数查询

以上查询方法,既使用与行,也适用于列

降维:DataFrame>Series>值

0、进行数据预处理

import pandas as pd

df = pd.read_csv("E:\python\dataAnalysis\spider\dataFile\weatherData.csv")
# 设置索引为日期
df.set_index("日期", inplace=True)
# print(df.index)
print(df.head())
# 对最高气温和最低气温进行数值改变
try:
    df.loc[:, "最高气温"] = df["最高气温"].str.replace("℃", "").astype("int32")
    df.loc[:, "最低气温"] = df["最低气温"].str.replace("℃", "").astype("int32")
    print(df.head())
except Warning as dw:
    # print(dw)
    pass

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7QxKZpwB-1677415727650)(file://C:\Users\82391\AppData\Roaming\marktext\images\2023-02-24-16-05-17-image.png?msec=1677399444378)]

1、使用单个label值查询数据

行或者列,都可以只传入单个值,实现精确匹配

# 使用单个label值查询数据
print(df.loc['2022-12-05 星期一', ['天气', '风向']])
print(type(df.iloc[12]))

在这里插入图片描述

2、使用值列表批量查询

# 使用值列表批量查询
print(df.loc[['2022-12-04 星期日', '2022-12-05 星期一']])

在这里插入图片描述

3、使用数值区间进行范围查询

区间:包含开始,也包含结束

# 使用数值区间进行范围查询
print(df.loc['2022-12-04 星期日':'2022-12-07 星期二', '最高气温':'天气'])

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Hz1fbXlu-1677415727653)(file://C:\Users\82391\AppData\Roaming\marktext\images\2023-02-24-17-22-29-image.png?msec=1677399444379)]

4、使用条件表达式查询

bool列表的长度得等于行数或者列数

# 使用条件表达式查询
print(df.loc[df["最高气温"] > 7, :])

在这里插入图片描述

5、调用函数查询

# 调用函数查询
print(df.loc[lambda df: (df["最高气温"] < 20) & (df["最低气温"] >= 0), :])

到此这篇关于Pandas数据查询的集中实现方法的文章就介绍到这了,更多相关Pandas数据查询内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!

相关文章