Pandas DataFrame读取json数据的方法

2023-02-24 00:00:00 数据 读取 方法

在 Pandas 中,可以使用 read_json() 函数将 JSON 格式的数据读取为 Pandas 数据框。

以下是一个示例:

假设有一个名为 data.json 的 JSON 文件,内容如下:

{
    "students": [
        {"name": "Alice", "age": 20, "gender": "female"},
        {"name": "Bob", "age": 21, "gender": "male"},
        {"name": "Charlie", "age": 19, "gender": "male"}
    ]
}

使用 read_json() 函数将该文件读取为 Pandas 数据框的示例代码如下:

import pandas as pd

# 读取 JSON 文件为 Pandas 数据框
df = pd.read_json('data.json')

# 打印输出数据框
print(df)

在上述代码中,首先使用 pd.read_json() 函数读取名为 data.json 的 JSON 文件,并将其存储在变量 df 中。然后,使用 print() 函数打印输出了数据框的内容。

需要注意的是,在读取 JSON 数据时,如果数据结构比较复杂,可能需要通过 orient 参数指定数据的方向。默认情况下,该参数的值为 'columns',表示按列方向读取数据。如果数据以行的形式存储,可以将 orient 参数的值设置为 'index'。

例如,假设有一个名为 data.json 的 JSON 文件,内容如下:

[
    {"name": "Alice", "age": 20, "gender": "female"},
    {"name": "Bob", "age": 21, "gender": "male"},
    {"name": "Charlie", "age": 19, "gender": "male"}
]

使用 read_json() 函数将该文件读取为 Pandas 数据框的示例代码如下:

import pandas as pd

# 读取 JSON 文件为 Pandas 数据框
df = pd.read_json('data.json', orient='index')

# 打印输出数据框
print(df)

在上述代码中,通过将 orient 参数的值设置为 'index',将 JSON 数据按行方向读取为 Pandas 数据框。

相关文章