Pandas DataFrame读取json数据的方法
在 Pandas 中,可以使用 read_json() 函数将 JSON 格式的数据读取为 Pandas 数据框。
以下是一个示例:
假设有一个名为 data.json 的 JSON 文件,内容如下:
{ "students": [ {"name": "Alice", "age": 20, "gender": "female"}, {"name": "Bob", "age": 21, "gender": "male"}, {"name": "Charlie", "age": 19, "gender": "male"} ] }
使用 read_json() 函数将该文件读取为 Pandas 数据框的示例代码如下:
import pandas as pd # 读取 JSON 文件为 Pandas 数据框 df = pd.read_json('data.json') # 打印输出数据框 print(df)
在上述代码中,首先使用 pd.read_json() 函数读取名为 data.json 的 JSON 文件,并将其存储在变量 df 中。然后,使用 print() 函数打印输出了数据框的内容。
需要注意的是,在读取 JSON 数据时,如果数据结构比较复杂,可能需要通过 orient 参数指定数据的方向。默认情况下,该参数的值为 'columns',表示按列方向读取数据。如果数据以行的形式存储,可以将 orient 参数的值设置为 'index'。
例如,假设有一个名为 data.json 的 JSON 文件,内容如下:
[ {"name": "Alice", "age": 20, "gender": "female"}, {"name": "Bob", "age": 21, "gender": "male"}, {"name": "Charlie", "age": 19, "gender": "male"} ]
使用 read_json() 函数将该文件读取为 Pandas 数据框的示例代码如下:
import pandas as pd # 读取 JSON 文件为 Pandas 数据框 df = pd.read_json('data.json', orient='index') # 打印输出数据框 print(df)
在上述代码中,通过将 orient 参数的值设置为 'index',将 JSON 数据按行方向读取为 Pandas 数据框。
相关文章