将 JSON 转换为 Pandas DataFrame
本文将介绍如何将 JSON 转换为 Pandas DataFrame。
JSON 是 JavaScript Object Notation 的缩写,它是基于 JavaScript 中对象的格式,是一种表示结构化数据的编码技术。它是基于 JavaScript 中对象的格式,是一种表示结构化数据的编码技术。目前,它被广泛使用,特别是在服务器和 Web 应用程序之间共享数据。
由于它的简单性和受编程语言数据结构的影响,JSON 正变得非常流行。它比较容易理解,下面是一个简单的 API 的 JSON 响应的例子。
{
"Results":
[
{ "id": "01", "Name": "Jay" },
{ "id": "02", "Name": "Mark" },
{ "id": "03", "Name": "Jack" }
],
"status": ["ok"]
}
在我们的例子中可以看到,JSON 在某种程度上似乎是嵌套列表和字典的结合,因此,从 JSON 文件中提取数据,甚至将其存储为 Pandas DataFrame 是比较容易的。
Python 中的 Pandas 和 JSON 库可以帮助实现这个功能。我们有两个函数 read_json()
和 json_normalize()
可以帮助将 JSON 字符串转换为 DataFrame。
使用 json_normalize()
将 JSON 转换为 Pandas DataFrame
json_normalize()
函数被非常广泛地用于读取嵌套的 JSON 字符串并返回一个 DataFrame。要使用这个函数,我们首先需要使用 Python 中 JSON 库中的 json.loads()
函数来读取 JSON 字符串,然后我们将这个 JSON 对象传递给 json_normalize()
,它将返回一个包含所需数据的 Pandas DataFrame。
import pandas as pd
import json
from pandas import json_normalize
data = """
{
"Results":
[
{ "id": "1", "Name": "Jay" },
{ "id": "2", "Name": "Mark" },
{ "id": "3", "Name": "Jack" }
],
"status": ["ok"]
}
"""
info = json.loads(data)
df = json_normalize(info["Results"]) # Results contain the required data
print(df)
输出:
id Name
0 1 Jay
1 2 Mark
2 3 Jack
使用 read_json()
将 JSON 转换为 Pandas DataFrame
另一个将 JSON 转换为 DataFrame 的 Pandas 函数是 read_json()
,用于简单的 JSON 字符串。我们可以直接将 JSON 文件的路径或 JSON 字符串传递给函数,以便将数据存储在 Pandas DataFrame 中。read_json()
有很多参数,其中 orient
指定 JSON 字符串的格式。
缺点是它很难与嵌套的 JSON 字符串一起使用。因此,为了使用 read_json()
,我们将使用一个简单得多的例子,如下所示。
import pandas as pd
data = """
{
"0":{
"Name": "Jay",
"Age": "17"
},
"1":{
"Name": "Mark",
"Age": "15"
},
"2":{
"Name": "Jack",
"Age":"16"
}
}
"""
df = pd.read_json(data, orient="index")
print(df)
输出:
Name Age
0 Jay 17
1 Mark 15
2 Jack 16
我们将 orient
设置为 'index'
,因为 fromat 的 JSON 字符串匹配的模式是 {index : {column: value}}
。
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn相关文章 - Pandas DataFrame
- 如何将 Pandas DataFrame 列标题获取为列表
- 如何删除 Pandas DataFrame 列
- 如何在 Pandas 中将 DataFrame 列转换为日期时间
- 如何在 Pandas DataFrame 中将浮点数转换为整数
- 如何按一列的值对 Pandas DataFrame 进行排序
- 如何用 group-by 和 sum 获得 Pandas 总和