Python 导入文件并进行转换
使用python和pandas,我希望实现以下目标: 我有大约600个json文件,文件格式如下:Python 导入文件并进行转换,python,json,pandas,dataframe,Python,Json,Pandas,Dataframe,使用python和pandas,我希望实现以下目标: 我有大约600个json文件,文件格式如下: User Name: ǝuuǝıɹpɐ\nAll Tags: Delightful Followers\t|\tlibtards\t........|\tExpressionEngine\t|\t\nYour Tag: 我想为所有文件创建一个熊猫数据框,并使其看起来像这样 User name All Tags Y
User Name: ǝuuǝıɹpɐ\nAll Tags: Delightful Followers\t|\tlibtards\t........|\tExpressionEngine\t|\t\nYour Tag:
我想为所有文件创建一个熊猫数据框,并使其看起来像这样
User name All Tags Your tag
ǝuuǝıɹpɐ Delightful Followers\t|\tlibtards\t....
. .
. .
我尝试使用以下代码:
data = pd.read_csv('D:/datasets/edx1/word_cloud/557563.json', sep="\n", header=None)
这给了我以下的数据帧
0 User Name: ǝuuǝıɹpɐ
1 All Tags: Delightful Followers\t|\tlibtards\t|...
2 Your Tag:
另外,我也不知道为什么json文件看起来是这样的,在线阅读它说json文件是字典,但这里似乎不是这样。1)迭代文件,例如在输入目录上使用os.listdir()
:
2) 对于每个文件,打开
(具体过程取决于您的Py版本),并使用json模块中的json.load()
将文件转换为Python字典。这将把json
转换成标准的dict
3) 您可以使用
from_dict()
::,将这些字典转换为数据帧 我不认为它是一种json
格式,请看问题中的示例。是的,因此文件类型表示它是json,但格式与之完全不同,我一直使用open('filename')导入它们。@sKwa Dang确实如此。我没有仔细看它。很好的调用。@AasheetKumar是的,因此如果它不是实际的JSON,load()
将无法工作。