Python csv中包含html格式数据的行读取问题
我有一个html文件,其中包含一个表。表中的行总数约为3500。我想读取和打印具有相同值的行。html数据的PFA图像。 我将数据转换成csv格式,在那里我可以看到html格式的相同数据。 如图所示。我想打印并将包含“MyData”的所有行写入另一个CSV,然后需要将其发送。 我试过使用Soupbeautiful,但没有得到结果。 我尝试使用CSV和Pandas,但没有返回预期的输出。 我的python代码如下Python csv中包含html格式数据的行读取问题,python,pandas,numpy,csv,data-science,Python,Pandas,Numpy,Csv,Data Science,我有一个html文件,其中包含一个表。表中的行总数约为3500。我想读取和打印具有相同值的行。html数据的PFA图像。 我将数据转换成csv格式,在那里我可以看到html格式的相同数据。 如图所示。我想打印并将包含“MyData”的所有行写入另一个CSV,然后需要将其发送。 我试过使用Soupbeautiful,但没有得到结果。 我尝试使用CSV和Pandas,但没有返回预期的输出。 我的python代码如下 import csv import numpy as np import panda
import csv
import numpy as np
import pandas as pd
import sys
csv.field_size_limit(sys.maxsize)
df = pd.read_csv('test.csv')
data = print (df.iloc[0:5])
我试过的另一个代码
search_string = "MyData"
with open('test.csv') as f, open('test2.csv', 'w') as g:
reader = csv.reader(f)
next(reader, None) # discard the header
writer = csv.writer(g)
for row in reader:
if row[2] == search_string:
writer.writerow(row[:2])
print(row)
当我从info\u data输入完整的行时,它会给出特定的行,但不会给出字符串“MyData”所在的其他行。
谢谢 您当前正在测试条目是否与搜索字符串完全匹配。该条目包含一个JSON字符串,因此您可以在中使用
,查看它是否包含搜索字符串
,而不是与之完全匹配,例如:
search_string = "MyData"
with open('test.csv') as f, open('test2.csv', 'w') as g:
reader = csv.reader(f)
next(reader, None) # discard the header
writer = csv.writer(g)
for row in reader:
if search_string in row[2]:
writer.writerow(row[:2])
print(row)
然后,您需要添加代码以进一步解码JSON数据。print()
始终返回None
因此codedata=print(df.iloc[0:5])
表示data=None
。您需要data=df.iloc[0:5]
df[df[“Info\u data”].str.contains(“MyData”)].to_csf(“output.csv”)
?但只有在Info\u data
中有字符串时,才可以使用字符串列出。将数据作为文本放置,或者最好使用数据创建最小的工作代码,以便我们可以运行它。如果在第[2]行中搜索字符串,请尝试:
,因为您当前正在查找精确的匹配项