Python csv中包含html格式数据的行读取问题

Python csv中包含html格式数据的行读取问题,python,pandas,numpy,csv,data-science,Python,Pandas,Numpy,Csv,Data Science,我有一个html文件,其中包含一个表。表中的行总数约为3500。我想读取和打印具有相同值的行。html数据的PFA图像。 我将数据转换成csv格式,在那里我可以看到html格式的相同数据。 如图所示。我想打印并将包含“MyData”的所有行写入另一个CSV,然后需要将其发送。 我试过使用Soupbeautiful,但没有得到结果。 我尝试使用CSV和Pandas,但没有返回预期的输出。 我的python代码如下 import csv import numpy as np import panda

我有一个html文件,其中包含一个表。表中的行总数约为3500。我想读取和打印具有相同值的行。html数据的PFA图像。 我将数据转换成csv格式,在那里我可以看到html格式的相同数据。 如图所示。我想打印并将包含“MyData”的所有行写入另一个CSV,然后需要将其发送。 我试过使用Soupbeautiful,但没有得到结果。 我尝试使用CSV和Pandas,但没有返回预期的输出。 我的python代码如下

import csv
import numpy as np
import pandas as pd
import sys
csv.field_size_limit(sys.maxsize)    
df = pd.read_csv('test.csv')    
data = print (df.iloc[0:5])
我试过的另一个代码

search_string = "MyData"
 with open('test.csv') as f, open('test2.csv', 'w') as g:
    reader = csv.reader(f)
    next(reader, None) # discard the header
    writer = csv.writer(g)
    for row in reader:
        if row[2] == search_string:
            writer.writerow(row[:2])
            print(row)  
当我从info\u data输入完整的行时,它会给出特定的行,但不会给出字符串“MyData”所在的其他行。
谢谢

您当前正在测试条目是否与搜索字符串完全匹配。该条目包含一个JSON字符串,因此您可以在中使用
,查看它是否包含
搜索字符串
,而不是与之完全匹配,例如:

search_string = "MyData"

with open('test.csv') as f, open('test2.csv', 'w') as g:
    reader = csv.reader(f)
    next(reader, None) # discard the header
    writer = csv.writer(g)

    for row in reader:
        if search_string in row[2]:
            writer.writerow(row[:2])
            print(row)  

然后,您需要添加代码以进一步解码JSON数据。

print()
始终返回
None
因此code
data=print(df.iloc[0:5])
表示
data=None
。您需要
data=df.iloc[0:5]
df[df[“Info\u data”].str.contains(“MyData”)].to_csf(“output.csv”)
?但只有在
Info\u data
中有字符串时,才可以使用字符串列出。将数据作为文本放置,或者最好使用数据创建最小的工作代码,以便我们可以运行它。如果在第[2]行中搜索字符串,请尝试
,因为您当前正在查找精确的匹配项