Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/285.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python-清理.txt文件中的数据?_Python_Pandas_Dataframe_Data Science_Data Analysis - Fatal编程技术网

Python-清理.txt文件中的数据?

Python-清理.txt文件中的数据?,python,pandas,dataframe,data-science,data-analysis,Python,Pandas,Dataframe,Data Science,Data Analysis,将熊猫作为pd导入 导入操作系统 将numpy作为np导入 进口稀土 #加载数据 df=pd.read_fwf('receipt.txt') 数据=df.替换(“£”和“”) 打印(数据)您可以查看正则表达式(RegEx)模块re 重新导入 string=“测试时使用:,:,-” 新字符串=re.sub('[£:-]','',字符串) 打印(新字符串)#使用、、测试,, 有一些很好的例子,您可以使用字符串替换,只需将不需要的字符串替换为空字符串“”,实际上就是删除它们 例如: str.repl

将熊猫作为pd导入
导入操作系统
将numpy作为np导入
进口稀土
#加载数据
df=pd.read_fwf('receipt.txt')
数据=df.替换(“£”和“”)

打印(数据)
您可以查看正则表达式(RegEx)模块re

重新导入
string=“测试时使用:,:,-”
新字符串=re.sub('[£:-]','',字符串)
打印(新字符串)#使用、、测试,,

有一些很好的例子,

您可以使用字符串替换,只需将不需要的字符串替换为空字符串“”,实际上就是删除它们

例如:

str.replace("unwanted", "")

如果在代码的每一次运行中都不必这样做,请考虑脚本之外的数据清理,用一个简单的shell“TR -D”来定义这一点。 (假设使用Linux/OSX)

您可以执行以下操作:

readfilestr.replace("[the text to remove goes here]", "")

如果你发布的是真实的文件,而不是截图,那会更好。记住,如果你让人们更难帮助你,你就不太可能得到帮助。这能回答你的问题吗?谢谢你的小费!我试图附加.txt文件,但似乎没有上传文件的地方,我参考了您发送和接收的链接错误-'DataFrame'对象没有属性'str',谢谢,我得到了错误-替换预期至少2个参数,得到1I应该提到“str”是您的字符串变量。如果您遇到任何错误,请粘贴您的代码这是txt文件中的数据:£2800.0200-06-08 19:48:28.975953£500.0200-06-08 19:48:47.833899£800.0200-06-08 19:49:45.017243i仍然获取-'empty data frame'@Rimi您正在执行此操作吗?因为必须对字符串变量执行此操作。将文件作为文本加载并应用修复程序,将其保存在某个位置,然后将新文件作为数据帧再次加载谢谢我得到了以下空数据帧列:[2800.0200-06-08,19:48:28.975953,500.0200-06-08,19:48:47.833899,800.0200-06-08,19:49:45.017243]索引:[]如果要从列表中的每个项目中删除这些符号,则可以执行for循环:for i in len(mylist):If mylist[i]。\uu包含\(“[不需要的]”):mylist[i]=str(mylist[i])。替换(['不需要的])(如果是多维的,也可以添加for循环)您可以读取每一行并清理字段。。。我刚刚展示了一个正则表达式的例子。