Parsing 如何在文本文件中只保留一些关键字
Parsing 如何在文本文件中只保留一些关键字,parsing,email,text,Parsing,Email,Text,我有一个文本文件,里面有一些电子邮件。我需要删除所有内部没有关键字的电子邮件(例如:gmail、yahoo…。 有办法做到这一点吗? 提前谢谢。是的。你想要哪种语言 Smalltalk中的示例: ((FileStream fileNamed: 'emails.txt') substrings: eMailSeparatorChar) reject: [:a|a includesSubString: aKeyWord] 假设每封电子邮件都是单行的 grep -wEi 'gma
我有一个文本文件,里面有一些电子邮件。我需要删除所有内部没有关键字的电子邮件(例如:gmail、yahoo…。
有办法做到这一点吗?
提前谢谢。是的。你想要哪种语言 Smalltalk中的示例:
((FileStream fileNamed: 'emails.txt')
substrings: eMailSeparatorChar)
reject: [:a|a includesSubString: aKeyWord]
假设每封电子邮件都是单行的
grep -wEi 'gmail|yahoo|aol' emailFile
-w代表文字
-我不区分大小写
emailFile是包含电子邮件的文件
下面更改输入文件
grep -wEi 'gmail|yahoo|aol' emailFile > tempFile && cp tempFile emailFile && rm tempFile
如果要在列表中添加更多内容,只需添加“|”serviceProvider文件有多大,它是否适合内存。如何将文件中的电子邮件分开?该文件约为1Mb,包含电子邮件。我用换行符分隔电子邮件。我从未使用过Smalltalk,但它似乎像Obj-C。。。我会尽快试试这个。我不需要特定的语言,因为它是有效的。