Python 3.x 分句而非域名
你能给我建议一种方法,在Python中只分隔用点(.)划分的句子,而不分隔域名吗Python 3.x 分句而非域名,python-3.x,regex,split,Python 3.x,Regex,Split,你能给我建议一种方法,在Python中只分隔用点(.)划分的句子,而不分隔域名吗 例如,我需要将“Janice是我的母亲。她是一个好母亲”而不是“google.com”或“shop.tk”分开。在这里,除了域名,你可以找到一种按点(.)分隔句子的方法。我假设每个句子都以大写字母开头,第一个字母和前一个点(.)之间没有空格 最好的祝愿因为域名只是用点分隔的单词,没有完美的答案。想一想黑山的领地“我”。。。。我的母亲。我和我自己…你尝试过这个问题吗?所以不是一个代码服务网站,但是,我们将帮助您解决您
例如,我需要将“Janice是我的母亲。她是一个好母亲”而不是“google.com”或“shop.tk”分开。在这里,除了域名,你可以找到一种按点(.)分隔句子的方法。我假设每个句子都以大写字母开头,第一个字母和前一个点(.)之间没有空格
最好的祝愿因为域名只是用点分隔的单词,没有完美的答案。想一想黑山的领地“我”<代码>。。。。我的母亲。我和我自己…你尝试过这个问题吗?所以不是一个代码服务网站,但是,我们将帮助您解决您面临的问题。顺便说一句,我建议乱用正则表达式。正如Jean baptiste所写,这并不是一个完美的答案,但您可能可以创建一个域名示例的白名单,因为您可以看到有很多顶级域,所以您无法区分单词和域。
import re
txt = "Janice is my mother.She is a good mother and google.com and mother.She"
new_txt=txt
seperated_txt=[]
while True:
y = re.search(r"[.][A-Z]", new_txt)
if y==None:
break
elif y!= None:
seperated_txt.append(new_txt[:y.start()+1])
new_txt = new_txt[y.start()+1:]
print(seperated_txt)