在python中将字符串数组列表转换为单独的字符串数组_Python_Arrays_Tokenize

在python中将字符串数组列表转换为单独的字符串数组

python arrays

在python中将字符串数组列表转换为单独的字符串数组,python,arrays,tokenize,Python,Arrays,Tokenize,这是我的密码 SENTENCE = "He sad might have lung cancer. It’s just a rumor." sent=(sent_tokenize(SENTENCE)) 输出是 ['He sad might have lung cancer.', 'It’s just a rumor.'] 我想把这个数组作为 ['He sad might have lung cancer.'] ['It’s just a rumor.'] 他们有没有这样做的方法？如果有，怎

这是我的密码

SENTENCE = "He sad might have lung cancer. It’s just a rumor."
sent=(sent_tokenize(SENTENCE))

输出是

['He sad might have lung cancer.', 'It’s just a rumor.']

我想把这个数组作为

['He sad might have lung cancer.']
['It’s just a rumor.']

他们有没有这样做的方法？如果有，怎么做？

既然你想根据一个句子进行拆分，你可以简单地这样做：

sentence_list = SENTENCE.split('.')
for sentence in sentence_list:
    single_sentence = [sentence + '.']

如果您确实希望所有列表包含同一数据结构中的单个句子，则必须使用列表列表或字典：

my_sentences = []

sentence_list = SENTENCE.split('.')
for sentence in sentence_list:
    my_sentences.append([sentence + '.'])

要使用列表来缩短此时间，请执行以下操作：

my_sentences = [[sentence + '.'] for sentence in SENTENCE.split('.')]

唯一的罪魁祸首是分句部分会发生得更频繁，因此处理大量句子的速度会更慢。

由于您希望根据一个句子进行分句，您可以简单地执行以下操作：

sentence_list = SENTENCE.split('.')
for sentence in sentence_list:
    single_sentence = [sentence + '.']

如果您确实希望所有列表包含同一数据结构中的单个句子，则必须使用列表列表或字典：

my_sentences = []

sentence_list = SENTENCE.split('.')
for sentence in sentence_list:
    my_sentences.append([sentence + '.'])

要使用列表来缩短此时间，请执行以下操作：

my_sentences = [[sentence + '.'] for sentence in SENTENCE.split('.')]

唯一的罪魁祸首是分句部分会发生得更频繁，因此处理大量句子会更慢。

使用

re.split（）

函数的解决方案：

import re 

s = "He sad might have lung cancer. It’s just a rumor."
parts = [l if l[-1] == '.' else l + '.' for l in re.split(r'\.\s?(?!$)', s)]
print(parts)

输出：

['He sad might have lung cancer.', 'It’s just a rumor.']

r'\.\s？（？！$）”

模式将分隔符定义为

，除了位于文本

（？！$）

l如果l[-1]='.'else l+'.

-在每行末尾恢复

（因为在拆分时未捕获dilimiter）

使用

re.split（）函数的解决方案：
import re 

s = "He sad might have lung cancer. It’s just a rumor."
parts = [l if l[-1] == '.' else l + '.' for l in re.split(r'\.\s?(?!$)', s)]
print(parts)

输出：
['He sad might have lung cancer.', 'It’s just a rumor.']


r'\.\s？（？！$）”
模式将分隔符定义为
，除了位于文本（？！$）

l如果l[-1]='.'else l+'.
-在每行末尾恢复
（因为拆分时未捕获dilimiter）
嗯，是否有理由希望每个字符串都在列表中？似乎没有多大意义。。除非我遗漏了什么。[[x]在['He sad可能患有肺癌'，'这只是一个谣言]]
嗯，你希望每个字符串都列在一个列表中有什么原因吗？似乎没有多大意义。。除非我遗漏了什么。[[x]在[“他可能得了肺癌。”，“这只是个谣言。”]
这正是我需要的。谢谢，这正是我需要的。谢谢，谢谢你的回答。即使这个答案不是我所期望的，这也是我从你的答案中学到的新东西。谢谢你的回答。即使这个答案不是我所期望的，这也是我从你的答案中学到的新东西。