在python中将字符串数组列表转换为单独的字符串数组

在python中将字符串数组列表转换为单独的字符串数组,python,arrays,tokenize,Python,Arrays,Tokenize,这是我的密码 SENTENCE = "He sad might have lung cancer. It’s just a rumor." sent=(sent_tokenize(SENTENCE)) 输出是 ['He sad might have lung cancer.', 'It’s just a rumor.'] 我想把这个数组作为 ['He sad might have lung cancer.'] ['It’s just a rumor.'] 他们有没有这样做的方法?如果有,怎

这是我的密码

SENTENCE = "He sad might have lung cancer. It’s just a rumor."
sent=(sent_tokenize(SENTENCE))
输出是

['He sad might have lung cancer.', 'It’s just a rumor.']
我想把这个数组作为

['He sad might have lung cancer.']
['It’s just a rumor.']

他们有没有这样做的方法?如果有,怎么做?

既然你想根据一个句子进行拆分,你可以简单地这样做:

sentence_list = SENTENCE.split('.')
for sentence in sentence_list:
    single_sentence = [sentence + '.']
如果您确实希望所有列表包含同一数据结构中的单个句子,则必须使用列表列表或字典:

my_sentences = []

sentence_list = SENTENCE.split('.')
for sentence in sentence_list:
    my_sentences.append([sentence + '.'])
要使用列表来缩短此时间,请执行以下操作:

my_sentences = [[sentence + '.'] for sentence in SENTENCE.split('.')]

唯一的罪魁祸首是分句部分会发生得更频繁,因此处理大量句子的速度会更慢。

由于您希望根据一个句子进行分句,您可以简单地执行以下操作:

sentence_list = SENTENCE.split('.')
for sentence in sentence_list:
    single_sentence = [sentence + '.']
如果您确实希望所有列表包含同一数据结构中的单个句子,则必须使用列表列表或字典:

my_sentences = []

sentence_list = SENTENCE.split('.')
for sentence in sentence_list:
    my_sentences.append([sentence + '.'])
要使用列表来缩短此时间,请执行以下操作:

my_sentences = [[sentence + '.'] for sentence in SENTENCE.split('.')]

唯一的罪魁祸首是分句部分会发生得更频繁,因此处理大量句子会更慢。

使用
re.split()
函数的解决方案:

import re 

s = "He sad might have lung cancer. It’s just a rumor."
parts = [l if l[-1] == '.' else l + '.' for l in re.split(r'\.\s?(?!$)', s)]
print(parts)
输出:

['He sad might have lung cancer.', 'It’s just a rumor.']

r'\.\s?(?!$)”
模式将分隔符定义为
,除了位于文本
(?!$)


l如果l[-1]='.'else l+'.
-在每行末尾恢复
(因为在拆分时未捕获dilimiter)

使用
re.split()函数的解决方案:

import re 

s = "He sad might have lung cancer. It’s just a rumor."
parts = [l if l[-1] == '.' else l + '.' for l in re.split(r'\.\s?(?!$)', s)]
print(parts)
输出:

['He sad might have lung cancer.', 'It’s just a rumor.']

r'\.\s?(?!$)”
模式将分隔符定义为
,除了位于文本
(?!$)


l如果l[-1]='.'else l+'.
-在每行末尾恢复
(因为拆分时未捕获dilimiter)

嗯,是否有理由希望每个字符串都在列表中?似乎没有多大意义。。除非我遗漏了什么。
[[x]在['He sad可能患有肺癌','这只是一个谣言]]
嗯,你希望每个字符串都列在一个列表中有什么原因吗?似乎没有多大意义。。除非我遗漏了什么。
[[x]在[“他可能得了肺癌。”,“这只是个谣言。”]
这正是我需要的。谢谢,这正是我需要的。谢谢,谢谢你的回答。即使这个答案不是我所期望的,这也是我从你的答案中学到的新东西。谢谢你的回答。即使这个答案不是我所期望的,这也是我从你的答案中学到的新东西。