在Python中,将字符串拆分为块,保持单词的完整性
我想将一个长字符串(比如,500个字符)分成更小的块(比如,您可以使用python中的在Python中,将字符串拆分为块,保持单词的完整性,python,Python,我想将一个长字符串(比如,500个字符)分成更小的块(比如,您可以使用python中的textwrap模块来实现这一点: s = "Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridicul
textwrap
模块来实现这一点:
s = "Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu,"
import textwrap
var = textwrap.wrap(s, 100)
for line in var:
print(len(line))
print(var)
你可以学习
您可以使用python中的
textwrap
模块执行此操作:
s = "Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu,"
import textwrap
var = textwrap.wrap(s, 100)
for line in var:
print(len(line))
print(var)
你可以学习
如果没有其他导入,请尝试:
s = "Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu,"
out = []; leftover = ""
for i in map(''.join, zip(*[iter(s)]*100)):
i = leftover+i
toappend, _ , leftover = i.rpartition(" ")
if len(toappend) > 100:
leftover = toappend[99:]
toappend = toappend[:99]
out.append(toappend)
print out
[out]:
['Lorem ipsum door sit amet,concetetuer adipsicing elit.Aenean
康莫多·利古拉·埃吉特·多洛·埃尼安(Aenean),“马萨诸塞州自然社会”(massa.Cum Socias natoque)
对虾和马格尼对虾产褥期的蒙特斯,印度对虾。
Donec’,“quam felis,ultricies nec,pellentesque eu,pretium quis,
主席先生,弗林利亚,埃佩德·胡斯托
维勒,阿利奎特·内克,瓦努特·埃吉特,阿尔库,位于犹他州朗卡斯的埃尼姆·胡斯托,
帝国饮食,a,威尼斯维塔,justo.NulamDictum Feliseu Ped
莫利斯pretium.整数tincidunt.Cras','dapibus.Vivamus elementum
塞姆珀·尼西。埃尼安·沃普特·埃利芬德·泰勒斯。埃尼安·利奥·利古拉,
portti']
如果没有其他导入,请尝试:
s = "Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu,"
out = []; leftover = ""
for i in map(''.join, zip(*[iter(s)]*100)):
i = leftover+i
toappend, _ , leftover = i.rpartition(" ")
if len(toappend) > 100:
leftover = toappend[99:]
toappend = toappend[:99]
out.append(toappend)
print out
[out]:
['Lorem ipsum door sit amet,concetetuer adipsicing elit.Aenean
康莫多·利古拉·埃吉特·多洛·埃尼安(Aenean),“马萨诸塞州自然社会”(massa.Cum Socias natoque)
对虾和马格尼对虾产褥期的蒙特斯,印度对虾。
Donec’,“quam felis,ultricies nec,pellentesque eu,pretium quis,
主席先生,弗林利亚,埃佩德·胡斯托
维勒,阿利奎特·内克,瓦努特·埃吉特,阿尔库,位于犹他州朗卡斯的埃尼姆·胡斯托,
威尼纳提斯·维塔伊(venenatis vitae),朱斯托(justo.Nullam dictum felis eu pede)
莫利斯pretium.整数tincidunt.Cras','dapibus.Vivamus elementum
塞姆珀·尼西。埃尼安·沃普特·埃利芬德·泰勒斯。埃尼安·利奥·利古拉,
portti']
输出:
['Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean ', 'massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec ', 'quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. ', 'Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, ', 'imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. ', 'Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, ', 'porttitor eu,']
使用drop_whitespace=False保持原始间距
查看其他选项
输出:
['Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean ', 'massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec ', 'quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. ', 'Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, ', 'imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. ', 'Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, ', 'porttitor eu,']
使用drop_whitespace=False保持原始间距
查看其他选项为歧义感到抱歉,为歧义感到抱歉,这是