在python中处理长字符串的最佳方法_Python_String_Apache Tika

在python中处理长字符串的最佳方法

python string

在python中处理长字符串的最佳方法,python,string,apache-tika,Python,String,Apache Tika,我正在进行一些文本文档处理，以便使用apache tika将大型文档文件读入字符串。示例： content = data_manipulate.read_by_tika(document_url) 有些情况下我需要使用content.lower（）和其他一些情况下content。既然它是一个大字符串，那么有效地使用该字符串以实现最大代码优化的最佳实践是什么？使用两个字符串content和content\u lower=content.lower（）并在需要时在它们之间使用是否正确？您

我正在进行一些文本文档处理，以便使用

apache tika

将大型文档文件读入字符串。示例：

    content = data_manipulate.read_by_tika(document_url)

有些情况下我需要使用content.lower（）和其他一些情况下

content

。既然它是一个大字符串，那么有效地使用该字符串以实现最大代码优化的最佳实践是什么？

使用两个字符串

content

和

content\u lower=content.lower（）

并在需要时在它们之间使用是否正确？

您还有其他选择吗？当你说“最好”时，你把A和B进行比较。有B吗？A是“内容”，B是“内容较低”@DYZNope。A是“使用两个字符串

content

和

content\u lower=content.lower（）

。有什么可行的替代方案吗？除非你有选择，否则你不能选择最好的。我关心的是，像一个文件一样使用是否是一种好的做法，因为内容和内容\u lower会消耗大量内存，对吗？@DYZYou仍然需要在每次需要使用小写版本时生成一份

内容的副本。它不能解决空间问题，但会影响性能。