Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/292.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/string/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/gwt/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在python中处理长字符串的最佳方法_Python_String_Apache Tika - Fatal编程技术网

在python中处理长字符串的最佳方法

在python中处理长字符串的最佳方法,python,string,apache-tika,Python,String,Apache Tika,我正在进行一些文本文档处理,以便使用apache tika将大型文档文件读入字符串。示例: content = data_manipulate.read_by_tika(document_url) 有些情况下我需要使用content.lower()和其他一些情况下content。既然它是一个大字符串,那么有效地使用该字符串以实现最大代码优化的最佳实践是什么? 使用两个字符串content和content\u lower=content.lower()并在需要时在它们之间使用是否正确?您

我正在进行一些文本文档处理,以便使用
apache tika
将大型文档文件读入字符串。示例:

    content = data_manipulate.read_by_tika(document_url)
有些情况下我需要使用content.lower()和其他一些情况下
content
。既然它是一个大字符串,那么有效地使用该字符串以实现最大代码优化的最佳实践是什么?
使用两个字符串
content
content\u lower=content.lower()
并在需要时在它们之间使用是否正确?

您还有其他选择吗?当你说“最好”时,你把A和B进行比较。有B吗?A是“内容”,B是“内容较低”@DYZNope。A是“使用两个字符串
content
content\u lower=content.lower()
。有什么可行的替代方案吗?除非你有选择,否则你不能选择最好的。我关心的是,像一个文件一样使用是否是一种好的做法,因为内容和内容\u lower会消耗大量内存,对吗?@DYZYou仍然需要在每次需要使用小写版本时生成一份
内容的副本。它不能解决空间问题,但会影响性能。