在python中处理长字符串的最佳方法
我正在进行一些文本文档处理,以便使用在python中处理长字符串的最佳方法,python,string,apache-tika,Python,String,Apache Tika,我正在进行一些文本文档处理,以便使用apache tika将大型文档文件读入字符串。示例: content = data_manipulate.read_by_tika(document_url) 有些情况下我需要使用content.lower()和其他一些情况下content。既然它是一个大字符串,那么有效地使用该字符串以实现最大代码优化的最佳实践是什么? 使用两个字符串content和content\u lower=content.lower()并在需要时在它们之间使用是否正确?您
apache tika
将大型文档文件读入字符串。示例:
content = data_manipulate.read_by_tika(document_url)
有些情况下我需要使用content.lower()和其他一些情况下content
。既然它是一个大字符串,那么有效地使用该字符串以实现最大代码优化的最佳实践是什么?
使用两个字符串
content
和content\u lower=content.lower()
并在需要时在它们之间使用是否正确?您还有其他选择吗?当你说“最好”时,你把A和B进行比较。有B吗?A是“内容”,B是“内容较低”@DYZNope。A是“使用两个字符串content
和content\u lower=content.lower()
。有什么可行的替代方案吗?除非你有选择,否则你不能选择最好的。我关心的是,像一个文件一样使用是否是一种好的做法,因为内容和内容\u lower会消耗大量内存,对吗?@DYZYou仍然需要在每次需要使用小写版本时生成一份内容的副本。它不能解决空间问题,但会影响性能。