Python 使用固定关键字搜索框架为静态内容设计帮助

Python 使用固定关键字搜索框架为静态内容设计帮助,python,Python,我正试图找出一个解决方案,用于检测源代码和文档之间的可跟踪性。最重要的用例是,用户需要查看可追溯到文档的源代码标记集合(按与文档的相关性排序)。她不会为代码格式而烦恼,但不知何故,她需要查看“标识符-文档”映射以获得可追溯性的概念 我从源代码文件中获取标记-以某种方式分割连接的标识符(SimpleMAXAnalyzer成为“simple max analyzer”),然后作为文档中的搜索词。搜索框架最适合完成这项特定任务——使用强大的信息检索算法深入文档以查找内容。嗖的一声看起来真的很棒的pyt

我正试图找出一个解决方案,用于检测源代码和文档之间的可跟踪性。最重要的用例是,用户需要查看可追溯到文档的源代码标记集合(按与文档的相关性排序)。她不会为代码格式而烦恼,但不知何故,她需要查看“标识符-文档”映射以获得可追溯性的概念

我从源代码文件中获取标记-以某种方式分割连接的标识符(SimpleMAXAnalyzer成为“simple max analyzer”),然后作为文档中的搜索词。搜索框架最适合完成这项特定任务——使用强大的信息检索算法深入文档以查找内容。嗖的一声看起来真的很棒的python搜索。。。带有多个分析仪和过滤器


虽然问题与搜索类似,但不同之处在于用户没有实际执行任何搜索。那么我解决问题的方法正确吗?考虑到一切都是静态的,只需要计算一次——我是否使用了一个错误的工具(搜索框架)来完成工作?

如果我理解您的用例,我不确定。用户看到了源代码,并且有一些方法可以从令牌跳到文档的适当部分或可能部分的列表,对吗

然后,搜索工具似乎是适合该作业的工具,尽管您可以预编译每个可能的搜索(源中的标识符数量有限,因此您可以提前计算对文档的所有可能引用)

或者每个标识符都有文档中的“规范”部分吗?那么也许某种指数会是更好的选择

也许您可以进一步阐明您的用例


编辑:也许按字母顺序排列的文档索引是解决方案的一个步骤。然后,您可以在页面/章节/章节中查找源代码的每个标记,其中提到了源代码的所有或大部分组件。

非常感谢您的回答。您的理解是绝对正确的-唯一的问题是用户没有看到代码格式的源代码-她只是对看到与文档相关的标识符集合感兴趣。对于每个标识符,需要显示“文档可能部分的列表”。不幸的是,文档中没有“规范”部分——建立它是目标。希望这能解释更多。。。你能解释一下“预编译所有可能的搜索”部分吗?看起来很有趣