Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/azure/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用Azure认知搜索从Docx文件检索相关数据_Azure_Azure Functions_Azure Blob Storage - Fatal编程技术网

使用Azure认知搜索从Docx文件检索相关数据

使用Azure认知搜索从Docx文件检索相关数据,azure,azure-functions,azure-blob-storage,Azure,Azure Functions,Azure Blob Storage,我是Azure认知搜索的新手。我正在使用Azure blob存储来存储文档(.docx)。每当我使用带有点击突出显示功能的查询短语(例如:“政府规则”)从存储在Azure blob中的文档中搜索特定信息时,只要存在“政府”和“规则”术语,它就会突出显示来自文档的结果。正因为如此,我从只有“规则”术语的文档中获得了一些不相关的信息 有没有办法只从文档中获取用户想要知道的特定部分(如“政府规则”),而不是从查询短语中获取至少匹配一个术语的部分 请帮我做这个。提前谢谢。快速解释一下。Azure认知搜索

我是Azure认知搜索的新手。我正在使用Azure blob存储来存储文档(
.docx
)。每当我使用带有点击突出显示功能的查询短语(例如:“政府规则”)从存储在Azure blob中的文档中搜索特定信息时,只要存在“政府”和“规则”术语,它就会突出显示来自文档的结果。正因为如此,我从只有“规则”术语的文档中获得了一些不相关的信息

有没有办法只从文档中获取用户想要知道的特定部分(如“政府规则”),而不是从查询短语中获取至少匹配一个术语的部分


请帮我做这个。提前谢谢。

快速解释一下。Azure认知搜索和所有其他搜索引擎都使用一种称为“反向索引”的数据结构。它基本上是一个存储文档id和频率(搜索词在文档中出现的次数)的索引

例如:

如果搜索“天空”,将检索文档2和3。但是,如果您想要“蓝天”,则必须指定这两个术语必须存在于同一文档中,并且一个术语前面必须有另一个术语

在Azure认知搜索中,您可以在双引号内传递术语,但它只能检索所提供术语的精确匹配项。作为另一个选项,您可以使用不同的分析器来分析word

我建议您研究搜索引擎和分析器的工作原理:

(特别是该科)


嗨,蒂亚戈,谢谢你的回复。我正在拿到相关文件,但我的要求只是从用户希望看到的文档中检索内容。现在我得到了整个匹配的文档。我也尝试了点击突出显示。但没有得到所需的结果。如果不看到它,真的很难帮助。有没有办法检索匹配文档的特定部分?除非将内容编入索引它将检索所有内容。您的最佳匹配是使用高亮度