Azure cosmosdb cosmos数据库将采用拉式方法编制索引+;文件夹

Azure cosmosdb cosmos数据库将采用拉式方法编制索引+;文件夹,azure-cosmosdb,azure-cognitive-search,Azure Cosmosdb,Azure Cognitive Search,我有物品和文件。项目和文件之间存在1:m关系。项目存储在关系数据库中,文件存储在文件夹中。项目和文件之间的关联存储在关系数据库中。文件可以是PDF、word文档、电子邮件等。我打算使用POC认知搜索来搜索项目和相关文档 我目前的理解是,在使用认知搜索时,拉式方法可能比推式方法更便宜(延迟要求并不严格,最终的一致性也可以)。因此,我打算将数据移动到cosmos数据库中,然后通过pull方法对其进行索引。好奇的是,这是如何处理文档的?我需要在prem上破解它们吗 还可以选择附件和blob存储文档。后

我有物品和文件。项目和文件之间存在1:m关系。项目存储在关系数据库中,文件存储在文件夹中。项目和文件之间的关联存储在关系数据库中。文件可以是PDF、word文档、电子邮件等。我打算使用POC认知搜索来搜索项目和相关文档

我目前的理解是,在使用认知搜索时,拉式方法可能比推式方法更便宜(延迟要求并不严格,最终的一致性也可以)。因此,我打算将数据移动到cosmos数据库中,然后通过pull方法对其进行索引。好奇的是,这是如何处理文档的?我需要在prem上破解它们吗


还可以选择附件和blob存储文档。后者很可能更经得起未来的考验。我认为,如果我将文档放入blob存储,认知搜索索引仍然需要破解文档并应用技能?

这听起来是个不错的方法。在数据源方面,认知搜索支持CosmosDB和blob存储以及一些关系数据库。我可能会:

  • 在中创建新的认知搜索资源
  • 在该认知搜索资源中,单击“导入数据”创建一个新的索引器(这是您上面提到的“拉”选项)。假设您的项目位于CosmosDB或关系数据库中,并且您的文档单独存储在blob存储中,您可能需要执行两次
  • 第一个索引器有一个数据源,该数据源指向您决定放入的任何数据库中的项目/关系数据,应用您想要的任何技能,并将所有内容放入索引中
  • 第二个索引器有一个不同的数据源,它指向blob存储中的文档,应用您想要的任何技能,并将所有内容都放在同一个索引中
如果您使用索引器,它们将处理文档破裂。如果直接将数据推入索引,则需要自己破解文档


这提供了一个使用门户创建索引器的简单演练(skillset是可选的,并将数据源更改为您自己的数据):

这听起来是一个不错的方法。在数据源方面,认知搜索支持CosmosDB和blob存储以及一些关系数据库。我可能会:

  • 在中创建新的认知搜索资源
  • 在该认知搜索资源中,单击“导入数据”创建一个新的索引器(这是您上面提到的“拉”选项)。假设您的项目位于CosmosDB或关系数据库中,并且您的文档单独存储在blob存储中,您可能需要执行两次
  • 第一个索引器有一个数据源,该数据源指向您决定放入的任何数据库中的项目/关系数据,应用您想要的任何技能,并将所有内容放入索引中
  • 第二个索引器有一个不同的数据源,它指向blob存储中的文档,应用您想要的任何技能,并将所有内容都放在同一个索引中
如果您使用索引器,它们将处理文档破裂。如果直接将数据推入索引,则需要自己破解文档



这提供了一个使用门户创建索引器的简单演练(skillset是可选的,并将数据源更改为您自己的数据):

通过拉式方法,您的意思是认知搜索从数据源(在您的情况下是SQL DB或Cosmos DB)拉取数据。是吗?@GauravMantri-是的,微软就是这么说的,这就是你想使用Cosmos DB的原因?索引器也可以从Azure SQL数据库中提取数据来填充索引。@GauravMantri-没有特别的原因,尽管我认为cosmos更灵活,因为我可能还需要一个图形数据库。你认为azure sql数据库更便宜吗?他们可以采用无模式JSON吗?
你认为azure sql数据库更便宜吗?
-是。宇宙可能会变得相当昂贵
他们可以使用无模式的JSON吗?
-否。SQL DB是关系数据库,因此受模式限制。通过拉式方法,您的意思是认知搜索从数据源(在您的例子中是SQL DB或Cosmos DB)拉取数据。是吗?@GauravMantri-是的,微软就是这么说的,这就是你想使用Cosmos DB的原因?索引器也可以从Azure SQL数据库中提取数据来填充索引。@GauravMantri-没有特别的原因,尽管我认为cosmos更灵活,因为我可能还需要一个图形数据库。你认为azure sql数据库更便宜吗?他们可以采用无模式JSON吗?
你认为azure sql数据库更便宜吗?
-是。宇宙可能会变得相当昂贵
他们可以使用无模式的JSON吗?
-不。SQL DB是关系数据库,因此受模式限制。谢谢,我将消化,明天可能会接受。
如果您使用索引器,他们将负责文档破解。
-您可能想提一下,必须创建适当的技能集,并与绑定到blob数据源的索引器关联,以便文档破解工作。@GauravMantri-您建议在prem上进行文档破解以确保大量资金安全吗?@cs0815-我不知道有任何工具可以那样做。对不起@GauravMantri谢谢-我们已经这样做了。我只是想知道,你是否认为在prem上破解文档可以节省很多钱,然后转移到Azure(而不是为这项“技能”付费)。谢谢,我会消化,明天可能会接受。
如果你使用索引器,他们将负责文档破解。
-您可能想提一下,必须创建适当的技能集,并与绑定到blob数据源的索引器关联,以便文档破解工作。@GauravMantri-您建议在prem上进行文档破解以确保大量资金安全吗?@cs0815-我不知道有任何工具可以那样做。对不起@GauravMantri谢谢-我们已经这样做了。我是j