Azure搜索选项（我是否了解Azure搜索选项）_Azure_Azure Cognitive Search

Azure搜索选项（我是否了解Azure搜索选项）

azure

Azure搜索选项（我是否了解Azure搜索选项）,azure,azure-cognitive-search,Azure,Azure Cognitive Search,我们在表存储中有1亿行，每行大约有4项元数据，我们希望按元数据进行搜索，这样会非常昂贵基本选项支持1M个文档，这是否与只有4项元数据的一百万行相同？或者我们会简单地使用2GB的存储空间，这样2GB的元数据就不会等于2GB的存储空间然后是更大的尺寸我们还研究了文档数据库和带有表存储的标准模式，以允许对其他元数据进行搜索。如果您的搜索场景不需要全文搜索（例如，提前键入、建议、词干和50多种语言的词形变化形式、方面、自定义评分），但是只需要数字/日期时间/地理空间比较和简单的字符串匹配，Do

我们在表存储中有1亿行，每行大约有4项元数据，我们希望按元数据进行搜索，这样会非常昂贵

基本选项支持1M个文档，这是否与只有4项元数据的一百万行相同？或者我们会简单地使用2GB的存储空间，这样2GB的元数据就不会等于2GB的存储空间

然后是更大的尺寸

我们还研究了文档数据库和带有表存储的标准模式，以允许对其他元数据进行搜索。

如果您的搜索场景不需要全文搜索（例如，提前键入、建议、词干和50多种语言的词形变化形式、方面、自定义评分），但是只需要数字/日期时间/地理空间比较和简单的字符串匹配，DocumentDB将是一个不错的选择。如果您需要全文搜索功能，DocumentDB还可以轻松高效地与Azure Search集成

在Azure搜索定价方面，请查看S1和S2层。例如，您可以使用2个S2分区存储1亿个文档。定价分幅上显示的存储和文档限制为每个分区。每个服务最多可以有12个分区，基本分区只有1个

如果您的搜索场景不需要全文搜索（例如，提前键入、建议、词干和50多种语言的词形变化形式、方面、自定义评分），而只需要数字/日期时间/地理空间比较和简单的字符串匹配，则DocumentDB将是一个不错的选择。如果您需要全文搜索功能，DocumentDB还可以轻松高效地与Azure Search集成

Basic有一个1M文档的硬限制，您不能添加更多的分区来增加该限制，因此如果您想索引所有100M条目的话，您必须选择一个标准层，S1、S2或S3。每个条目（数据库中的行）都算作一个文档。您索引的文档的最大大小为16 MB，但根据您更新索引的方式，它可能会更小（）
需要存储的文档数量不仅会影响所需的层，还会影响所需的最大存储大小和吞吐量。您可以快速估计您的存储大小需要有多大，例如，如果您的4个元数据点都是字符串，并且每个字符串平均为30个字符的UTF-8，那么您总共需要（100M x 4 x 30 b）~11 GB，因此您可能不需要为存储大小选择更多分区（S1和S2都可以在一个分区内安装）
为了容纳100万个文档，您可以以1304.21英镑/月的价格使用7个S1分区（15M x 7=105M），或以1490.52英镑/月的价格使用2个S2分区（100M x 2）。S2s可能会为您提供更好的吞吐量，并为您提供更多的索引（即使您目前不需要它们（因为您只有4个元数据点））

如前所述，搜索引擎的全部功能可能比您现在需要的功能多得多，但如果开始使用它是一项战略决策，那么至少您知道为什么要为此付费。
Basic有一百万个文档的硬限制，您不能添加更多的分区来增加它，因此您必须继续对于标准层之一，如果要为所有100万个条目编制索引，请使用S1、S2或S3。每个条目（数据库中的行）都算作一个文档。您编制索引的文档的最大大小为16 MB，但可能会更小，具体取决于您更新索引的方式（）
您需要存储的文档数量会影响您需要的层，以及最大存储大小和所需吞吐量。您可以快速估计您的存储大小需要有多大，例如，如果您的4个元数据点都是字符串，并且每个字符串平均为30个UTF-8字符，那么您总共需要（100M x 4 x 30 b）~11GB，所以存储大小可能不需要为其选择更多分区（S1和S2都可以在单个分区中容纳）
为了容纳100万个文档，您可以以1304.21英镑/月的价格使用7个S1分区（15M x 7=105M），或以1490.52英镑/月的价格使用2个S2分区（100M x 2）。S2s可能会为您提供更好的吞吐量，并为您提供更多的索引（即使您目前不需要它们（因为您只有4个元数据点））

如前所述，搜索引擎的全部功能可能比您现在需要的功能多得多，但如果开始使用它是一项战略决策，那么至少您知道为什么要为此付费。
您需要支持哪些类型的搜索？您的搜索是否能够（轻松）处理各种单词（即vehicle、vehicles、Vehicleural）并在结果排名中记录文档中出现的单词，那么您可能需要Azure搜索（或其他搜索产品）。如果您没有这些要求，则DocumentDB可能会通过som精心编制的查询为您提供支持。对于DocDB来说，负载应该不是问题。虽然还不需要变体，但这是一个很好的观点。@yoape-我不理解您的评论。OP并没有要求更改数据库存储。这里没有讨论数据库负载，并且OccumentDB没有内置的全文搜索功能。我试图将此Q集中在azure搜索上，但documentdb可能会做我们需要的事情，尽管我们觉得azure更具战略意义。但是，是的，我的Q更注重定价。周一，我可能只创建一个基本实例，索引500万行，看看会发生什么。@Davidmakon请参阅O中的最后一句话P关于DocDB的问题，如果t