Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/azure/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Azure搜索选项(我是否了解Azure搜索选项)_Azure_Azure Cognitive Search - Fatal编程技术网

Azure搜索选项(我是否了解Azure搜索选项)

Azure搜索选项(我是否了解Azure搜索选项),azure,azure-cognitive-search,Azure,Azure Cognitive Search,我们在表存储中有1亿行,每行大约有4项元数据,我们希望按元数据进行搜索,这样会非常昂贵 基本选项支持1M个文档,这是否与只有4项元数据的一百万行相同?或者我们会简单地使用2GB的存储空间,这样2GB的元数据就不会等于2GB的存储空间 然后是更大的尺寸 我们还研究了文档数据库和带有表存储的标准模式,以允许对其他元数据进行搜索。如果您的搜索场景不需要全文搜索(例如,提前键入、建议、词干和50多种语言的词形变化形式、方面、自定义评分),但是只需要数字/日期时间/地理空间比较和简单的字符串匹配,Do

我们在表存储中有1亿行,每行大约有4项元数据,我们希望按元数据进行搜索,这样会非常昂贵

基本选项支持1M个文档,这是否与只有4项元数据的一百万行相同?或者我们会简单地使用2GB的存储空间,这样2GB的元数据就不会等于2GB的存储空间

然后是更大的尺寸


我们还研究了文档数据库和带有表存储的标准模式,以允许对其他元数据进行搜索。

如果您的搜索场景不需要全文搜索(例如,提前键入、建议、词干和50多种语言的词形变化形式、方面、自定义评分),但是只需要数字/日期时间/地理空间比较和简单的字符串匹配,DocumentDB将是一个不错的选择。如果您需要全文搜索功能,DocumentDB还可以轻松高效地与Azure Search集成


在Azure搜索定价方面,请查看S1和S2层。例如,您可以使用2个S2分区存储1亿个文档。定价分幅上显示的存储和文档限制为每个分区。每个服务最多可以有12个分区,基本分区只有1个

如果您的搜索场景不需要全文搜索(例如,提前键入、建议、词干和50多种语言的词形变化形式、方面、自定义评分),而只需要数字/日期时间/地理空间比较和简单的字符串匹配,则DocumentDB将是一个不错的选择。如果您需要全文搜索功能,DocumentDB还可以轻松高效地与Azure Search集成


在Azure搜索定价方面,请查看S1和S2层。例如,您可以使用2个S2分区存储1亿个文档。定价分幅上显示的存储和文档限制为每个分区。每个服务最多可以有12个分区,基本分区只有1个

Basic有一个1M文档的硬限制,您不能添加更多的分区来增加该限制,因此如果您想索引所有100M条目的话,您必须选择一个标准层,S1、S2或S3。每个条目(数据库中的行)都算作一个文档。您索引的文档的最大大小为16 MB,但根据您更新索引的方式,它可能会更小()

需要存储的文档数量不仅会影响所需的层,还会影响所需的最大存储大小和吞吐量。您可以快速估计您的存储大小需要有多大,例如,如果您的4个元数据点都是字符串,并且每个字符串平均为30个字符的UTF-8,那么您总共需要(100M x 4 x 30 b)~11 GB,因此您可能不需要为存储大小选择更多分区(S1和S2都可以在一个分区内安装)

为了容纳100万个文档,您可以以1304.21英镑/月的价格使用7个S1分区(15M x 7=105M),或以1490.52英镑/月的价格使用2个S2分区(100M x 2)。S2s可能会为您提供更好的吞吐量,并为您提供更多的索引(即使您目前不需要它们(因为您只有4个元数据点))


如前所述,搜索引擎的全部功能可能比您现在需要的功能多得多,但如果开始使用它是一项战略决策,那么至少您知道为什么要为此付费。

Basic有一百万个文档的硬限制,您不能添加更多的分区来增加它,因此您必须继续对于标准层之一,如果要为所有100万个条目编制索引,请使用S1、S2或S3。每个条目(数据库中的行)都算作一个文档。您编制索引的文档的最大大小为16 MB,但可能会更小,具体取决于您更新索引的方式()

您需要存储的文档数量会影响您需要的层,以及最大存储大小和所需吞吐量。您可以快速估计您的存储大小需要有多大,例如,如果您的4个元数据点都是字符串,并且每个字符串平均为30个UTF-8字符,那么您总共需要(100M x 4 x 30 b)~11GB,所以存储大小可能不需要为其选择更多分区(S1和S2都可以在单个分区中容纳)

为了容纳100万个文档,您可以以1304.21英镑/月的价格使用7个S1分区(15M x 7=105M),或以1490.52英镑/月的价格使用2个S2分区(100M x 2)。S2s可能会为您提供更好的吞吐量,并为您提供更多的索引(即使您目前不需要它们(因为您只有4个元数据点))


如前所述,搜索引擎的全部功能可能比您现在需要的功能多得多,但如果开始使用它是一项战略决策,那么至少您知道为什么要为此付费。

您需要支持哪些类型的搜索?您的搜索是否能够(轻松)处理各种单词(即vehicle、vehicles、Vehicleural)并在结果排名中记录文档中出现的单词,那么您可能需要Azure搜索(或其他搜索产品)。如果您没有这些要求,则DocumentDB可能会通过som精心编制的查询为您提供支持。对于DocDB来说,负载应该不是问题。虽然还不需要变体,但这是一个很好的观点。@yoape-我不理解您的评论。OP并没有要求更改数据库存储。这里没有讨论数据库负载,并且OccumentDB没有内置的全文搜索功能。我试图将此Q集中在azure搜索上,但documentdb可能会做我们需要的事情,尽管我们觉得azure更具战略意义。但是,是的,我的Q更注重定价。周一,我可能只创建一个基本实例,索引500万行,看看会发生什么。@Davidmakon请参阅O中的最后一句话P关于DocDB的问题,如果t