Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/database/8.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Database 如何优化小表和大表之间的连接?_Database_Join - Fatal编程技术网

Database 如何优化小表和大表之间的连接?

Database 如何优化小表和大表之间的连接?,database,join,Database,Join,一个小数据库(一台机器n1)和一个非常大的数据库(在机器n2上,有十亿条记录)需要连接起来。 应用服务器需要将数据从数据库服务器读取到内存中。 它应该先读取小db吗?然后从第二个数据库读取 如何以最快的速度执行此联接? 一般来说,在现实生活中是如何做到这一点的?一般来说,您应该尝试将处理推送到数据库中。也许大型数据库服务器可以将小型数据库服务器拉到本地,并处理服务器上的所有内容 如果要在应用程序中处理,一个常见且通常是最佳的策略是执行哈希连接。将小数据集转换为哈希表。然后,您可以根据该哈希表探测

一个小数据库(一台机器n1)和一个非常大的数据库(在机器n2上,有十亿条记录)需要连接起来。 应用服务器需要将数据从数据库服务器读取到内存中。 它应该先读取小db吗?然后从第二个数据库读取

如何以最快的速度执行此联接?
一般来说,在现实生活中是如何做到这一点的?

一般来说,您应该尝试将处理推送到数据库中。也许大型数据库服务器可以将小型数据库服务器拉到本地,并处理服务器上的所有内容

如果要在应用程序中处理,一个常见且通常是最佳的策略是执行哈希连接。将小数据集转换为哈希表。然后,您可以根据该哈希表探测大数据集中的项目。这需要很少的内存,很少的CPU,而且您可以流式处理大数据集


如果联接条件相等(例如,
Orders.CustomerID=Customers.ID
),并且两个集合中的一个集合足够小,可以放入内存,则此策略始终有效。

通常,您应该尝试将处理推送到数据库中。也许大型数据库服务器可以将小型数据库服务器拉到本地,并处理服务器上的所有内容

如果要在应用程序中处理,一个常见且通常是最佳的策略是执行哈希连接。将小数据集转换为哈希表。然后,您可以根据该哈希表探测大数据集中的项目。这需要很少的内存,很少的CPU,而且您可以流式处理大数据集

如果联接条件相等(例如,
Orders.CustomerID=Customers.ID
),并且两个集合中的一个集合足够小,可以放入内存,则此策略始终有效