Neo4j 查询响应时间慢-简单的好友密码查询_Neo4j_Cypher

Neo4j 查询响应时间慢-简单的好友密码查询

neo4j

Neo4j 查询响应时间慢-简单的好友密码查询,neo4j,cypher,Neo4j,Cypher,我正在使用NEO4j 3.5来存储和查询人与人之间的关系。我有标签为“User”的节点和标签为“Friends”的关系。我可以得到朋友的朋友，但查询时间太长。它目前在4到6秒内返回。这不是一个高事务性的neo4j数据库，服务器有大量可用的CPU和内存。服务器上的负载低于3，共有8个核心。这是在AWS EC2实例上运行的。数据库中大约有250000个节点，数据库总大小在750mb以下以下是我当前使用的查询： MATCH (user:User {user_id:1145})-[:FRIENDS*3

我正在使用NEO4j 3.5来存储和查询人与人之间的关系。我有标签为“User”的节点和标签为“Friends”的关系。我可以得到朋友的朋友，但查询时间太长。它目前在4到6秒内返回。这不是一个高事务性的neo4j数据库，服务器有大量可用的CPU和内存。服务器上的负载低于3，共有8个核心。这是在AWS EC2实例上运行的。数据库中大约有250000个节点，数据库总大小在750mb以下

以下是我当前使用的查询：

MATCH (user:User {user_id:1145})-[:FRIENDS*3]->(fof:User)
WHERE NOT (user:User)-[:FRIENDS]->(fof:User)
RETURN count(distinct fof.user_id)

此cypher查询返回的计数为69704，这是正确的

可以对cypher查询或NEO4j数据库引擎进行哪些优化以更快地返回结果

执行计划

+-----------------------+----------------+--------+---------+-----------+-----------------------------+------------------+--------------------------------------------+
| Operator              | Estimated Rows | Rows   | DB Hits | Cache H/M | Identifiers                 | Ordered by       | Other                                      |
+-----------------------+----------------+--------+---------+-----------+-----------------------------+------------------+--------------------------------------------+
| +ProduceResults       |              0 |      1 |       0 |       0/0 | count(distinct fof.user_id) |                  | 0.0                                        |
| |                     +----------------+--------+---------+-----------+-----------------------------+------------------+--------------------------------------------+
| +EagerAggregation     |              0 |      1 |  326421 |       0/0 | count(distinct fof.user_id) |                  | 0.0                                        |
| |                     +----------------+--------+---------+-----------+-----------------------------+------------------+--------------------------------------------+
| +AntiSemiApply        |              0 | 256717 |       0 |       0/0 | anon[33], fof, user         | user.user_id ASC | 0.0                                        |
| |\                    +----------------+--------+---------+-----------+-----------------------------+------------------+--------------------------------------------+
| | +Expand(Into)       |              0 |      0 | 8006149 |       0/0 |   REL80, fof, user          |                  | 0.0; (user)-[  REL80:FRIENDS]->(fof)       |
| | |                   +----------------+--------+---------+-----------+-----------------------------+------------------+--------------------------------------------+
| | +Filter             |              1 | 260120 |  520240 |       0/0 | fof, user                   |                  | 0.0; fof:User                              |
| | |                   +----------------+--------+---------+-----------+-----------------------------+------------------+--------------------------------------------+
| | +Argument           |              1 | 260120 |       0 |       0/0 | fof, user                   |                  | 0.0                                        |
| |                     +----------------+--------+---------+-----------+-----------------------------+------------------+--------------------------------------------+
| +Filter               |              0 | 260120 |  260120 |       0/0 | anon[33], fof, user         | user.user_id ASC | 0.0; fof:User                              |
| |                     +----------------+--------+---------+-----------+-----------------------------+------------------+--------------------------------------------+
| +VarLengthExpand(All) |              0 | 260120 |  267999 |       0/0 | anon[33], fof, user         | user.user_id ASC | 0.0; (user)-[anon[33]:FRIENDS*3..3]->(fof) |
| |                     +----------------+--------+---------+-----------+-----------------------------+------------------+--------------------------------------------+
| +NodeIndexSeek        |              1 |      1 |       3 |       0/0 | user                        | user.user_id ASC | 0.0; :User(user_id)                        |
+-----------------------+----------------+--------+---------+-----------+-----------------------------+------------------+--------------------------------------------+

您的

WHERE

子句包含一个模式，该模式要求每个

fof

额外的DB命中。通过在内存中保留

用户的所有直接好友的列表，并更改WHERE
子句，使其只在列表中搜索，可以避免这些DB命中。（根据您的个人资料数据，这可以节省8006149+520240，或者超过850万DB的点击量——这是整个查询的大部分点击量。）


在您的查询中，如果相同的fof
节点被多次匹配，那么每次都将执行相同的WHERE
测试。通过在执行WHERE
测试之前过滤掉重复的fof
节点，可以避免这种情况。这也意味着您以后不再需要删除重复项
例如：
MATCH (user:User {user_id:1145})-[:FRIENDS]->(f:User)
WITH user, COLLECT(f) AS friends
MATCH (user)-[:FRIENDS*3]->(fof:User)
WITH DISTINCT friends, fof
WHERE NOT fof IN friends
RETURN COUNT(fof)

还要记住：朋友3不是朋友的朋友，而是朋友的朋友的朋友。