Python 具有精确单词匹配搜索的RDD过滤器

Python 具有精确单词匹配搜索的RDD过滤器,python,apache-spark,pyspark,rdd,Python,Apache Spark,Pyspark,Rdd,我有一个rdd对象(从一个文本文件创建),我正在通过过滤精确匹配的单词来创建另一个rdd对象 rdd2 = rdd1.filter(lambda x: word in x) word是在for循环中生成的字符串。因此,我将在循环中搜索rdd1中的一些单词。例如,如果我的单词值是“ebook”。所以,当我搜索rdd1时,我会得到所有与电子书匹配的行。但是,我也得到了一些有价值的“电子书” 如何使用精确的单词匹配过滤rddrdd2应该只包含精确匹配单词的行,即ebook而不是ebooks 我需要为

我有一个rdd对象(从一个文本文件创建),我正在通过过滤精确匹配的单词来创建另一个rdd对象

rdd2 = rdd1.filter(lambda x: word in x)
word
是在for循环中生成的字符串。因此,我将在循环中搜索
rdd1
中的一些单词。例如,如果我的单词值是“ebook”。所以,当我搜索rdd1时,我会得到所有与电子书匹配的行。但是,我也得到了一些有价值的“电子书”

如何使用精确的单词匹配过滤rdd
rdd2
应该只包含精确匹配单词的行,即
ebook
而不是
ebooks

我需要为进一步的过程创建一个中间rdd。请帮忙

rdd2 = rdd1.filter(lambda x: word in x.split())

x.split()。x、 split()用于精确匹配单词。请查看并在两天后返回,如果您的声誉超过15,请按回答进行检查。