Dask中TF-IDF的计算

Dask中TF-IDF的计算,dask,Dask,Apache Spark附带了一个包来进行TF-IDF计算,我觉得它非常方便: 是否有任何等效的方法,或者可能有一种使用Dask的方法?如果是这样,是否也可以在水平缩放的Dask(即具有多个GPU的集群)中执行此操作这也是Dask gitter上提出的问题,@stsievert给出了以下回复: 计数/散列向量器类似。它们在Dask ML中,与TFIDF相同,没有标准化/函数 我认为这将是一个很好的github问题/功能请求 这是的API链接。谢谢。。。我继续在这里创建了一个问题:

Apache Spark附带了一个包来进行TF-IDF计算,我觉得它非常方便:


是否有任何等效的方法,或者可能有一种使用Dask的方法?如果是这样,是否也可以在水平缩放的Dask(即具有多个GPU的集群)中执行此操作

这也是Dask gitter上提出的问题,@stsievert给出了以下回复:

计数/散列向量器类似。它们在Dask ML中,与TFIDF相同,没有标准化/函数

我认为这将是一个很好的github问题/功能请求


这是的API链接。

谢谢。。。我继续在这里创建了一个问题: