scalaz streams中collection.groupBy的等效项

scalaz streams中collection.groupBy的等效项,scala,scalaz,scalaz-stream,Scala,Scalaz,Scalaz Stream,我有一个文件夹,其中包含多个名为filetype1\u ddMMyyyy\u hhmm,filetype2\u ddMMyyyy\u hhmm 每天,可能有多个文件具有不同的小时数,我只需要解析具有最高小时数的文件。在非反应流世界中,该算法可以实现为groupBy date,它在scalaz流中的等价物是什么?文件是否按日期排序?如果没有,则在流停止之前无法找到最高小时数,因此您也可以在使用它之后执行此操作。我知道有必要遍历所有流,尽管我需要为每个ddMMyyyy_uuuhmm获取具有最高hhm

我有一个文件夹,其中包含多个名为
filetype1\u ddMMyyyy\u hhmm
filetype2\u ddMMyyyy\u hhmm


每天,可能有多个文件具有不同的小时数,我只需要解析具有最高小时数的文件。在非反应流世界中,该算法可以实现为groupBy date,它在scalaz流中的等价物是什么?

文件是否按日期排序?如果没有,则在流停止之前无法找到最高小时数,因此您也可以在使用它之后执行此操作。我知道有必要遍历所有流,尽管我需要为每个ddMMyyyy_uuuhmm获取具有最高hhmm的文件名。在诸如SELECT MAX(dateTime)group by Date(dateTime)或类似的SQL中,您是否建议使用流并使用集合API,因为无论如何我都需要使用流?您不能在仍然使用流的情况下发出任何部分结果,那么为什么不呢?如果内存是一个问题,您可以使用字典进行
扫描
,其中示例中的日期(dateTime)是键,当前看到的最大小时数的条目是值