是否可以使用依赖项并行化for循环?

是否可以使用依赖项并行化for循环?,r,rparallel,R,Rparallel,各位老用户好, 我对R很陌生,我想知道是否有可能并行我的流程。我的数据集基本上来自一个pcap文件,在该文件中,我提取了与特定协议MODBUS/TCP相对应的数据包。有超过800k个数据包,每两个连续数据包对应一个特定(即相同)MODBUS事务的查询/响应 由于某些值包含在查询/响应中,因此我创建了一个初始for循环,它逐行遍历数据以“排列”数据,这样每个事务都有一行,所有变量都从查询/响应行填充。区分查询/响应的唯一方法是源/目标端口号,这是在条件if语句中 我正在使用数据表、设置键、预分配变

各位老用户好,

我对R很陌生,我想知道是否有可能并行我的流程。我的数据集基本上来自一个pcap文件,在该文件中,我提取了与特定协议MODBUS/TCP相对应的数据包。有超过800k个数据包,每两个连续数据包对应一个特定(即相同)MODBUS事务的查询/响应

由于某些值包含在查询/响应中,因此我创建了一个初始for循环,它逐行遍历数据以“排列”数据,这样每个事务都有一行,所有变量都从查询/响应行填充。区分查询/响应的唯一方法是源/目标端口号,这是在条件if语句中

我正在使用数据表、设置键、预分配变量(合并表/结果)。应用于向量(result data.table中的列)的函数执行得相当快

我的电脑使用4个处理器运行debian wheezy。由于存在依赖关系,从我所读到的内容来看,我的理解是,实际上不可能利用并行处理?但是,是否有某种方法可以对整个数据集进行分区,让它们并行处理,然后合并结果?它花了3个多小时运行,也许我可以应用其他优化


非常感谢任何指导/指示。谢谢

我已经用C重新实现了代码,并且发现了我目前正在探索的Rcpp。这似乎是要走的路