Process 为流程挖掘准备csv文件

Process 为流程挖掘准备csv文件,process,data-mining,mining,Process,Data Mining,Mining,希望你做得很好! 我正在学习使用“PM4PY”进行流程挖掘的教程,但我在csv文件中发现了一些困难, 在我的csv文件中,我有以下列:“id”、“状态”、“邮件id”、“日期”。。。。(“状态”与包含某些特定选项的“活动”相同) 我的csv文件包含大量数据 为了遵循流程挖掘教程,我必须在我的专栏中包含类似“案例:概念:名称”的内容。。。但是我不知道如何才能做到这一点。首先,您需要使用pandas导入csv文件,然后转换为事件日志对象,最后您可以在pm4py中使用 参考: 在您的案例中,我假设“i

希望你做得很好! 我正在学习使用“PM4PY”进行流程挖掘的教程,但我在csv文件中发现了一些困难, 在我的csv文件中,我有以下列:“id”、“状态”、“邮件id”、“日期”。。。。(“状态”与包含某些特定选项的“活动”相同)

我的csv文件包含大量数据


为了遵循流程挖掘教程,我必须在我的专栏中包含类似“案例:概念:名称”的内容。。。但是我不知道如何才能做到这一点。首先,您需要使用pandas导入csv文件,然后转换为事件日志对象,最后您可以在pm4py中使用

参考:

在您的案例中,我假设“id”与正常流程挖掘术语中的案例id相同。类似地,“状态”对应于活动ID,“日期”对应于时间戳

最好的选择是在输入PM4Py之前先读入熊猫数据帧

为了详细了解如何做到这一点,下面是一个示例。由于您没有提到csv文件中的所有列,我们假设您当前只有['id'、'status'、'date']作为列列表。以下代码可以适用于您拥有的任意数量的列(通过将它们添加到名为cols的列表中):

在这里,我们根据PM4Py包的要求更改了列名及其数据类型。使用log_converter函数将此数据帧转换为事件日志。现在,您可以在此事件日志对象上执行常规流程挖掘任务。例如,如果您希望从事件日志创建事件,可以使用以下代码行:

from pm4py.algo.discovery.dfg import algorithm as dfg_algorithm

dfg = dfg_algorithm.apply(log)
from pm4py.algo.discovery.dfg import algorithm as dfg_algorithm

dfg = dfg_algorithm.apply(log)