Process 为流程挖掘准备csv文件_Process_Data Mining_Mining

Process 为流程挖掘准备csv文件

process

Process 为流程挖掘准备csv文件,process,data-mining,mining,Process,Data Mining,Mining,希望你做得很好！我正在学习使用“PM4PY”进行流程挖掘的教程，但我在csv文件中发现了一些困难，在我的csv文件中，我有以下列：“id”、“状态”、“邮件id”、“日期”。。。。（“状态”与包含某些特定选项的“活动”相同）我的csv文件包含大量数据为了遵循流程挖掘教程，我必须在我的专栏中包含类似“案例：概念：名称”的内容。。。但是我不知道如何才能做到这一点。首先，您需要使用pandas导入csv文件，然后转换为事件日志对象，最后您可以在pm4py中使用参考：在您的案例中，我假设“i

希望你做得很好！我正在学习使用“PM4PY”进行流程挖掘的教程，但我在csv文件中发现了一些困难，在我的csv文件中，我有以下列：“id”、“状态”、“邮件id”、“日期”。。。。（“状态”与包含某些特定选项的“活动”相同）

我的csv文件包含大量数据

为了遵循流程挖掘教程，我必须在我的专栏中包含类似“案例：概念：名称”的内容。。。但是我不知道如何才能做到这一点。首先，您需要使用pandas导入csv文件，然后转换为事件日志对象，最后您可以在pm4py中使用

参考：

在您的案例中，我假设“id”与正常流程挖掘术语中的案例id相同。类似地，“状态”对应于活动ID，“日期”对应于时间戳

最好的选择是在输入PM4Py之前先读入熊猫数据帧

为了详细了解如何做到这一点，下面是一个示例。由于您没有提到csv文件中的所有列，我们假设您当前只有['id'、'status'、'date']作为列列表。以下代码可以适用于您拥有的任意数量的列（通过将它们添加到名为cols的列表中）：

在这里，我们根据PM4Py包的要求更改了列名及其数据类型。使用log_converter函数将此数据帧转换为事件日志。现在，您可以在此事件日志对象上执行常规流程挖掘任务。例如，如果您希望从事件日志创建事件，可以使用以下代码行：

from pm4py.algo.discovery.dfg import algorithm as dfg_algorithm

dfg = dfg_algorithm.apply(log)

from pm4py.algo.discovery.dfg import algorithm as dfg_algorithm

dfg = dfg_algorithm.apply(log)