python tsfresh-column_id参数用于什么

python tsfresh-column_id参数用于什么,python,pandas,feature-engineering,Python,Pandas,Feature Engineering,tsfresh需要在特定列中输入数据。我最初认为列id只是行索引,但我担心这是错误的 我有传感器数据-压力传感器,温度传感器和湿度传感器被捕捉在10秒的间隔。因此,它是4列的数据帧。现在告诉我这些数据应该如何使用?什么是列id 文档很好,但我无法理解他们所说的实体是什么意思。每个传感器测量一个不同的东西,并且都安装在一个机器单元中。源代码对这个密文有一定的说明: : 因此,这是一个列,它在时间序列的所有点上都应该具有相同的值。如果数据帧中此列中有多个值,则lib将其解释为多个时间序列,并同时分析

tsfresh
需要在特定列中输入数据。我最初认为
列id
只是行索引,但我担心这是错误的

我有传感器数据-压力传感器,温度传感器和湿度传感器被捕捉在10秒的间隔。因此,它是4列的数据帧。现在告诉我这些数据应该如何使用?什么是
列id


文档很好,但我无法理解他们所说的
实体
是什么意思。每个传感器测量一个不同的东西,并且都安装在一个机器单元中。

源代码对这个密文有一定的说明:

:


因此,这是一个列,它在时间序列的所有点上都应该具有相同的值。如果数据帧中此列中有多个值,则lib将其解释为多个时间序列,并同时分析所有值。

此列指示时间序列所属的实体。将分别为每个实体提取特征。生成的特征矩阵将为每个实体包含一行。在文档中提出的示例中,您有不同时间不同机器人的6个传感器的值。在本例中,每个机器人都是不同的实体,因此每个机器人都有不同的id


或者,如果您有不同供应商的数据以及他们在不同时间戳以不同类别销售的商品数量,则供应商id可以用作您的“列id”。

文档是您的friend@user3483203我读过这篇文章,但无法理解“实体”,你能用一个例子解释一下吗。例如销售数据。我有两列:
Time
列在
day
级别和
Sales
数据。您会给不同的日期指定不同的
id
值吗?@joel.wilson AFAICS,
tsfresh
除了
Time
Sales
之外,还需要一列。如果只有一个系列,则所有点的值都应该相同。有一个例子。这个例子是最令人困惑的例子。若给id列一个值,那个么输出将只有一行。这意味着1个时间序列转换为1行
:param column_id: The name of the id column to group by.
:type column_id: str