Tableau api 什么是「;“表格”;如何处理不断变化的数据?

Tableau api 什么是「;“表格”;如何处理不断变化的数据?,tableau-api,Tableau Api,作为这个问题的背景:我使用Tableau已经有一段时间了,但我一直使用代码(Python、Swift等)作为完成一些更复杂事情的支柱。我的雇主现在让我把我能做的从自定义代码转移到零售软件包中,因为如果我被公共汽车或其他东西撞到,这会使维护变得更容易 场景:通过代码,我发现使用递归处理不断变化/增长的数据非常容易。我知道这不是我能用Tableau做的事情,但我发现到目前为止,对于许多问题,有一种“Tableau方式”可以解决很多问题。而且,我不允许使用Rserve/TabPy 我有一批事务性数据,

作为这个问题的背景:我使用Tableau已经有一段时间了,但我一直使用代码(Python、Swift等)作为完成一些更复杂事情的支柱。我的雇主现在让我把我能做的从自定义代码转移到零售软件包中,因为如果我被公共汽车或其他东西撞到,这会使维护变得更容易

场景:通过代码,我发现使用递归处理不断变化/增长的数据非常容易。我知道这不是我能用Tableau做的事情,但我发现到目前为止,对于许多问题,有一种“Tableau方式”可以解决很多问题。而且,我不允许使用Rserve/TabPy

我有一批事务性数据,每月增长约1.6mil记录。我想做的是在Tableau中构建一些东西,它可以让我跟踪数据中复杂的滚动总数,而无需手动执行。在我选择的代码中,应该是这样的:

  • 将数据导入到框架中
  • 对于“交易日期”字段中的每个唯一日期值,使用该名称创建一个新列
  • 当天每个帐户中的交易总数
  • 将数据写入适用列
  • 继续到第二天
  • 然后创建新列,用于存储该帐户在所有可用30天期间(从日期到日期+29天)的交易总额
  • 为客户选择这些30天金额的账户最大值
  • 根据客户标识符将所有30天的数据转储到新表中
  • 这需要很多步骤,但是有几个很好的递归函数,只需一点代码就可以很快完成。此外,它还可以在数据发生变化时处理数据

    实际问题:既然我的大脑直接进入递归函数域,我该如何在表中处理这样的问题?我可以用Tableau Prep手动完成,但每次数据更改时都需要手动调整。有没有更好的方法,或者这不属于Tableau真正的功能范围


    ***编辑2020年10月1日:轻微的打字错误修正***

    这个问题描述得很好。您的原始数据源在哪里?在RDMS中?文本文件?还有别的吗?你有进入Tableau的权限吗?(即,您是否购买了Tableau服务器的数据管理附加组件?)尝试绑定潜在的解决方案空间数据每晚更新到我们的MSSQL服务器,每天进行增量csv备份以防万一。核心系统不允许我们直接访问任何内容,而他们的报告/提取系统不允许我们访问12个月后的历史数据。这并不理想。目前我们还没有数据管理插件,但是如果它提供了一个很好的解决方案来解决我们正在尝试做的事情,那么它可能会被考虑。我欣赏你的想法=你说“核心系统不允许我们直接访问任何东西”是什么意思?这是否意味着Tableau服务器无法连接到MSSQL服务器并提交只读选择查询?此外,您的表格是否以百万行为单位?数十亿?万亿?(一些解决方案对正常大小的数据是可行的,但对大型数据集不实用)它位于一个有外部供应商的系统中,该供应商使用专有的DB格式。然后,我们支付一个残缺版本的IBMCognos来访问一组数据。这在我们如何利用它方面是非常有限的,所以我每晚都会将我需要的数据作为CSV文件导出到我们的网络上,我们的it人员会将它们填充到服务器上的表中。这真是一团糟,我无力改善它。一旦它进入MSSQL服务器,我就可以在那里工作了。这个数据集目前是1550万行,每月增长150万-175万行,每年增长10%左右。这个问题描述得很好。您的原始数据源在哪里?在RDMS中?文本文件?还有别的吗?你有进入Tableau的权限吗?(即,您是否购买了Tableau服务器的数据管理附加组件?)尝试绑定潜在的解决方案空间数据每晚更新到我们的MSSQL服务器,每天进行增量csv备份以防万一。核心系统不允许我们直接访问任何内容,而他们的报告/提取系统不允许我们访问12个月后的历史数据。这并不理想。目前我们还没有数据管理插件,但是如果它提供了一个很好的解决方案来解决我们正在尝试做的事情,那么它可能会被考虑。我欣赏你的想法=你说“核心系统不允许我们直接访问任何东西”是什么意思?这是否意味着Tableau服务器无法连接到MSSQL服务器并提交只读选择查询?此外,您的表格是否以百万行为单位?数十亿?万亿?(一些解决方案对正常大小的数据是可行的,但对大型数据集不实用)它位于一个有外部供应商的系统中,该供应商使用专有的DB格式。然后,我们支付一个残缺版本的IBMCognos来访问一组数据。这在我们如何利用它方面是非常有限的,所以我每晚都会将我需要的数据作为CSV文件导出到我们的网络上,我们的it人员会将它们填充到服务器上的表中。这真是一团糟,我无力改善它。一旦它进入MSSQL服务器,我就可以在那里工作了。该数据集目前为1550万行,每月增长150万至175万行,每年增长约10%。