Tableau api Tableau TDE或直接连接到文件?

Tableau api Tableau TDE或直接连接到文件?,tableau-api,Tableau Api,我有Tableau的个人许可证。我目前正在使用它连接到.csv和.xlsx文件,但遇到了一些问题 1) .csv文件非常庞大(10+千兆位) 2) Excel文件开始达到1mil行限制 3) 有时我需要向.csv文件中添加某些列(如唯一ID和一些公式),这意味着我需要在Excel中打开这些列的部分,修改所需内容,然后保存一个新文件 是否最好为每个文件创建一个摘录,然后将Tableau工作簿连接到摘录而不是文件?目前,我直接连接到文件,然后从文件中提取数据并每天刷新。我不知道其他人,但我使用的正是

我有Tableau的个人许可证。我目前正在使用它连接到.csv和.xlsx文件,但遇到了一些问题

1) .csv文件非常庞大(10+千兆位) 2) Excel文件开始达到1mil行限制 3) 有时我需要向.csv文件中添加某些列(如唯一ID和一些公式),这意味着我需要在Excel中打开这些列的部分,修改所需内容,然后保存一个新文件


是否最好为每个文件创建一个摘录,然后将Tableau工作簿连接到摘录而不是文件?目前,我直接连接到文件,然后从文件中提取数据并每天刷新。

我不知道其他人,但我使用的正是这条准则。我将有一些工作手册,这些工作手册只用于从某些数据源(SQL、xlsx、csv、mdb或任何其他数据源)提取数据,所有分析都将在其他工作手册中执行,这些工作手册将只连接到TDE

优点是:

1) 每当需要更新数据源时,只需更新一次(并替换tde文件),所有工作簿都将是最新的。如果连接到同一数据源并提取到不同的tde文件,则必须提取到所有这些不同的tde文件(并担心在特定工作簿中更新了提取)。即使提取到同一个tde(这没有多大意义),也可能会让人困惑(我是连接到tde还是连接到文件?我在另一个工作簿中提取的内容是否也更新了此文档?是的,确实如此,但可能会让人困惑)

2) 您不必担心替换数据源,尤其是当它是csv、xlsx或mdb文件时。您可以保留这些文件的许多不同版本,并选择哪个版本最好。例如,我将有table_v1.mdb、table_v2.mdb、…,以及一个table_v1.tde,它将是其中一个mdb文件的摘录。我还有以前的版本以备需要

3) 当您有一个SQL连接,或者任何不是文件的东西(csv、xlsx、mdb)时,出于与上述基本相同的原因,提取非常方便,至少有一个好处。无需每次执行分析时都连接到服务器。这意味着您可以脱机执行所有操作,而使用Tableau的人不需要访问SQL表(或任何其他源)


一个好的做法是在更新tde时始终保持备份(因为,糟糕的事情发生了)

10Gig csv,哇。是的,您绝对应该使用数据提取,这样会更快。对于如此多的数据,您可以查看其他连接,如MS Access或SQL实例


如果您的数据有那么多行,我将尝试在您的本地计算机上设置一个小型MySQL实例,并将数据保留在那里。您可以将Tableau直接连接到MySQL实例,并可以轻松编辑源数据。

“我直接连接到文件,然后从中提取数据并每天刷新。”。此语句表示您已经在使用提取文件,因此我不确定问题出在哪里。我的仪表板都指向excel或csv文件。它们各自提取数据。我想知道我是否应该为每个文件创建一个摘录,维护这些摘录,并将我的工作簿指向摘录而不是单个文件。如果问题是“使用摘录而不是文本文件在10+gig文件上是否可以看到更好的性能?”那么答案几乎肯定是肯定的。