用Tableau分析多个Json_Json_Tableau Api

用Tableau分析多个Json

json tableau-api

用Tableau分析多个Json,json,tableau-api,Json,Tableau Api,我开始使用Tableau，我有一个项目涉及多个网站日志存储为JSON。大约一个月内，我每天都有一个日志，每个日志的重量约为500-600MB 是否可以在Tableau中打开（并连接）多个JSON文件？如果是，如何进行？我可以并行加载它们，但不能加入它们。编辑：我可以加载多个JSON文件并定义它们之间的关系，这样就可以了。我仍然有内存问题：我担心加入他们之后，我将没有足够的内存使其正常工作。加载的文件是否存储在内部数据库的RAM中最好的方法是什么？我应该首先合并所有JSON，还是将它们加载到

我开始使用Tableau，我有一个项目涉及多个网站日志存储为JSON。大约一个月内，我每天都有一个日志，每个日志的重量约为500-600MB

是否可以在Tableau中打开（并连接）多个JSON文件？如果是，如何进行？我可以并行加载它们，但不能加入它们。编辑：我可以加载多个JSON文件并定义它们之间的关系，这样就可以了。我仍然有内存问题：

我担心加入他们之后，我将没有足够的内存使其正常工作。加载的文件是否存储在内部数据库的RAM中

最好的方法是什么？我应该首先合并所有JSON，还是将它们加载到数据库中并使用一个连接到Tableau的连接器？如果是这样的话，DB的好选择是什么

我知道这些问题中有一些是基于意见的，但我对此一无所知，我真的需要一些指南来开始

对于这一数量的数据，您可能希望提前对其进行预处理、过滤、聚合和索引-或者使用数据库，比如拼花地板、火花和/或Tableau摘录

如果您使用提取，您可能希望出于特定目的对其进行过滤和聚合，但请注意，如果您在进行提取时聚合了数据，则需要小心，以确保在可视化中执行的任何进一步聚合都得到了很好的定义。像SUM（）、MIN（）和MAX（）这样的加法函数是安全的。部分和的和仍然是正确的和。但平均数的平均数和计数差的计数差通常不是

Tableau向数据库发送查询，然后根据查询结果集呈现可视化。返回的数据量取决于查询，而查询取决于您在Tableau中指定的内容。Tableau缓存结果，您还可以创建一个提取，作为一个持久的、可能经过过滤和聚合的缓存。看

对于文本文件和摘录，Tableau现在通过其数据引擎进程将其加载到内存中——将来将被一个名为Hyper的新内存数据库所取代。尽管概念相同，Tableau向数据源发送一个查询，返回一个结果集。对于您正在讨论的大小的数据，您可能希望使用某种数据库进行测试，如果它的容量超过了内存中的容量

JSON驱动程序对于探索JSON数据非常方便，我肯定会从这里开始。如果满足您的需要，您可以避免整个ETL步骤。但在数据量很大的情况下，您可能需要转移到某种外部数据源来处理生产负载。仅供参考，Tableau的JSON驱动程序的UNION功能从10.1版起（尚未）可用。

对于这一数量的数据，您可能希望提前对其进行预处理、过滤、聚合和索引-或者使用数据库，比如拼花、火花和/或Tableau摘录

JSON驱动程序对于探索JSON数据非常方便，我肯定会从这里开始。如果满足您的需要，您可以避免整个ETL步骤。但在数据量很大的情况下，您可能需要转移到某种外部数据源来处理生产负载。仅供参考，Tableau的JSON驱动程序的联合功能从10.1版开始还没有提供。

我认为没有人给出的答案是，不，不能在Tableau中连接两个JSON文件。如果我错了，请纠正我。

我想没有人给出的答案是不，不能在Tableau中连接两个JSON文件。如果我错了，请纠正我。

我相信我们可以在

Tableau

中加入2个

JSON

表

首先从

JSON

数据中提取列名，如下所示--

对所需的tableau执行上述操作并加入它们。

我相信我们可以在

tableau

中加入2个

JSON

表

首先从

JSON

数据中提取列名，如下所示--

对所需的表执行上述操作并加入它们。

要加入它们还是联合它们？我相信Tableau的JSON驱动程序的UNION特性（目前）还不可用。对于这一数量的数据，您可能希望提前对其进行预处理、过滤、聚合和索引-或者使用数据库，比如拼花地板、火花和/或Tableau Extracts。我每天都有相同的数据，所以我需要一个联合。使用数据库时，tableau如何使用内存？它是在开始时加载所有内容，还是在需要时检索和聚合？Tableau向数据库发送查询，然后根据查询结果集呈现可视化。返回的数据量取决于查询，而查询取决于您在Tableau中指定的内容。Tableau缓存结果，您还可以创建一个用于

select
   get_json_object(JSON_column, '$.Attribute1') as Attribute1,
   get_json_object(line, '$.Attribute2') as Attribute2
   from table_name;