Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/json/15.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
用Tableau分析多个Json_Json_Tableau Api - Fatal编程技术网

用Tableau分析多个Json

用Tableau分析多个Json,json,tableau-api,Json,Tableau Api,我开始使用Tableau,我有一个项目涉及多个网站日志存储为JSON。大约一个月内,我每天都有一个日志,每个日志的重量约为500-600MB 是否可以在Tableau中打开(并连接)多个JSON文件?如果是,如何进行?我可以并行加载它们,但不能加入它们。 编辑:我可以加载多个JSON文件并定义它们之间的关系,这样就可以了。我仍然有内存问题: 我担心加入他们之后,我将没有足够的内存使其正常工作。加载的文件是否存储在内部数据库的RAM中 最好的方法是什么?我应该首先合并所有JSON,还是将它们加载到

我开始使用Tableau,我有一个项目涉及多个网站日志存储为JSON。大约一个月内,我每天都有一个日志,每个日志的重量约为500-600MB

是否可以在Tableau中打开(并连接)多个JSON文件?如果是,如何进行?我可以并行加载它们,但不能加入它们。 编辑:我可以加载多个JSON文件并定义它们之间的关系,这样就可以了。我仍然有内存问题:

我担心加入他们之后,我将没有足够的内存使其正常工作。加载的文件是否存储在内部数据库的RAM中

最好的方法是什么?我应该首先合并所有JSON,还是将它们加载到数据库中并使用一个连接到Tableau的连接器?如果是这样的话,DB的好选择是什么


我知道这些问题中有一些是基于意见的,但我对此一无所知,我真的需要一些指南来开始

对于这一数量的数据,您可能希望提前对其进行预处理、过滤、聚合和索引-或者使用数据库,比如拼花地板、火花和/或Tableau摘录

如果您使用提取,您可能希望出于特定目的对其进行过滤和聚合,但请注意,如果您在进行提取时聚合了数据,则需要小心,以确保在可视化中执行的任何进一步聚合都得到了很好的定义。像SUM()、MIN()和MAX()这样的加法函数是安全的。部分和的和仍然是正确的和。但平均数的平均数和计数差的计数差通常不是


Tableau向数据库发送查询,然后根据查询结果集呈现可视化。返回的数据量取决于查询,而查询取决于您在Tableau中指定的内容。Tableau缓存结果,您还可以创建一个提取,作为一个持久的、可能经过过滤和聚合的缓存。看


对于文本文件和摘录,Tableau现在通过其数据引擎进程将其加载到内存中——将来将被一个名为Hyper的新内存数据库所取代。尽管概念相同,Tableau向数据源发送一个查询,返回一个结果集。对于您正在讨论的大小的数据,您可能希望使用某种数据库进行测试,如果它的容量超过了内存中的容量


JSON驱动程序对于探索JSON数据非常方便,我肯定会从这里开始。如果满足您的需要,您可以避免整个ETL步骤。但在数据量很大的情况下,您可能需要转移到某种外部数据源来处理生产负载。仅供参考,Tableau的JSON驱动程序的UNION功能从10.1版起(尚未)可用。

对于这一数量的数据,您可能希望提前对其进行预处理、过滤、聚合和索引-或者使用数据库,比如拼花、火花和/或Tableau摘录

如果您使用提取,您可能希望出于特定目的对其进行过滤和聚合,但请注意,如果您在进行提取时聚合了数据,则需要小心,以确保在可视化中执行的任何进一步聚合都得到了很好的定义。像SUM()、MIN()和MAX()这样的加法函数是安全的。部分和的和仍然是正确的和。但平均数的平均数和计数差的计数差通常不是


Tableau向数据库发送查询,然后根据查询结果集呈现可视化。返回的数据量取决于查询,而查询取决于您在Tableau中指定的内容。Tableau缓存结果,您还可以创建一个提取,作为一个持久的、可能经过过滤和聚合的缓存。看


对于文本文件和摘录,Tableau现在通过其数据引擎进程将其加载到内存中——将来将被一个名为Hyper的新内存数据库所取代。尽管概念相同,Tableau向数据源发送一个查询,返回一个结果集。对于您正在讨论的大小的数据,您可能希望使用某种数据库进行测试,如果它的容量超过了内存中的容量


JSON驱动程序对于探索JSON数据非常方便,我肯定会从这里开始。如果满足您的需要,您可以避免整个ETL步骤。但在数据量很大的情况下,您可能需要转移到某种外部数据源来处理生产负载。仅供参考,Tableau的JSON驱动程序的联合功能从10.1版开始还没有提供。

我认为没有人给出的答案是,不,不能在Tableau中连接两个JSON文件。如果我错了,请纠正我。

我想没有人给出的答案是不,不能在Tableau中连接两个JSON文件。如果我错了,请纠正我。

我相信我们可以在
Tableau
中加入2个
JSON

首先从
JSON
数据中提取列名,如下所示--


对所需的tableau执行上述操作并加入它们。

我相信我们可以在
tableau
中加入2个
JSON

首先从
JSON
数据中提取列名,如下所示--


对所需的表执行上述操作并加入它们。

要加入它们还是联合它们?我相信Tableau的JSON驱动程序的UNION特性(目前)还不可用。对于这一数量的数据,您可能希望提前对其进行预处理、过滤、聚合和索引-或者使用数据库,比如拼花地板、火花和/或Tableau Extracts。我每天都有相同的数据,所以我需要一个联合。使用数据库时,tableau如何使用内存?它是在开始时加载所有内容,还是在需要时检索和聚合?Tableau向数据库发送查询,然后根据查询结果集呈现可视化。返回的数据量取决于查询,而查询取决于您在Tableau中指定的内容。Tableau缓存结果,您还可以创建一个用于
select
   get_json_object(JSON_column, '$.Attribute1') as Attribute1,
   get_json_object(line, '$.Attribute2') as Attribute2
   from table_name;