用Tableau分析多个Json
我开始使用Tableau,我有一个项目涉及多个网站日志存储为JSON。大约一个月内,我每天都有一个日志,每个日志的重量约为500-600MB 是否可以在Tableau中打开(并连接)多个JSON文件?如果是,如何进行?我可以并行加载它们,但不能加入它们。 编辑:我可以加载多个JSON文件并定义它们之间的关系,这样就可以了。我仍然有内存问题: 我担心加入他们之后,我将没有足够的内存使其正常工作。加载的文件是否存储在内部数据库的RAM中 最好的方法是什么?我应该首先合并所有JSON,还是将它们加载到数据库中并使用一个连接到Tableau的连接器?如果是这样的话,DB的好选择是什么用Tableau分析多个Json,json,tableau-api,Json,Tableau Api,我开始使用Tableau,我有一个项目涉及多个网站日志存储为JSON。大约一个月内,我每天都有一个日志,每个日志的重量约为500-600MB 是否可以在Tableau中打开(并连接)多个JSON文件?如果是,如何进行?我可以并行加载它们,但不能加入它们。 编辑:我可以加载多个JSON文件并定义它们之间的关系,这样就可以了。我仍然有内存问题: 我担心加入他们之后,我将没有足够的内存使其正常工作。加载的文件是否存储在内部数据库的RAM中 最好的方法是什么?我应该首先合并所有JSON,还是将它们加载到
我知道这些问题中有一些是基于意见的,但我对此一无所知,我真的需要一些指南来开始 对于这一数量的数据,您可能希望提前对其进行预处理、过滤、聚合和索引-或者使用数据库,比如拼花地板、火花和/或Tableau摘录 如果您使用提取,您可能希望出于特定目的对其进行过滤和聚合,但请注意,如果您在进行提取时聚合了数据,则需要小心,以确保在可视化中执行的任何进一步聚合都得到了很好的定义。像SUM()、MIN()和MAX()这样的加法函数是安全的。部分和的和仍然是正确的和。但平均数的平均数和计数差的计数差通常不是
Tableau向数据库发送查询,然后根据查询结果集呈现可视化。返回的数据量取决于查询,而查询取决于您在Tableau中指定的内容。Tableau缓存结果,您还可以创建一个提取,作为一个持久的、可能经过过滤和聚合的缓存。看
对于文本文件和摘录,Tableau现在通过其数据引擎进程将其加载到内存中——将来将被一个名为Hyper的新内存数据库所取代。尽管概念相同,Tableau向数据源发送一个查询,返回一个结果集。对于您正在讨论的大小的数据,您可能希望使用某种数据库进行测试,如果它的容量超过了内存中的容量
JSON驱动程序对于探索JSON数据非常方便,我肯定会从这里开始。如果满足您的需要,您可以避免整个ETL步骤。但在数据量很大的情况下,您可能需要转移到某种外部数据源来处理生产负载。仅供参考,Tableau的JSON驱动程序的UNION功能从10.1版起(尚未)可用。对于这一数量的数据,您可能希望提前对其进行预处理、过滤、聚合和索引-或者使用数据库,比如拼花、火花和/或Tableau摘录 如果您使用提取,您可能希望出于特定目的对其进行过滤和聚合,但请注意,如果您在进行提取时聚合了数据,则需要小心,以确保在可视化中执行的任何进一步聚合都得到了很好的定义。像SUM()、MIN()和MAX()这样的加法函数是安全的。部分和的和仍然是正确的和。但平均数的平均数和计数差的计数差通常不是
Tableau向数据库发送查询,然后根据查询结果集呈现可视化。返回的数据量取决于查询,而查询取决于您在Tableau中指定的内容。Tableau缓存结果,您还可以创建一个提取,作为一个持久的、可能经过过滤和聚合的缓存。看
对于文本文件和摘录,Tableau现在通过其数据引擎进程将其加载到内存中——将来将被一个名为Hyper的新内存数据库所取代。尽管概念相同,Tableau向数据源发送一个查询,返回一个结果集。对于您正在讨论的大小的数据,您可能希望使用某种数据库进行测试,如果它的容量超过了内存中的容量
JSON驱动程序对于探索JSON数据非常方便,我肯定会从这里开始。如果满足您的需要,您可以避免整个ETL步骤。但在数据量很大的情况下,您可能需要转移到某种外部数据源来处理生产负载。仅供参考,Tableau的JSON驱动程序的联合功能从10.1版开始还没有提供。我认为没有人给出的答案是,不,不能在Tableau中连接两个JSON文件。如果我错了,请纠正我。我想没有人给出的答案是不,不能在Tableau中连接两个JSON文件。如果我错了,请纠正我。我相信我们可以在
Tableau
中加入2个JSON
表
首先从JSON
数据中提取列名,如下所示--
对所需的tableau执行上述操作并加入它们。我相信我们可以在
tableau
中加入2个JSON
表
首先从JSON
数据中提取列名,如下所示--
对所需的表执行上述操作并加入它们。要加入它们还是联合它们?我相信Tableau的JSON驱动程序的UNION特性(目前)还不可用。对于这一数量的数据,您可能希望提前对其进行预处理、过滤、聚合和索引-或者使用数据库,比如拼花地板、火花和/或Tableau Extracts。我每天都有相同的数据,所以我需要一个联合。使用数据库时,tableau如何使用内存?它是在开始时加载所有内容,还是在需要时检索和聚合?Tableau向数据库发送查询,然后根据查询结果集呈现可视化。返回的数据量取决于查询,而查询取决于您在Tableau中指定的内容。Tableau缓存结果,您还可以创建一个用于
select
get_json_object(JSON_column, '$.Attribute1') as Attribute1,
get_json_object(line, '$.Attribute2') as Attribute2
from table_name;