Tableau api 如何为具有“csv”的表格优化csv数据结构;多类别“;?

Tableau api 如何为具有“csv”的表格优化csv数据结构;多类别“;?,tableau-api,Tableau Api,我有一组100个“学生记录”,我想为每个“最喜欢的食物”类型和“最喜欢的食物”类型设置复选框,选中的复选框将过滤一个“条形图”,统计包含特定“最喜欢的食物”类型和“最喜欢的食物”模式的报告数量可能是: 名字 喜爱的食物类型(如蔬菜) 喜爱的食物(如香蕉) 我希望在仪表板中能够通过复选框选择“给我所有喜欢香蕉、苹果、梨等食物的不同学生的计数”,并过滤所有记录的图表。我的问题是针对单个学生记录,可能一个学生同时喜欢香蕉和苹果。我如何最好地捕获这些信息?我应该: 案例A:重复记录(这捕获了两种不同的“

我有一组100个“学生记录”,我想为每个“最喜欢的食物”类型和“最喜欢的食物”类型设置复选框,选中的复选框将过滤一个“条形图”,统计包含特定“最喜欢的食物”类型和“最喜欢的食物”模式的报告数量可能是:

名字 喜爱的食物类型(如蔬菜) 喜爱的食物(如香蕉)

我希望在仪表板中能够通过复选框选择“给我所有喜欢香蕉、苹果、梨等食物的不同学生的计数”,并过滤所有记录的图表。我的问题是针对单个学生记录,可能一个学生同时喜欢香蕉和苹果。我如何最好地捕获这些信息?我应该:

案例A:重复记录(这捕获了两种不同的“最喜欢的食物”,但现在我必须计算出有多少学生(哪一个是一个学生) 名称、喜爱的食物类型、水果 查理,水果,苹果 查理,水果,梨

案例B:单个记录(这捕获了两种不同的“最喜欢的食物”,但有没有办法从分隔符中挑出?) 名称、喜爱的食物类型、水果 查理,水果,苹果,梨

案例C:每个水果的列(这为每个学生捕获一条记录,但每个水果需要大量列,很多列都是假的) 名称,最喜欢的食物类型,苹果,香蕉,菠萝,梨 查理,水果,真,假,真,假


我希望做到尽可能简单。

尽可能避免案例B。重复信息的最佳处理方式通常是重复行,而不是将多个值塞进单个表单元格,也不是创建多个列,如Favorite_1和Favorite_2

如果在一个字段中提供了具有多个值的数据,Tableau确实具有函数和数据连接功能,可用于将单个字段拆分为其组成部分以形成多个字段。这适用于固定数量的不同类型的信息,例如将城市、州字段拆分为城市和城市的单独字段国家

尽可能避免案例C。这种交叉表结构使分析数据和进行有用的可视化变得困难。每个值都被视为一个单独的字段

如果以交叉表格式提供数据,则Tableau允许您在“数据连接”窗格中旋转数据,以重塑为具有较少列和多行的表单

案例A通常是最好的方法。您可以通过将重复信息分解到单独的表中来进一步简化它,这一过程称为规范化。然后,您可以使用连接来重新组合表,并在需要时查看重复信息

示例的规范化方法将有两个表(或excel中的选项卡)。第一个表中每个学生正好有一行,有两列:名称和最喜欢的食物类型。第二个表中有一行,每个学生/最喜欢的食物组合,有两列:名称和最喜欢的食物。现在每个学生可以有任意多个最喜欢的食物,或者根本没有。因为两列都有一个名称字段,这就是key用于在需要时连接(合并)表


根据该表设计,Tableau中可能有两个数据源。第一个数据源仅指向学生表,可用于创建仅涉及学生和喜爱的食物类型的可视化。第二个数据源将使用(左)join可从两个表中读取,并可用于查看喜爱的食物。使用第二个数据源时,您必须小心报告有关学生姓名和喜爱的食物类型的信息,以说明重复信息。因此,如果可能,请使用第一个数据源。最后,您可以将两种visuali在仪表板上进行优化,并使用过滤器和突出显示操作使交互无缝,尽管有两个来源—充分利用两个世界。

是否有任何教程可以描述“案例a”“使用一些示例数据?或者使用最新的表执行一些步骤来实现这一点?请阅读关系数据库中的数据建模和规范化,比如第三范式