Language agnostic 在标记云中缩放标记_Language Agnostic_User Interface_Rendering_Tagging_Tag Cloud

Language agnostic 在标记云中缩放标记

language-agnostic user-interface

Language agnostic 在标记云中缩放标记,language-agnostic,user-interface,rendering,tagging,tag-cloud,Language Agnostic,User Interface,Rendering,Tagging,Tag Cloud,我正在移动设备上实现标签云。数据模型等的细节在这里并不特别重要。我的问题是关于标记的缩放：将标记频率映射到字体大小的“最佳”表达式是什么？我已经讨论了线性和对数标度，并从阿德里安·库恩（Adrian Kuhn）的多项式方法草图中获得了灵感。然而，我似乎还记得互联网上的一篇文章，其中对这个问题进行了更多的探讨我也在博客上找到了一些“”，不过我不确定这些最佳实践是否是天意。这些对频率缩放没有任何评论对于标签缩放，我有哪些替代方案，哪种方法是首选/标准方法？我也在考虑最小字体大小、最大标签数量

我正在移动设备上实现标签云。数据模型等的细节在这里并不特别重要。我的问题是关于标记的缩放：

将标记频率映射到字体大小的“最佳”表达式是什么？

我已经讨论了线性和对数标度，并从阿德里安·库恩（Adrian Kuhn）的多项式方法草图中获得了灵感。然而，我似乎还记得互联网上的一篇文章，其中对这个问题进行了更多的探讨

我也在博客上找到了一些“”，不过我不确定这些最佳实践是否是天意。这些对频率缩放没有任何评论

对于标签缩放，我有哪些替代方案，哪种方法是首选/标准方法？我也在考虑最小字体大小、最大标签数量、颜色等

编辑：根据中的讨论，我对字体大小不同的“标准”标记云很感兴趣。

中有一个很好的讨论，讨论了要显示的标记的缩放、聚类和截断。

我去年参与了一个小型标记云项目，在该项目中，我使用了一些类似于 β=（int）（（最大θ–最小θ）xω）+最小θ+0.5）其中ω是之前根据某种度量（在您的例子中是字体频率）计算的权重，最小θ和最大θ是上下限，β是最终值。这可以应用于任何视觉特征（字体大小、颜色、重量（如果支持）等）

我发现线性和对数标度往往依赖于数据集分布。在具有显著异常值的数据集中，我发现tanh有助于“平滑”结果值。

我发现的解决方案如下

font\u size=（最大字体大小-最小字体大小）*（Math.sin（1.5*（X））+minsize

其中X是希望映射到字体大小的标准化值

X=（此值-最小值）/（最大值-最小值）

这增加了范围中较低的3个四分位数的大小差异，例如，为了最小化高离群值的影响

Er，请查看此网站的右栏-按实例数降序，数字在右边。对我很有用。这是我最终采用的线性缩放。好主意：tanh，我来看看进一步的