Language agnostic 在标记云中缩放标记

Language agnostic 在标记云中缩放标记,language-agnostic,user-interface,rendering,tagging,tag-cloud,Language Agnostic,User Interface,Rendering,Tagging,Tag Cloud,我正在移动设备上实现标签云。数据模型等的细节在这里并不特别重要。我的问题是关于标记的缩放: 将标记频率映射到字体大小的“最佳”表达式是什么? 我已经讨论了线性和对数标度,并从阿德里安·库恩(Adrian Kuhn)的多项式方法草图中获得了灵感。然而,我似乎还记得互联网上的一篇文章,其中对这个问题进行了更多的探讨 我也在博客上找到了一些“”,不过我不确定这些最佳实践是否是天意。这些对频率缩放没有任何评论 对于标签缩放,我有哪些替代方案,哪种方法是首选/标准方法?我也在考虑最小字体大小、最大标签数量

我正在移动设备上实现标签云。数据模型等的细节在这里并不特别重要。我的问题是关于标记的缩放:

将标记频率映射到字体大小的“最佳”表达式是什么?

我已经讨论了线性和对数标度,并从阿德里安·库恩(Adrian Kuhn)的多项式方法草图中获得了灵感。然而,我似乎还记得互联网上的一篇文章,其中对这个问题进行了更多的探讨

我也在博客上找到了一些“”,不过我不确定这些最佳实践是否是天意。这些对频率缩放没有任何评论

对于标签缩放,我有哪些替代方案,哪种方法是首选/标准方法?我也在考虑最小字体大小、最大标签数量、颜色等


编辑:根据中的讨论,我对字体大小不同的“标准”标记云很感兴趣。

中有一个很好的讨论,讨论了要显示的标记的缩放、聚类和截断。

我去年参与了一个小型标记云项目,在该项目中,我使用了一些类似于 β=(int)((最大θ–最小θ)xω)+最小θ+0.5) 其中ω是之前根据某种度量(在您的例子中是字体频率)计算的权重,最小θ和最大θ是上下限,β是最终值。这可以应用于任何视觉特征(字体大小、颜色、重量(如果支持)等)


我发现线性和对数标度往往依赖于数据集分布。在具有显著异常值的数据集中,我发现tanh有助于“平滑”结果值。

我发现的解决方案如下

font\u size=(最大字体大小-最小字体大小)*(Math.sin(1.5*(X))+minsize

其中X是希望映射到字体大小的标准化值

X=(此值-最小值)/(最大值-最小值)


这增加了范围中较低的3个四分位数的大小差异,例如,为了最小化高离群值的影响

Er,请查看此网站的右栏-按实例数降序,数字在右边。对我很有用。这是我最终采用的线性缩放。好主意:tanh,我来看看进一步的