Language agnostic 在标记云中缩放标记
我正在移动设备上实现标签云。数据模型等的细节在这里并不特别重要。我的问题是关于标记的缩放: 将标记频率映射到字体大小的“最佳”表达式是什么? 我已经讨论了线性和对数标度,并从阿德里安·库恩(Adrian Kuhn)的多项式方法草图中获得了灵感。然而,我似乎还记得互联网上的一篇文章,其中对这个问题进行了更多的探讨 我也在博客上找到了一些“”,不过我不确定这些最佳实践是否是天意。这些对频率缩放没有任何评论 对于标签缩放,我有哪些替代方案,哪种方法是首选/标准方法?我也在考虑最小字体大小、最大标签数量、颜色等Language agnostic 在标记云中缩放标记,language-agnostic,user-interface,rendering,tagging,tag-cloud,Language Agnostic,User Interface,Rendering,Tagging,Tag Cloud,我正在移动设备上实现标签云。数据模型等的细节在这里并不特别重要。我的问题是关于标记的缩放: 将标记频率映射到字体大小的“最佳”表达式是什么? 我已经讨论了线性和对数标度,并从阿德里安·库恩(Adrian Kuhn)的多项式方法草图中获得了灵感。然而,我似乎还记得互联网上的一篇文章,其中对这个问题进行了更多的探讨 我也在博客上找到了一些“”,不过我不确定这些最佳实践是否是天意。这些对频率缩放没有任何评论 对于标签缩放,我有哪些替代方案,哪种方法是首选/标准方法?我也在考虑最小字体大小、最大标签数量
编辑:根据中的讨论,我对字体大小不同的“标准”标记云很感兴趣。中有一个很好的讨论,讨论了要显示的标记的缩放、聚类和截断。我去年参与了一个小型标记云项目,在该项目中,我使用了一些类似于 β=(int)((最大θ–最小θ)xω)+最小θ+0.5) 其中ω是之前根据某种度量(在您的例子中是字体频率)计算的权重,最小θ和最大θ是上下限,β是最终值。这可以应用于任何视觉特征(字体大小、颜色、重量(如果支持)等)
我发现线性和对数标度往往依赖于数据集分布。在具有显著异常值的数据集中,我发现tanh有助于“平滑”结果值。我发现的解决方案如下
font\u size=(最大字体大小-最小字体大小)*(Math.sin(1.5*(X))+minsize
其中X是希望映射到字体大小的标准化值
X=(此值-最小值)/(最大值-最小值)
这增加了范围中较低的3个四分位数的大小差异,例如,为了最小化高离群值的影响Er,请查看此网站的右栏-按实例数降序,数字在右边。对我很有用。这是我最终采用的线性缩放。好主意:tanh,我来看看进一步的