挑战:用R复制多眼单词树
IBM数据可视化实验Many eyes提供了一种非常有趣的可视化连续文本(如演讲或短语)的方法。基本上,你选择一个起始词,它会为该词后面的所有句子创建类似于树状图或树的东西,通常由所选词后面的动词分解 这里有一个例子: 虽然有一些交互组件,但我只关心图形本身挑战:用R复制多眼单词树,r,R,IBM数据可视化实验Many eyes提供了一种非常有趣的可视化连续文本(如演讲或短语)的方法。基本上,你选择一个起始词,它会为该词后面的所有句子创建类似于树状图或树的东西,通常由所选词后面的动词分解 这里有一个例子: 虽然有一些交互组件,但我只关心图形本身 在R中是否存在这样做的现有方法?如果没有,你能想出一个方法(在R中)吗?我不知道他们怎么把它拆了。我会让销售代表提出解决方案,但也会接受经过深思熟虑的想法 你看过d3.js了吗 Dendogram示例: 可折叠树: 旋转群集: 谷歌利
在R中是否存在这样做的现有方法?如果没有,你能想出一个方法(在R中)吗?我不知道他们怎么把它拆了。我会让销售代表提出解决方案,但也会接受经过深思熟虑的想法 你看过d3.js了吗 Dendogram示例: 可折叠树: 旋转群集:
谷歌利用谷歌图表工具为此做出了巨大贡献 只需如下更改数据数组
<script type="text/javascript" src="https://www.gstatic.com/charts/loader.js"></script>
<script type="text/javascript">
google.charts.load('current', {packages:['wordtree']});
google.charts.setOnLoadCallback(drawChart);
function drawChart() {
var data = google.visualization.arrayToDataTable(
[ ['Phrases'],
['abd adalet bakanligi fiat chrysler sorustur'],
['abd adalet bakanligi fiat chrysler sorusturma acti'],
['abd adalet bakanligi fiat chrysler sorusturma acti abd adalet bakanliginin fiat chrysler fca hakkinda dizel'],
['abd adalet bakanligi fiat chrysler sorusturma acti abd adalet bakanliginin fiat chrysler fca hakkinda dizel araclarinda emisyon'],
['abd adalet bakanligi fiat chrysler sorusturma acti haberin detaylari icin tiklayiniz'],
['abd adalet bakanligi fiat chrysler sorusturma acti kazakistan haber'],
['abd adalet bakanligi fiat chrysler sorusturma acti sondakika'],
]
);
var options = {
wordtree: {
format: 'implicit',
word: 'cats'
}
};
var chart = new google.visualization.WordTree(document.getElementById('wordtree_basic'));
chart.draw(data, options);
}
</script>
<body>
<div id="wordtree_basic" style="width: 900px; height: 500px;"></div>
</body>
load('current',{packages:['wordtree']});
google.charts.setOnLoadCallback(drawChart);
函数绘图图(){
var data=google.visualization.arrayToDataTable(
[“短语”],
['abd adalet bakanligi菲亚特克莱斯勒索鲁斯特'],
['abd adalet bakanligi菲亚特克莱斯勒索鲁斯图尔马行动'],
['abd adalet bakanligi菲亚特克莱斯勒sorusturma acti abd adalet Bakanligin菲亚特克莱斯勒fca hakkinda dizel'],
['abd adalet bakanligi fiat chrysler sorusturma acti abd adalet Bakanligin fiat chrysler fca hakkinda dizel araclarinda Emission'],
[abd adalet bakanligi fiat chrysler sorusturma acti haberin detaylari icin tiklayiniz',
['abd adalet bakanligi fiat CHRRESTER sorusturma acti kazakistan haber'],
['abd adalet bakanligi菲亚特克莱斯勒sorusturma acti sondakika'],
]
);
变量选项={
文字树:{
格式:“隐式”,
单词:“猫”
}
};
var chart=new google.visualization.WordTree(document.getElementById('WordTree_basic');
图表绘制(数据、选项);
}
非常有趣,可能对Brandon有用,但我不相信这些是R解决方案。这些不是R解决方案,但使用brew创建html/js文件非常简单,而且结果具有高度可移植性和可分发性。我使用这些函数甚至是为了快速和肮脏的工作。我认为显示是这个问题中最简单的部分:计算要显示的正确摘要会更难。事实上,显示并不像你想象的那么简单。加上d3.js基于标准(html、javascript、svg、html5)。如前所述,使用程序集或基于服务器的渲染定制可视化更具可移植性。@Tylerlinker如果你看了他的问题,他说如果不是在R中,你怎么做。你希望你的数据有什么结构,或者你的语料库使用什么?最基本的单词树从识别语料库中每个单词的频率开始,并将其用作主干(或者是根?)并从那里分支(但也提供了指定主干的选项)。你是想使用这种方法,还是从更语言学的角度来看待它(你提到的单词是动词vollowed)?你喜欢长句,还是只对展示搭配或n字格到一定深度感兴趣?(这可能会影响您对初始数据结构的选择。)