如何在Python中绘制基于日语字符串的数据
我有这样一个csv:如何在Python中绘制基于日语字符串的数据,python,string,python-ggplot,morphological-analysis,Python,String,Python Ggplot,Morphological Analysis,我有这样一个csv: Date, i, eat, chicken, you, fish, banana 2014-9-14, 1, 2, 1, 1, 1, 0 2014-10-15, 1, 1, 1, 0, 0, 0 2014-11-13, 0, 1, 0, 1, 0, 1 忘记大写/小写和词干,因为我将对日语文本进行形态学分析 最终目标: (我没有足够的声誉来发布图片。) 注:Y轴为字数。它不必是点、x、正方形和一些随机形状,只要有不同颜色的点/x就可以了 如果可能的话,我想使用ggplot
Date, i, eat, chicken, you, fish, banana
2014-9-14, 1, 2, 1, 1, 1, 0
2014-10-15, 1, 1, 1, 0, 0, 0
2014-11-13, 0, 1, 0, 1, 0, 1
忘记大写/小写和词干,因为我将对日语文本进行形态学分析
最终目标:
(我没有足够的声誉来发布图片。)
注:Y轴为字数。它不必是点、x、正方形和一些随机形状,只要有不同颜色的点/x就可以了
如果可能的话,我想使用ggplot而不是matplotlib。您可能正在寻找一种形式的。显示了如何配置一个
数据应已采用绘图所需的格式。在您的情况下,您可能应该省略
stat_smooth()
,因为这些词实际上并不相关。如何在2014-09-14
上决定eat
2@Wazzzy“我吃*鸡,你吃*鸡”这句话中有两个“吃”,mData上有一些错误,现在请更正,对不起。错误:我吃鸡肉,你吃鱼。那么你的问题是什么?是如何用自定义图标绘制日期与频率散点图,还是如何进行字数统计以输出.csv?如果两者都是,那么请把这分成两个独立的问题。我看不出这些数字在日语文本中的字数与当前形式的问题有什么关联。我建议删除不相关的信息。