如何使用Rhipe,R从HDFS中的文本文件读取数据?
我是R的新手,Rhipe和Hadoop想要从文件中读取数据,文件的内容是如何使用Rhipe,R从HDFS中的文本文件读取数据?,r,hadoop,hdfs,R,Hadoop,Hdfs,我是R的新手,Rhipe和Hadoop想要从文件中读取数据,文件的内容是 <Author>fallriverma <Content>Quality hotel at great price Very clean. <Date>Nov 25, 2008 <Rating>5 5 5 5 5 5 5 5 <Aspects> 1 8826(grat):1 3 3(clean):1 19(pri
<Author>fallriverma
<Content>Quality hotel at great price Very clean.
<Date>Nov 25, 2008
<Rating>5 5 5 5 5 5 5 5
<Aspects>
1 8826(grat):1
3 3(clean):1 19(price):1 187(quality):1
0
0
0
3 0(staff):1 12(friendly):1 14(helpful):1
3 6(breakfast):1 46(free):1 333(selection):1
0
<Author>yondaime1845
<Content>Its the best of the best for a reason One of the more affordable and better hotels in the city of seattle.
<Date>Jan 2, 2008
<Rating>5 5 5 5 5 5 5 5
<Aspects>
4 41(city):1 374(reason):1 762(seattle):1 1062(affordable):1
0
0
4 1(location):1 66(park):1 143(cheap):1 186(convenient):1
0
0
4 5(time):1 9(service):1 12(friendly):1 608(employee):1
0
法尔里维玛
优质酒店,价格优惠,非常干净。
2008年11月25日
5 5 5 5 5 5 5 5
18826(格拉特):1
3(清洁):119(价格):1187(质量):1
0
0
0
30(员工):112(友好):114(帮助):1
36(早餐):146(免费):1333(精选):1
0
韩台1845
这是最好的酒店中最好的,因为它是西雅图市最便宜、最好的酒店之一。
2008年1月2日
5 5 5 5 5 5 5 5
441(城市):1374(原因):1762(西雅图):11062(负担得起):1
0
0
416(公园):1143(便宜):1186(方便):1
0
0
45(时间):19(服务):112(友好):1608(员工):1
0
我想阅读“8826(qrat):1”中的作者和方面值,如8826,并想使用hadoop、rhipe和R按列显示它们
希望你的建议
提前感谢
rhls(“/user/notroot/input/”)
,给出您的HDFS
位置的完整路径-它会起作用我已经尝试过这个方法,但不允许使用多个分隔符“nynew1是我的文件,包含post中提到的数据