如何使用Rhipe,R从HDFS中的文本文件读取数据?

如何使用Rhipe,R从HDFS中的文本文件读取数据?,r,hadoop,hdfs,R,Hadoop,Hdfs,我是R的新手,Rhipe和Hadoop想要从文件中读取数据,文件的内容是 <Author>fallriverma <Content>Quality hotel at great price Very clean. <Date>Nov 25, 2008 <Rating>5 5 5 5 5 5 5 5 <Aspects> 1 8826(grat):1 3 3(clean):1 19(pri

我是R的新手,Rhipe和Hadoop想要从文件中读取数据,文件的内容是

<Author>fallriverma
<Content>Quality hotel at great price Very clean.
<Date>Nov 25, 2008
<Rating>5   5   5   5   5   5   5   5   
<Aspects>
1   8826(grat):1    
3   3(clean):1  19(price):1 187(quality):1  
0   
0   
0   
3   0(staff):1  12(friendly):1  14(helpful):1   
3   6(breakfast):1  46(free):1  333(selection):1    
0

<Author>yondaime1845
<Content>Its the best of the best for a reason One of the more affordable and better hotels in the city of seattle.
<Date>Jan 2, 2008
<Rating>5   5   5   5   5   5   5   5   
<Aspects>
4   41(city):1  374(reason):1   762(seattle):1  1062(affordable):1  
0   
0   
4   1(location):1   66(park):1  143(cheap):1    186(convenient):1   
0   
0   
4   5(time):1   9(service):1    12(friendly):1  608(employee):1 
0
法尔里维玛 优质酒店,价格优惠,非常干净。 2008年11月25日 5 5 5 5 5 5 5 5 18826(格拉特):1 3(清洁):119(价格):1187(质量):1 0 0 0 30(员工):112(友好):114(帮助):1 36(早餐):146(免费):1333(精选):1 0 韩台1845 这是最好的酒店中最好的,因为它是西雅图市最便宜、最好的酒店之一。 2008年1月2日 5 5 5 5 5 5 5 5 441(城市):1374(原因):1762(西雅图):11062(负担得起):1 0 0 416(公园):1143(便宜):1186(方便):1 0 0 45(时间):19(服务):112(友好):1608(员工):1 0 我想阅读“8826(qrat):1”中的作者和方面值,如8826,并想使用hadoop、rhipe和R按列显示它们

希望你的建议


提前感谢

rhls(“/user/notroot/input/”)
,给出您的
HDFS
位置的完整路径-它会起作用

我已经尝试过这个方法,但不允许使用多个分隔符“nynew1是我的文件,包含post中提到的数据