语言处理-使用R还是Python?

语言处理-使用R还是Python?,python,r,text,Python,R,Text,我对自然语言处理感兴趣。可能从检查文本的语调开始(可能使用哈佛IV-4词典)。稍后,可能会转向使用主题模型 我在R方面比Python好得多,但最近我用Python做了一些web抓取 如何开始?Python以自然语言处理著称 见NLTK: 主页上的快速演示: >>> import nltk >>> sentence = """At eight o'clock on Thursday morning ... Arthur didn't feel very good

我对自然语言处理感兴趣。可能从检查文本的语调开始(可能使用哈佛IV-4词典)。稍后,可能会转向使用主题模型

我在R方面比Python好得多,但最近我用Python做了一些web抓取


如何开始?

Python以自然语言处理著称

见NLTK:

主页上的快速演示:

>>> import nltk
>>> sentence = """At eight o'clock on Thursday morning
... Arthur didn't feel very good."""
>>> tokens = nltk.word_tokenize(sentence)
>>> tokens
['At', 'eight', "o'clock", 'on', 'Thursday', 'morning',
'Arthur', 'did', "n't", 'feel', 'very', 'good', '.']
>>> tagged = nltk.pos_tag(tokens)
>>> tagged[0:6]
[('At', 'IN'), ('eight', 'CD'), ("o'clock", 'JJ'), ('on', 'IN'),
('Thursday', 'NNP'), ('morning', 'NN')]

我想这足够让你开始了

Python以自然语言处理著称

见NLTK:

主页上的快速演示:

>>> import nltk
>>> sentence = """At eight o'clock on Thursday morning
... Arthur didn't feel very good."""
>>> tokens = nltk.word_tokenize(sentence)
>>> tokens
['At', 'eight', "o'clock", 'on', 'Thursday', 'morning',
'Arthur', 'did', "n't", 'feel', 'very', 'good', '.']
>>> tagged = nltk.pos_tag(tokens)
>>> tagged[0:6]
[('At', 'IN'), ('eight', 'CD'), ("o'clock", 'JJ'), ('on', 'IN'),
('Thursday', 'NNP'), ('morning', 'NN')]

我想这足够让你开始了

我个人对R不太了解。不过,我可以建议您查看特定于NLP的CRAN页面。事实上,R通过openNLP包绑定到


您应该始终使用您熟悉的语言,以避免过多的开发时间(主要是学习新语言的开销)和头发撕裂。您应该使用R。我知道Python,所以我可能会使用它。真的,这取决于你……我个人对R不太了解。不过,我可以建议您查看特定于NLP的CRAN页面。事实上,R通过openNLP包绑定到


您应该始终使用您熟悉的语言,以避免过多的开发时间(主要是学习新语言的开销)和头发撕裂。您应该使用R。我知道Python,所以我可能会使用它。真的,这取决于你…

一般来说,用一种你更熟悉的语言编写代码,这样你的辛勤工作就不会变成无法管理的混乱局面。重新编写后提名重新打开,以符合帮助中心的规则。一般来说,使用您更熟悉的语言编写代码,这样您的辛勤工作就不会变成无法管理的混乱局面。重新编写后重新打开提名以符合帮助中心的规则。