语言处理-使用R还是Python？_Python_R_Text

语言处理-使用R还是Python？

python r text

语言处理-使用R还是Python？,python,r,text,Python,R,Text,我对自然语言处理感兴趣。可能从检查文本的语调开始（可能使用哈佛IV-4词典）。稍后，可能会转向使用主题模型我在R方面比Python好得多，但最近我用Python做了一些web抓取如何开始？Python以自然语言处理著称见NLTK：主页上的快速演示： >>> import nltk >>> sentence = """At eight o'clock on Thursday morning ... Arthur didn't feel very good

我对自然语言处理感兴趣。可能从检查文本的语调开始（可能使用哈佛IV-4词典）。稍后，可能会转向使用主题模型

我在R方面比Python好得多，但最近我用Python做了一些web抓取

如何开始？

Python以自然语言处理著称

见NLTK：

主页上的快速演示：

>>> import nltk
>>> sentence = """At eight o'clock on Thursday morning
... Arthur didn't feel very good."""
>>> tokens = nltk.word_tokenize(sentence)
>>> tokens
['At', 'eight', "o'clock", 'on', 'Thursday', 'morning',
'Arthur', 'did', "n't", 'feel', 'very', 'good', '.']
>>> tagged = nltk.pos_tag(tokens)
>>> tagged[0:6]
[('At', 'IN'), ('eight', 'CD'), ("o'clock", 'JJ'), ('on', 'IN'),
('Thursday', 'NNP'), ('morning', 'NN')]

我想这足够让你开始了

Python以自然语言处理著称

见NLTK：

主页上的快速演示：

>>> import nltk
>>> sentence = """At eight o'clock on Thursday morning
... Arthur didn't feel very good."""
>>> tokens = nltk.word_tokenize(sentence)
>>> tokens
['At', 'eight', "o'clock", 'on', 'Thursday', 'morning',
'Arthur', 'did', "n't", 'feel', 'very', 'good', '.']
>>> tagged = nltk.pos_tag(tokens)
>>> tagged[0:6]
[('At', 'IN'), ('eight', 'CD'), ("o'clock", 'JJ'), ('on', 'IN'),
('Thursday', 'NNP'), ('morning', 'NN')]

我想这足够让你开始了

我个人对R不太了解。不过，我可以建议您查看特定于NLP的CRAN页面。事实上，R通过openNLP包绑定到

您应该始终使用您熟悉的语言，以避免过多的开发时间（主要是学习新语言的开销）和头发撕裂。您应该使用R。我知道Python，所以我可能会使用它。真的，这取决于你……我个人对R不太了解。不过，我可以建议您查看特定于NLP的CRAN页面。事实上，R通过openNLP包绑定到

您应该始终使用您熟悉的语言，以避免过多的开发时间（主要是学习新语言的开销）和头发撕裂。您应该使用R。我知道Python，所以我可能会使用它。真的，这取决于你…

一般来说，用一种你更熟悉的语言编写代码，这样你的辛勤工作就不会变成无法管理的混乱局面。重新编写后提名重新打开，以符合帮助中心的规则。一般来说，使用您更熟悉的语言编写代码，这样您的辛勤工作就不会变成无法管理的混乱局面。重新编写后重新打开提名以符合帮助中心的规则。