Machine learning 对文档中的单词进行分类

Machine learning 对文档中的单词进行分类,machine-learning,text-classification,Machine Learning,Text Classification,我面临的问题是: 我想阅读一个文档,获取该文档的原始字符串,并对信息进行分类。 例如,我想确定字符串何时是“名称”或“日期”,以及其他一些有用的信息 有没有可能用机器学习来做到这一点? 我如何处理这个问题 这里最困难的问题是,我没有试图对文档本身进行分类,而是对文档中的字符串信息进行分类。因此,这都是关于您如何看待问题的。我认为您的问题可以表述为实体提取/识别问题,即您有一个文档并希望在文本中识别特定实体(其中实体可能是个人、日期等)。看看条件随机场及其在命名实体识别(简称NER)中的应用,因为

我面临的问题是: 我想阅读一个文档,获取该文档的原始字符串,并对信息进行分类。 例如,我想确定字符串何时是“名称”或“日期”,以及其他一些有用的信息

有没有可能用机器学习来做到这一点? 我如何处理这个问题


这里最困难的问题是,我没有试图对文档本身进行分类,而是对文档中的字符串信息进行分类。

因此,这都是关于您如何看待问题的。我认为您的问题可以表述为实体提取/识别问题,即您有一个文档并希望在文本中识别特定实体(其中实体可能是个人、日期等)。看看条件随机场及其在命名实体识别(简称NER)中的应用,因为已经实现了一些库和工具


例如,请查看。

因此,这一切都是关于你如何看待自己的问题。我认为您的问题可以表述为实体提取/识别问题,即您有一个文档并希望在文本中识别特定实体(其中实体可能是个人、日期等)。看看条件随机场及其在命名实体识别(简称NER)中的应用,因为已经实现了一些库和工具


例如,签出。

为什么不签出?只需将字符串作为短文本本身考虑即可。查看以下帖子:,。感谢您的反馈。我来看看为什么不呢?只需将字符串作为短文本本身考虑即可。查看以下帖子:,。感谢您的反馈。我去看看谢谢你的提示。我想这正是我想要的。我的问题似乎反复出现,但我不知道这个缩写。谢谢,谢谢你的建议。我想这正是我想要的。我的问题似乎反复出现,但我不知道这个缩写。谢谢