Machine learning 如何从任意句子中提取特定单词?

Machine learning 如何从任意句子中提取特定单词?,machine-learning,nlp,Machine Learning,Nlp,我需要从字符串中提取某些单词。例如: input: "Potatoes, baked, flesh and skin, without salt" output: {title: "Potatoes", processing: "baked"} input: "Chicken drumstick, fried, coated, skin / coating eaten, from pre-cooked" outpu

我需要从字符串中提取某些单词。例如:

input: "Potatoes, baked, flesh and skin, without salt"
output: {title: "Potatoes", processing: "baked"}

input: "Chicken drumstick, fried, coated, skin / coating eaten, from pre-cooked"
output: {title: "Chicken drumstick", processing: "fried"}
我试着在这方面训练一个ML模型,但这需要很长时间。我需要以这种方式处理的数据集并没有那么大:~16000个字符串,就像我上面展示的那样

解决这个问题的可能方法是什么?也许有预先训练过的模型,比如伯特?或者也许有一种方法可以在没有ML的情况下破解它


很抱歉这个模糊的问题,请至少为我指出一些方向,这样我可以改进这个问题。

不确定ML是否能帮助解决这个问题。如果您的输入是句子,您可以使用词性标记和/或NER来识别和提取成分和加工过程。您的输入是缺少大多数ML和NLP模型所依赖的句子结构上下文的CSV列表。一些蛮力启发法可能工作得更好更快。