Machine learning 为什么NLP过程被认为是语言相关的?

Machine learning 为什么NLP过程被认为是语言相关的?,machine-learning,nlp,artificial-intelligence,sentiment-analysis,Machine Learning,Nlp,Artificial Intelligence,Sentiment Analysis,为什么NLP过程被认为是语言相关的 例如,这里: 在幻灯片6中,its说:“自然语言处理方法通常是专门为一种语言设计的” 为什么会这样?我认为,一旦使用机器学习实现了该方法,算法是相同的,您所需要的只是不同的训练集…在启发式的情况下,这些通常与问题和语言有关。在机器学习的情况下,是的,在抽象的理论意义上,“唯一”的区别是训练集。各种语言的训练集的可用性是第一个问题。然后是可以从训练集中删减的有用特征的数量,用于改进机器学习的启发式方法和知识源的可用性,使学习成功所需的超参数,等等 作为一个例子,

为什么NLP过程被认为是语言相关的

例如,这里: 在幻灯片6中,its说:“自然语言处理方法通常是专门为一种语言设计的”


为什么会这样?我认为,一旦使用机器学习实现了该方法,算法是相同的,您所需要的只是不同的训练集…

在启发式的情况下,这些通常与问题和语言有关。在机器学习的情况下,是的,在抽象的理论意义上,“唯一”的区别是训练集。各种语言的训练集的可用性是第一个问题。然后是可以从训练集中删减的有用特征的数量,用于改进机器学习的启发式方法和知识源的可用性,使学习成功所需的超参数,等等


作为一个例子,考虑命名实体识别(NER)问题。在英语数据中,“单词大写”这一特征几乎可以用来识别名字,但在德语中,每个名词都大写。结果是德语的NER问题与英语的NER问题完全不同。

谢谢@larsmans。我正在寻找有关情绪分析的资料,我知道不同语言有不同的情绪分析机器。你是说所有的区别都在启发式中吗?难道没有很多启发式和算法在某些语言中是有意义的,但在其他语言中是没有意义的吗?例如,在英语中,我可以根据句子中的词序进行一些处理,例如,区分“John likes Mary”和“Mary likes John”,而在拉丁语中,词序并不重要,但名称的大小写会很重要。不是一种语言的每一种方法都适用于另一种语言。是的,但这听起来像是“唯一”的启发式,而且算法的核心保持不变。。。?