C# Encode框架非数字示例，文本分类_C#_Machine Learning_Classification_Encog

C# Encode框架非数字示例，文本分类

c# machine-learning

C# Encode框架非数字示例，文本分类,c#,machine-learning,classification,encog,C#,Machine Learning,Classification,Encog,我看到的Encog框架示例描述了如何将数字数据分类为文本数据。例如，以下是用于经典Iris数据集的数据： "sepal_l","sepal_w","petal_l","petal_w","species" 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa 5.4,3.9

我看到的Encog框架示例描述了如何将数字数据分类为文本数据。例如，以下是用于经典Iris数据集的数据：

"sepal_l","sepal_w","petal_l","petal_w","species"
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
5.4,3.9,1.7,0.4,Iris-setosa

有没有简单的例子说明如何通过Encog规范化和使用文本，例如，像这样的数据（？）：

Encog目前没有为纯文本编码提供任何更高级别的抽象。Encog神经元的输入只是根据权重矩阵计算的数值。Encog可以对分类文本值进行编码。

分类器处理数字数据。有很多方法，比如上面的方法，可以从文本中选择特征，但是它们都是详细的算法，我知道没有简单的方法。谢谢链接。我已经知道如何在Python中实现这一点，但是有一些sklearn方法和其他软件包可以帮助将文本转换为数字，并消除停止词和其他类似的有用内容。我想知道，具体来说，Encog框架是否有这样的支持，如果我需要定制它的话。

"subject","body","Spam"
"This is the subject","This is the body",1
"This message is not spam","Lorem ipsum dolor",0
etc...