C# Encode框架非数字示例,文本分类

C# Encode框架非数字示例,文本分类,c#,machine-learning,classification,encog,C#,Machine Learning,Classification,Encog,我看到的Encog框架示例描述了如何将数字数据分类为文本数据。例如,以下是用于经典Iris数据集的数据: "sepal_l","sepal_w","petal_l","petal_w","species" 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa 5.4,3.9

我看到的Encog框架示例描述了如何将数字数据分类为文本数据。例如,以下是用于经典Iris数据集的数据:

"sepal_l","sepal_w","petal_l","petal_w","species"
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
5.4,3.9,1.7,0.4,Iris-setosa
有没有简单的例子说明如何通过Encog规范化和使用文本,例如,像这样的数据(?):


Encog目前没有为纯文本编码提供任何更高级别的抽象。Encog神经元的输入只是根据权重矩阵计算的数值。Encog可以对分类文本值进行编码。

分类器处理数字数据。有很多方法,比如上面的方法,可以从文本中选择特征,但是它们都是详细的算法,我知道没有简单的方法。谢谢链接。我已经知道如何在Python中实现这一点,但是有一些sklearn方法和其他软件包可以帮助将文本转换为数字,并消除停止词和其他类似的有用内容。我想知道,具体来说,Encog框架是否有这样的支持,如果我需要定制它的话。
"subject","body","Spam"
"This is the subject","This is the body",1
"This message is not spam","Lorem ipsum dolor",0
etc...