Import 导入自由文本文件

Import 导入自由文本文件,import,sas,nlp,Import,Sas,Nlp,我被要求在SAS中的自由文本文档文件夹上执行NLP。通常我是用Python或R来实现的,我不知道如何将txt文件导入SAS,因为没有结构 我曾考虑过使用proc import,但不知道将使用什么作为分隔符。如何将没有结构的自由文本文件导入SAS?我想一旦我进去,我就可以使用“%like%”之类的东西来提取他们想要的东西。我强烈建议不要这样做。为正确的工作使用正确的工具,在这种情况下,它不是SAS 好的,这就是你可以做的一些基本工作: 导入文本文件并创建n个字符。理想情况下,1、2和3个单词 使用

我被要求在SAS中的自由文本文档文件夹上执行NLP。通常我是用Python或R来实现的,我不知道如何将txt文件导入SAS,因为没有结构


我曾考虑过使用proc import,但不知道将使用什么作为分隔符。如何将没有结构的自由文本文件导入SAS?我想一旦我进去,我就可以使用“%like%”之类的东西来提取他们想要的东西。

我强烈建议不要这样做。为正确的工作使用正确的工具,在这种情况下,它不是SAS

好的,这就是你可以做的一些基本工作: 导入文本文件并创建n个字符。理想情况下,1、2和3个单词

使用PROC FREQ汇总n-gram

找到一个词类语料库,并合并比1克,以删除无用的话

计算单词长度和句子长度以创建文档复杂性分数


这些在基地都是可行的

建议您显示示例文件的几行。以及您希望如何将其存储在SAS中。这太广泛(并且缺少详细信息),现在无法回答。你可以用很多种方法来做,这取决于你使用的是什么。您正在使用文本挖掘器吗?(这是我希望您用于这类事情的产品。)大致的答案是您输入一个文本字符串,但这取决于具体情况。做一些研究,这已经很好地涵盖了。我不能显示一个样本文件,但它们到处都是。我想输入会有用的。我没有使用文本挖掘。我希望我使用的是Text-Miner,但有人告诉我我没有使用Text-Miner。你需要能够显示一个示例文件-它不一定是实际数据或任何秘密,而是看起来或多或少像你试图处理的东西。否则我们该怎么帮助?你想做什么?在BASE中,您基本上需要编写所有算法,因此我强烈建议您使用EMiner,或者在需要时从IML调用R。