String 比较字符串函数

String 比较字符串函数,string,compare,match,spss,String,Compare,Match,Spss,我有一个由许多字符串组成的文件。对于每个字符串,我想创建长度为4的子字符串,然后将每个子字符串与另一个SPSS文件中的单词词典进行比较。例如,如果我有字符串“transport”,我想创建一个包含4个字母的字符串的列表(例如,“tran”、“rans”、“ansp”等)。对于这些4个字母的字符串中的每一个,我想知道它是否存在于另一个包含一长串单词的文件中。以下是我在SPSS中的语法: *rawNonword是我的第一个文件中字符串的名称 compute chars=char.length(raw

我有一个由许多字符串组成的文件。对于每个字符串,我想创建长度为4的子字符串,然后将每个子字符串与另一个SPSS文件中的单词词典进行比较。例如,如果我有字符串“transport”,我想创建一个包含4个字母的字符串的列表(例如,“tran”、“rans”、“ansp”等)。对于这些4个字母的字符串中的每一个,我想知道它是否存在于另一个包含一长串单词的文件中。以下是我在SPSS中的语法:

*rawNonword是我的第一个文件中字符串的名称

compute chars=char.length(rawNonword)

绳夹(A50)

循环#i=1到chars-4

compute holder=char.substr(rawNonword,#i,4)

*这里我想将holder与另一个文件中的字符串进行比较

结束循环

执行


我意识到合并和匹配函数通常在SPSS中使用,但似乎无法在循环中使用它们。我相信这个问题在python中相当容易,但我需要在SPSS中完成这个任务。如果4个字母的字符串存在于另一个文件中,SPSS中是否有一个简单的函数可以返回值1或true?

使用Python插件和extendedTransforms.vlookup函数当然更容易,但在传统语法中,您可以创建一个包含所有四个字母片段的变量,对两个文件进行排序,并使用一个表匹配,匹配文件使用该变量作为键