为什么,而不是如何:Stata错误地在变量中包含混合(字符串和数值)值的大型数据集上标识变量类型

为什么,而不是如何:Stata错误地在变量中包含混合(字符串和数值)值的大型数据集上标识变量类型,stata,Stata,我正在读一个500万条观察管分隔的文本文件。一列的前250000个值是数字;其余的是字符串。下面的代码导入了前250000个数值,将变量声明为数值(long),并将字符串值视为缺失 导入带分隔符的“mixed_types.txt”,分隔符(“|”) 解决方案:将所有变量作为字符串导入,然后销毁: import delimited "mixed_types.txt", delimiter("|") stringcols(_all) destring, replace 我的问题是,为什么?导入分隔

我正在读一个500万条观察管分隔的文本文件。一列的前250000个值是数字;其余的是字符串。下面的代码导入了前250000个数值,将变量声明为数值(long),并将字符串值视为缺失

导入带分隔符的“mixed_types.txt”,分隔符(“|”)

解决方案:将所有变量作为字符串导入,然后销毁:

import delimited "mixed_types.txt", delimiter("|") stringcols(_all)
destring, replace

我的问题是,为什么?导入分隔符的帮助文件指出,“导入分隔符将根据第一行数据检查文件是否由制表符或逗号分隔。”是否遵循此规则来分配变量类型?

,这不是预期的行为

原文如下:

  • import delimited具有以下修复程序:

    a、 导入分隔,当字符串数据在第行之前不存在时 对于导入的文本文件中的变量,数字为5000或更高, 错误地选择了数字数据类型而不是字符串数据 该变量的类型。这已修复

  • 您需要
    更新
    。请参阅
    帮助更新


    (运行
    help whatsnew
    可以访问相同的信息。更新是针对Stata 14的。)

    这不是预期的行为

    原文如下:

  • import delimited具有以下修复程序:

    a、 导入分隔,当字符串数据在第行之前不存在时 对于导入的文本文件中的变量,数字为5000或更高, 错误地选择了数字数据类型而不是字符串数据 该变量的类型。这已修复

  • 您需要
    更新
    。请参阅
    帮助更新


    (运行
    help whatsnew
    可以访问相同的信息。更新是针对Stata 14的。)

    这不是预期的行为

    原文如下:

  • import delimited具有以下修复程序:

    a、 导入分隔,当字符串数据在第行之前不存在时 对于导入的文本文件中的变量,数字为5000或更高, 错误地选择了数字数据类型而不是字符串数据 该变量的类型。这已修复

  • 您需要
    更新
    。请参阅
    帮助更新


    (运行
    help whatsnew
    可以访问相同的信息。更新是针对Stata 14的。)

    这不是预期的行为

    原文如下:

  • import delimited具有以下修复程序:

    a、 导入分隔,当字符串数据在第行之前不存在时 对于导入的文本文件中的变量,数字为5000或更高, 错误地选择了数字数据类型而不是字符串数据 该变量的类型。这已修复

  • 您需要
    更新
    。请参阅
    帮助更新


    (运行
    帮助whatsnew
    可以访问相同的信息。此更新适用于Stata 14。)

    您的Stata安装是最新的吗?您提出的问题似乎与手动输入的
    导入分隔的
    的示例3不一致。我暂时无法测试,但请确保您的问题是可重现的,并提供一个最小的示例(包括数据)。问题发生在Unix版本的Stata 14上,我们上次更新该版本是在4月2日。下面的链接表明问题是在6月10日修补的。您的Stata安装是否最新?您提出的问题似乎与手动输入的示例3中的
    import delimited
    不一致。我暂时无法测试,但请确保正确我们的问题是可重复发布一个最小的示例(包括数据)。问题发生在Unix版本的Stata 14上,我们上次更新该版本是在4月2日。下面的链接表明问题是在6月10日修补的。您的Stata安装是否最新?您提出的问题似乎与手动输入的示例3中的
    import delimited
    不一致。我暂时无法测试,但请确保正确我们的问题是可重复发布一个最小的示例(包括数据)。问题发生在Unix版本的Stata 14上,我们上次更新该版本是在4月2日。下面的链接表明问题是在6月10日修补的。您的Stata安装是否最新?您提出的问题似乎与手动输入的示例3中的
    import delimited
    不一致。我暂时无法测试,但请确保正确我们的问题是可复制的,只发布了一个最小的示例(包括数据)。问题发生在Stata 14的Unix版本上,我们上次更新该版本是在4月2日。下面的链接表明问题是在6月10日修复的。