在C中读取可变长度字符串用户输入

在C中读取可变长度字符串用户输入,c,string,input,C,String,Input,我试图读入一个可变长度的用户输入并执行一些操作(比如在字符串中搜索子字符串) 问题是我不知道我的字符串有多大(文本很可能是3000-4000个字符) 我附上了我尝试过的示例代码和输出: char t[],p[]; int main(int argc, char** argv) { fflush(stdin); printf(" enter a string\n"); scanf("%s",t); printf(" enter a pattern\n");

我试图读入一个可变长度的用户输入并执行一些操作(比如在字符串中搜索子字符串)

问题是我不知道我的字符串有多大(文本很可能是3000-4000个字符)

我附上了我尝试过的示例代码和输出:

char t[],p[];
int main(int argc, char** argv) {
    fflush(stdin);
    printf(" enter a string\n");
    scanf("%s",t);

    printf(" enter a pattern\n");
    scanf("%s",p);

    int m=strlen(t);
    int n =strlen(p);
    printf(" text is %s %d  pattrn is %s %d \n",t,m,p,n);
    return (EXIT_SUCCESS);
}
输出为:

enter a string
bhavya
enter a pattern
av
text is bav 3  pattrn is av 2
请永远不要使用不安全的东西,如
scanf(“%s”)
或我个人不喜欢的东西,
gets()
——对于类似的东西,没有办法防止缓冲区溢出

您可以使用更安全的输入法,例如:

#include <stdio.h>
#include <string.h>

#define OK       0
#define NO_INPUT 1
#define TOO_LONG 2
static int getLine (char *prmpt, char *buff, size_t sz) {
    int ch, extra;

    // Get line with buffer overrun protection.
    if (prmpt != NULL) {
        printf ("%s", prmpt);
        fflush (stdout);
    }
    if (fgets (buff, sz, stdin) == NULL)
        return NO_INPUT;

    // If it was too long, there'll be no newline. In that case, we flush
    // to end of line so that excess doesn't affect the next call.
    if (buff[strlen(buff)-1] != '\n') {
        extra = 0;
        while (((ch = getchar()) != '\n') && (ch != EOF))
            extra = 1;
        return (extra == 1) ? TOO_LONG : OK;
    }

    // Otherwise remove newline and give string back to caller.
    buff[strlen(buff)-1] = '\0';
    return OK;
}

不要使用
scanf
gets
,因为正如您所说,没有真正的方法知道输入将持续多长时间。而是使用
fgets
stdin
作为最后一个参数
fgets
允许您指定应读取的最大字符数。如果你需要的话,你可以随时回去读更多的书


scanf(%s)
被读取,直到它们找到一个终止字符,并且可能超过缓冲区的长度,从而导致一些难以解决的问题。

实际上,您不应该为精确性操心太多。给自己一些空闲时间,让堆栈上有一些内存,并对其进行操作。一旦您想要进一步传递数据,您可以使用strdup(buffer)
并将其放在堆上。了解自己的极限。:-)


本例中的主要问题是具有未知大小的字符数组。只需在声明中指定数组大小

int main(int argc, char** argv) {
    int s1[4096], s2[4096];
    fflush(stdin);
    printf(" enter a string\n");
    scanf("%s", s1);

    printf(" enter a pattern\n");
    scanf("%s", s2);

    int m = strlen(s1);
    int n = strlen(s2);
    printf(" text is %s of length %d, pattern is %s of length %d \n", s1, m, s2, n);
    return (EXIT_SUCCESS);
}

scanf
可以通过宽度说明符安全使用:
char name[40];如果(scanf(“%39s”,name)!=1)/*错误*/
可以想象,
fgets
返回一个没有字符的缓冲区。如果发生这种情况,
getLine
函数中的代码将尝试访问
buffer[-1]
,这是一种未定义的行为。@pmg,如果你做了一些愚蠢的事情,比如传递一个缓冲区大小,表明你不想要任何字符,这可能会发生,但我甚至不确定。在正常情况下,您将始终拥有数据,或者返回NULL(这样您就不会检查缓冲区)。这个函数已经用我能想到的所有情况(空行、文件结尾、大于所需行、较短、精确大小等)进行了测试,没有问题。如果您发现一个edge案例不起作用,请告诉我,我会修复它,特别是因为它在我编写的生产代码中使用了很多:-)好吧,您可以通过存储
strlen(buff)轻松避免风险并使您的函数更快一点
输入局部变量,并在尝试访问最后一个字符之前检查它是否为零。这样,您也不需要调用
strlen()
两次。@pax非常感谢您的代码,但我想知道的是,在某些情况下,我想读5000个字符以上,我还能使用这样的东西吗?@Bhavya,是的,您只需要创建
buff
就可以了(并可能将其从堆栈移到全局变量或在堆上分配,如果它真的很大)。请注意,在stdin(或任何输入流)上使用fflush在C中是未定义的行为。因此,它可能会导致计算机停止并起火。ISO 9899:1999 7.19.5.2。
int main(int argc, char** argv) {
    char text[4096]; 
    char pattern[4096]; 
    fflush(stdin);
    printf(" enter a string\n");
    fgets(text, sizeof(text), stdin);

    printf(" enter a pattern\n");
    fgets(pattern, sizeof(pattern), stdin);

    int m=strlen(text);
    int n =strlen(pattern);
    printf(" text is %s %d  pattrn is %s %d \n",text,m,pattern,n);
    return (EXIT_SUCCESS);
}
int main(int argc, char** argv) {
    int s1[4096], s2[4096];
    fflush(stdin);
    printf(" enter a string\n");
    scanf("%s", s1);

    printf(" enter a pattern\n");
    scanf("%s", s2);

    int m = strlen(s1);
    int n = strlen(s2);
    printf(" text is %s of length %d, pattern is %s of length %d \n", s1, m, s2, n);
    return (EXIT_SUCCESS);
}