在C中读取可变长度字符串用户输入
我试图读入一个可变长度的用户输入并执行一些操作(比如在字符串中搜索子字符串) 问题是我不知道我的字符串有多大(文本很可能是3000-4000个字符) 我附上了我尝试过的示例代码和输出:在C中读取可变长度字符串用户输入,c,string,input,C,String,Input,我试图读入一个可变长度的用户输入并执行一些操作(比如在字符串中搜索子字符串) 问题是我不知道我的字符串有多大(文本很可能是3000-4000个字符) 我附上了我尝试过的示例代码和输出: char t[],p[]; int main(int argc, char** argv) { fflush(stdin); printf(" enter a string\n"); scanf("%s",t); printf(" enter a pattern\n");
char t[],p[];
int main(int argc, char** argv) {
fflush(stdin);
printf(" enter a string\n");
scanf("%s",t);
printf(" enter a pattern\n");
scanf("%s",p);
int m=strlen(t);
int n =strlen(p);
printf(" text is %s %d pattrn is %s %d \n",t,m,p,n);
return (EXIT_SUCCESS);
}
输出为:
enter a string
bhavya
enter a pattern
av
text is bav 3 pattrn is av 2
请永远不要使用不安全的东西,如scanf(“%s”)
或我个人不喜欢的东西,gets()
——对于类似的东西,没有办法防止缓冲区溢出
您可以使用更安全的输入法,例如:
#include <stdio.h>
#include <string.h>
#define OK 0
#define NO_INPUT 1
#define TOO_LONG 2
static int getLine (char *prmpt, char *buff, size_t sz) {
int ch, extra;
// Get line with buffer overrun protection.
if (prmpt != NULL) {
printf ("%s", prmpt);
fflush (stdout);
}
if (fgets (buff, sz, stdin) == NULL)
return NO_INPUT;
// If it was too long, there'll be no newline. In that case, we flush
// to end of line so that excess doesn't affect the next call.
if (buff[strlen(buff)-1] != '\n') {
extra = 0;
while (((ch = getchar()) != '\n') && (ch != EOF))
extra = 1;
return (extra == 1) ? TOO_LONG : OK;
}
// Otherwise remove newline and give string back to caller.
buff[strlen(buff)-1] = '\0';
return OK;
}
不要使用
scanf
或gets
,因为正如您所说,没有真正的方法知道输入将持续多长时间。而是使用fgets
将stdin
作为最后一个参数fgets
允许您指定应读取的最大字符数。如果你需要的话,你可以随时回去读更多的书
scanf(%s)
和被读取,直到它们找到一个终止字符,并且可能超过缓冲区的长度,从而导致一些难以解决的问题。实际上,您不应该为精确性操心太多。给自己一些空闲时间,让堆栈上有一些内存,并对其进行操作。一旦您想要进一步传递数据,您可以使用strdup(buffer)
并将其放在堆上。了解自己的极限。:-)
本例中的主要问题是具有未知大小的字符数组。只需在声明中指定数组大小
int main(int argc, char** argv) {
int s1[4096], s2[4096];
fflush(stdin);
printf(" enter a string\n");
scanf("%s", s1);
printf(" enter a pattern\n");
scanf("%s", s2);
int m = strlen(s1);
int n = strlen(s2);
printf(" text is %s of length %d, pattern is %s of length %d \n", s1, m, s2, n);
return (EXIT_SUCCESS);
}
scanf
可以通过宽度说明符安全使用:char name[40];如果(scanf(“%39s”,name)!=1)/*错误*/
可以想象,fgets
返回一个没有字符的缓冲区。如果发生这种情况,getLine
函数中的代码将尝试访问buffer[-1]
,这是一种未定义的行为。@pmg,如果你做了一些愚蠢的事情,比如传递一个缓冲区大小,表明你不想要任何字符,这可能会发生,但我甚至不确定。在正常情况下,您将始终拥有数据,或者返回NULL(这样您就不会检查缓冲区)。这个函数已经用我能想到的所有情况(空行、文件结尾、大于所需行、较短、精确大小等)进行了测试,没有问题。如果您发现一个edge案例不起作用,请告诉我,我会修复它,特别是因为它在我编写的生产代码中使用了很多:-)好吧,您可以通过存储strlen(buff)轻松避免风险并使您的函数更快一点
输入局部变量,并在尝试访问最后一个字符之前检查它是否为零。这样,您也不需要调用strlen()
两次。@pax非常感谢您的代码,但我想知道的是,在某些情况下,我想读5000个字符以上,我还能使用这样的东西吗?@Bhavya,是的,您只需要创建buff
就可以了(并可能将其从堆栈移到全局变量或在堆上分配,如果它真的很大)。请注意,在stdin(或任何输入流)上使用fflush在C中是未定义的行为。因此,它可能会导致计算机停止并起火。ISO 9899:1999 7.19.5.2。
int main(int argc, char** argv) {
char text[4096];
char pattern[4096];
fflush(stdin);
printf(" enter a string\n");
fgets(text, sizeof(text), stdin);
printf(" enter a pattern\n");
fgets(pattern, sizeof(pattern), stdin);
int m=strlen(text);
int n =strlen(pattern);
printf(" text is %s %d pattrn is %s %d \n",text,m,pattern,n);
return (EXIT_SUCCESS);
}
int main(int argc, char** argv) {
int s1[4096], s2[4096];
fflush(stdin);
printf(" enter a string\n");
scanf("%s", s1);
printf(" enter a pattern\n");
scanf("%s", s2);
int m = strlen(s1);
int n = strlen(s2);
printf(" text is %s of length %d, pattern is %s of length %d \n", s1, m, s2, n);
return (EXIT_SUCCESS);
}