D中的3D字符数组有问题
我正在学习D,我有一个简单的程序,可以逐行读取文本文件,将每行分割成不同的单词,然后将整个内容打印到标准输出D中的3D字符数组有问题,d,D,我正在学习D,我有一个简单的程序,可以逐行读取文本文件,将每行分割成不同的单词,然后将整个内容打印到标准输出 import std.stdio; import std.string; void main(string args[]) { char[][][] lines; auto input = File(args[1], "r"); foreach(line; input.byLine()) { auto words = split(stri
import std.stdio;
import std.string;
void main(string args[])
{
char[][][] lines;
auto input = File(args[1], "r");
foreach(line; input.byLine())
{
auto words = split(strip(line));
lines ~= words;
}
foreach(line; lines)
{
writeln(line);
}
}
创建单词的代码可以正常工作。如果每次分配单词时只调用writeln
,我就会得到想要的输出。但是如果我在行
中添加单词
,并输出行
,那么奇怪的事情就会发生<代码>行
在源文件中的每一行都有一个条目,但每一行都是上次读取的损坏版本。例如,如果文件的最后一行如下所示:
END START * End of routine
[ , END, ST, *, End , f rout, ne, , , e other]
[ , END, ST, *, End of, rout, ne, , , e othe]
[ , END, STAR, *, End of, rout, ne.,
e]
[ , END, START , *, End of, rout, ne.,
e]
[END , STAR]
[ , END, START , *, End , f , out, ne. ]
[END, START, *, End, of ro, tine. , , ,
]
[END, STA, *, o, r, ut]
[ , END , S, *, End, o, r, utine., , , ,
, o]
[END, START , *, of routi, e., ]
我得到的输出如下所示:
END START * End of routine
[ , END, ST, *, End , f rout, ne, , , e other]
[ , END, ST, *, End of, rout, ne, , , e othe]
[ , END, STAR, *, End of, rout, ne.,
e]
[ , END, START , *, End of, rout, ne.,
e]
[END , STAR]
[ , END, START , *, End , f , out, ne. ]
[END, START, *, End, of ro, tine. , , ,
]
[END, STA, *, o, r, ut]
[ , END , S, *, End, o, r, utine., , , ,
, o]
[END, START , *, of routi, e., ]
你知道我做错了什么吗?你的主要问题是署名使用了相同的缓冲区,你需要复制它,这样它就不会覆盖你的数据
auto words = split(strip(line).dup);
更合适的存储类是string而不是char[],除非您打算修改实际字符。但是,在v2.0中会出现一个编译器错误,因为行将是char[]。这只是将其复制为不可变字符串的问题
auto words = split(strip(line).idup);
这样,您的程序看起来就像
import std.stdio;
import std.string;
void main(string[] args)
{
string[][] lines;
auto input = File(args[1], "r");
foreach(line; input.byLine())
{
auto words = split(strip(line).idup);
lines ~= words;
}
foreach(line; lines)
{
writeln(line);
}
}
答案是双重的 首先,如上所述,
byLine
使用一个内部缓冲区(用于速度),它在后续循环迭代中被覆盖
其次,查看单词的操作<代码>拆分(条(线))
strip
仅修改数组(作为引用)的开始和结束,而split将数组拆分为引用相同基础数据的较小子数组。两者都不是破坏性的;因此,两者都不需要重新分配。因此,最后的string[]words
仍然指向原始缓冲区,该缓冲区在下一次写入时被覆盖
解决方案是,如果希望数据跳出循环范围,请通过写入autowords=split(strip(line).dup)来确保复制数据代码>。请注意,复制字将不起作用,因为这只会复制数组数组,而不会复制数组本身
此外,还应使用string[]args
。类似C的语法仅因遗留原因而受支持,不建议使用。并非真正出于遗留原因,string只是D1中char[]和D2中immutable(char)[]的别名。建议使用它,因为它更易于读取,并且比不可变(char)[]更易于写入。当然,“自动”也有帮助。但是,如果您想在D2中使用可变字符串,则必须使用char[]。不,我的意思是字符串args[]
。将[]
放在参数后面。顺便说一句,您可能希望将[i]dup
放在条带之后,以节省少量内存。为什么使用char[][][]
会导致编译失败?诚然,这是丑陋的,但应该仍然有效。我开始使用它是因为我在转换char[][]
这个split(strip(line))
返回的char[]
和string[]
之间遇到了很多问题。在任何情况下,您的解决方案都是有效的。谢谢。@Max,对不起,你说得对。我以为你只是在添加char[]。我会更新我的答案。