Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/file/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
File 用于测试目的的大样本mbox文件_File_Testing_Mbox - Fatal编程技术网

File 用于测试目的的大样本mbox文件

File 用于测试目的的大样本mbox文件,file,testing,mbox,File,Testing,Mbox,为了开发邮件客户端,我需要一个非常大的mbox测试文件,其中包含尽可能多的邮件。最好大于100.000封邮件(>10GB) 它应该是真实的邮件数据,因为我不仅要测试性能,还要测试邮件过滤器和搜索 提前感谢您提供的任何提示,您可以在哪里获取类似的信息。也许您可以使用自己的邮箱并多次复制它。例如,您可以使用IMAP或文件系统设置邮件帐户并多次复制所有电子邮件,但这取决于您使用的数据格式。您可以使用搜索引擎收集.mbox文本文件。例如,谷歌搜索filetype:mbox-pipermail会产生大量的

为了开发邮件客户端,我需要一个非常大的mbox测试文件,其中包含尽可能多的邮件。最好大于100.000封邮件(>10GB)

它应该是真实的邮件数据,因为我不仅要测试性能,还要测试邮件过滤器和搜索


提前感谢您提供的任何提示,您可以在哪里获取类似的信息。

也许您可以使用自己的邮箱并多次复制它。例如,您可以使用IMAP或文件系统设置邮件帐户并多次复制所有电子邮件,但这取决于您使用的数据格式。

您可以使用搜索引擎收集.mbox文本文件。例如,谷歌搜索
filetype:mbox-pipermail
会产生大量的.mbox数据。而不是pipermail,
from
作为搜索字符串

可以连接单个.mbox文件:

cat mboxfile1 > mboxfile
echo >> mboxfile
cat mboxfile2 >> mboxfile

p、 不道德的不是数据,而是你如何处理它。请遵守道德

另外两个选项:

安然电子邮件语料库,拥有210 GB的电子邮件。它有多种电子邮件格式,但应该易于阅读

作为FERC西部能源市场调查的一部分,公开发布的安然电子邮件数据由EDRM转换为行业标准格式。该数据集包括1227255封电子邮件和493384份附件,涵盖151名保管人。电子邮件以Microsoft PST、IETF MIME和EDRM XML格式提供

  • 下载

<强> Apache软件基金会公函档案< /强>(200 GB)< /P>

所有2011年7月11日公开的Apache软件基金会邮件档案的集合,截至2011年7月11日

此集合包含ASF 80+中所有公开可用的电子邮件存档


我不能使用自己的邮箱,因为测试是由不应该阅读我邮件的其他人完成的…设置一个没有垃圾邮件过滤和地址的开放式邮件服务器
info@the-domain.com
。将此地址注册到一些色情网站,然后等待:-)请查看有趣的电子邮件资源