File 用于测试目的的大样本mbox文件
为了开发邮件客户端,我需要一个非常大的mbox测试文件,其中包含尽可能多的邮件。最好大于100.000封邮件(>10GB) 它应该是真实的邮件数据,因为我不仅要测试性能,还要测试邮件过滤器和搜索File 用于测试目的的大样本mbox文件,file,testing,mbox,File,Testing,Mbox,为了开发邮件客户端,我需要一个非常大的mbox测试文件,其中包含尽可能多的邮件。最好大于100.000封邮件(>10GB) 它应该是真实的邮件数据,因为我不仅要测试性能,还要测试邮件过滤器和搜索 提前感谢您提供的任何提示,您可以在哪里获取类似的信息。也许您可以使用自己的邮箱并多次复制它。例如,您可以使用IMAP或文件系统设置邮件帐户并多次复制所有电子邮件,但这取决于您使用的数据格式。您可以使用搜索引擎收集.mbox文本文件。例如,谷歌搜索filetype:mbox-pipermail会产生大量的
提前感谢您提供的任何提示,您可以在哪里获取类似的信息。也许您可以使用自己的邮箱并多次复制它。例如,您可以使用IMAP或文件系统设置邮件帐户并多次复制所有电子邮件,但这取决于您使用的数据格式。您可以使用搜索引擎收集.mbox文本文件。例如,谷歌搜索
filetype:mbox-pipermail
会产生大量的.mbox数据。而不是pipermail,from
作为搜索字符串
可以连接单个.mbox文件:
cat mboxfile1 > mboxfile
echo >> mboxfile
cat mboxfile2 >> mboxfile
p、 不道德的不是数据,而是你如何处理它。请遵守道德 另外两个选项: 安然电子邮件语料库,拥有210 GB的电子邮件。它有多种电子邮件格式,但应该易于阅读 作为FERC西部能源市场调查的一部分,公开发布的安然电子邮件数据由EDRM转换为行业标准格式。该数据集包括1227255封电子邮件和493384份附件,涵盖151名保管人。电子邮件以Microsoft PST、IETF MIME和EDRM XML格式提供
- 下载
<强> Apache软件基金会公函档案< /强>(200 GB)< /P>
所有2011年7月11日公开的Apache软件基金会邮件档案的集合,截至2011年7月11日
此集合包含ASF 80+中所有公开可用的电子邮件存档我不能使用自己的邮箱,因为测试是由不应该阅读我邮件的其他人完成的…设置一个没有垃圾邮件过滤和地址的开放式邮件服务器
info@the-domain.com
。将此地址注册到一些色情网站,然后等待:-)请查看有趣的电子邮件资源