Printing 一张纸能容纳多少数字信息,假设你用一台现代化的打印机向它写入信息,然后用现代化的扫描仪从中读取信息?

Printing 一张纸能容纳多少数字信息,假设你用一台现代化的打印机向它写入信息,然后用现代化的扫描仪从中读取信息?,printing,datastore,Printing,Datastore,我意识到这是一个悬而未决的问题,所以为了澄清,我想要一个答案,给出一个接近替代存储介质错误率的错误率 受启发,您链接到的广告似乎是在比较数据CD的容量与打印在纸上的文本的容量。您可以将数据存储在纸上,比存储在文本上要紧凑得多,但让我们从这里开始 假设我们讨论的是黑色、单间距、8音高的英文文本,每英寸6行,没有边距。假设我们也要为此选择一种字体,我们应该能够通过现代高端激光打印机(1200x1200 DPI)打印此类文本,并通过现代扫描仪(也是1200x1200 DPI)和OCR套件(请记住,我们

我意识到这是一个悬而未决的问题,所以为了澄清,我想要一个答案,给出一个接近替代存储介质错误率的错误率


启发,您链接到的广告似乎是在比较数据CD的容量与打印在纸上的文本的容量。您可以将数据存储在纸上,比存储在文本上要紧凑得多,但让我们从这里开始

假设我们讨论的是黑色、单间距、8音高的英文文本,每英寸6行,没有边距。假设我们也要为此选择一种字体,我们应该能够通过现代高端激光打印机(1200x1200 DPI)打印此类文本,并通过现代扫描仪(也是1200x1200 DPI)和OCR套件(请记住,我们必须选择一种对此友好的字体)以近乎零的错误将其读回。然后我们得到每平方英寸48个字符。粗略估计。在普通用法中,我们有大约十个单词。十个随机英语单词的组合数量约为2000010,接近2176,因此按照这一标准,我们每平方英寸大约传输176位。(这是一个过高的估计,因为随机英语单词的平均长度接近7.5个字母。)

如果我们假设打印的不是英文文本,而是来自128个元素的指令集的任意字符,即使用任意数据的base-128编码,则会上升一位,达到336位/平方英寸。那还不是很密集

但这种密度太大了。我们可以通过使打印非常小来适应更多的数据。我们将使用2x2装箱进行打印,以使回扫描更加可靠,并将文本缩小到12像素×10像素的框中。这为我们提供了每平方英寸60个字符的50行,信息密度为21000位/平方英寸

这要好得多,但仍然很可怜。我们可以通过查看单个像素而不是查找一小组模式(字符图示符)来获得更高的信息密度。假设我们分配10%的像素来支持像素阵列的精确定位和注册,我们仍然可以传输超过320000位/平方英寸

但是等等,还有更多!现在,我们将所有像素的一小部分分配给像素阵列的支持注册表,也许我们可以将设备的完整分辨率提高到1200x1200像素,从而达到约1.2M位/平方英寸的信息密度

我们还没有完全完成。上述假设为黑色打印,但高端设备可以以我们现在讨论的1200x1200分辨率打印和扫描颜色。如果我们假设三个颜色通道,并且假设每个通道可以精确解析四个级别,那么我们的每个像素实际上携带12位信息,使我们的密度达到大约24M位/平方英寸

我想这差不多是极限了。我们可以通过假设更好的颜色分辨率将其推得更远一点,但即使假设24位颜色可以准确地打印和读取,我们仍然处于相同的数量级。一张8.5 x 11的纸张,如上所述边对边打印,可以准确地传送3亿字节的数据


那么,这与光学媒体相比又如何呢?嗯,一个标准尺寸的光盘有大约16平方英寸的可用表面积。一个高容量的CD-ROM在该区域提供了大约7亿字节。与你的广告相比,这确实强调了你的衡量方式有多大的不同。当然,这是一个不合时宜的比较。如果我们考虑的是一个四层的BDXL磁盘,它在同一个表面积上有128G字节,现在讨论的是纸张和光学介质之间面密度的千倍以上。p> 您链接到的广告似乎在比较数据CD的容量与打印在纸上的文本的容量。您可以将数据存储在纸上,比存储在文本上要紧凑得多,但让我们从这里开始

假设我们讨论的是黑色、单间距、8音高的英文文本,每英寸6行,没有边距。假设我们也要为此选择一种字体,我们应该能够通过现代高端激光打印机(1200x1200 DPI)打印此类文本,并通过现代扫描仪(也是1200x1200 DPI)和OCR套件(请记住,我们必须选择一种对此友好的字体)以近乎零的错误将其读回。然后我们得到每平方英寸48个字符。粗略估计。在普通用法中,我们有大约十个单词。十个随机英语单词的组合数量约为2000010,接近2176,因此按照这一标准,我们每平方英寸大约传输176位。(这是一个过高的估计,因为随机英语单词的平均长度接近7.5个字母。)

如果我们假设打印的不是英文文本,而是来自128个元素的指令集的任意字符,即使用任意数据的base-128编码,则会上升一位,达到336位/平方英寸。那还不是很密集

但这种密度太大了。我们可以通过使打印非常小来适应更多的数据。我们将使用2x2装箱进行打印,以使回扫描更加可靠,并将文本缩小到12像素×10像素的框中。这为我们提供了每平方英寸60个字符的50行,信息密度为21000位/平方英寸

这要好得多,但仍然很可怜。我们可以通过查看单个像素而不是查找一小组模式(字符图示符)来获得更高的信息密度。假设我们分配10%的像素来支持像素阵列的精确定位和注册,我们仍然可以传输超过320000位/平方英寸

但是等等,还有更多!现在我们将所有像素的一小部分分配给像素阵列的支持注册表,也许我们可以升级到完整的1200x1200像素