Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/image-processing/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
图像处理:质量规格(pdf)到密度文本文件_Pdf_Image Processing_Bioinformatics - Fatal编程技术网

图像处理:质量规格(pdf)到密度文本文件

图像处理:质量规格(pdf)到密度文本文件,pdf,image-processing,bioinformatics,Pdf,Image Processing,Bioinformatics,在图像处理领域之外,我想我有一个简单的任务,但我不知道从哪里开始 挑战在于,一些实验室喜欢以PDF格式发布其质量规格数据。虽然这足以证实他们的说法,但对于定量分析来说基本上是无用的。我想阅读质量规格密度: 改为以下格式: 3947>> Voyager Spec #1[BP = 536.8, 10241]" TYPE MASSSPEC 499.985486 760.097 500.007777 754.159 500.030068 774.162 500.052359 80

在图像处理领域之外,我想我有一个简单的任务,但我不知道从哪里开始

挑战在于,一些实验室喜欢以PDF格式发布其质量规格数据。虽然这足以证实他们的说法,但对于定量分析来说基本上是无用的。我想阅读质量规格密度:

改为以下格式:

3947>> Voyager Spec #1[BP = 536.8, 10241]" 
TYPE MASSSPEC
499.985486  760.097
500.007777  754.159
500.030068  774.162
500.052359  805.103
500.074651  821.98
500.096944  847.921
500.119237  864.798
...
第1列为m/z(x轴),第2列为(相对)丰度(y轴)


这可能吗?是否存在可执行此任务的工具?实现这样一个工具需要多长时间?

我的第一个想法是使用像GIMP这样的程序来编辑轴和标签,精确裁剪到图形本身的大小,以便左下角的第一个像素代表图形原点。然后,您可以使用图像处理库(很多都存在——我喜欢Ruby中的RMagick)将图像作为黑白图像进行处理,并将数据作为数组进行获取。(您可能希望旋转它以使其更容易)。其思想是让每个数组表示给定X轴特定点的Y轴数据列。这样,您只需计算黑色像素就可以得到Y值

我确信有一些方法可以编程检测图形边界并过滤掉文本,但这增加了很多复杂性


希望这对您有所帮助

指的是“便携式文档格式”(当您将鼠标悬停在标签上时,请查看显示的文本)。你确定你是那个意思吗?谢谢你的澄清。是的,我说的是“可移植文档格式”,而不是一些专门的海量数据类型相关帖子:,看。我经常看到这种问题。基本上,您有一个报告,但您需要用于生成报告的数据。很难将报表转换回其组成数据。要求报告制作人提供数据要简单得多。