Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/318.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/image-processing/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 是否可以从网页中抓取图像,将其转换为数字并保存到文件中?_Python_Image Processing_Web Scraping_Data Analysis - Fatal编程技术网

Python 是否可以从网页中抓取图像,将其转换为数字并保存到文件中?

Python 是否可以从网页中抓取图像,将其转换为数字并保存到文件中?,python,image-processing,web-scraping,data-analysis,Python,Image Processing,Web Scraping,Data Analysis,我确实意识到这是99.999%不可能的(如果我确信这是100%不可能的,我就不会问这个问题) 我想得到所有的黎巴嫩彩票号码,我找到的唯一的网站是或。我联系了这些网站,要求提供一个excel或csv文件,一个没有回复,一个说你看到的就是你得到的,他们不提供文件,第三个给了我一个ods文件,其中有很多缺少的结果和很多不正确的结果 我只想将这些结果用于个人项目,因为网站管理员没有帮助我,我要么侵入他们的数据库(如果我是匿名会员,这应该很容易),要么我必须刮取图像,将其转换为数字,并将其保存到csv文件

我确实意识到这是99.999%不可能的(如果我确信这是100%不可能的,我就不会问这个问题)

我想得到所有的黎巴嫩彩票号码,我找到的唯一的网站是或。我联系了这些网站,要求提供一个excel或csv文件,一个没有回复,一个说你看到的就是你得到的,他们不提供文件,第三个给了我一个
ods
文件,其中有很多缺少的结果和很多不正确的结果

我只想将这些结果用于个人项目,因为网站管理员没有帮助我,我要么侵入他们的数据库(如果我是匿名会员,这应该很容易),要么我必须刮取图像,将其转换为数字,并将其保存到csv文件或其他文件中

如果只是文本,我会使用beautifulsoup,但是否可以刮取图像,将其转换为数字,并将其作为行存储在csv文件中

我的首选语言是python,但只要它能起作用,我愿意接受任何东西

import requests
import lxml, lxml.html

r = requests.get('http://www.lldj.com/pastresult.php')

html = lxml.html.fromstring(r.text)

imgs =  html.cssselect('img')

for x in imgs:
    src = x.attrib['src']
    if src.startswith('images/Balls'):
        print src[-6:-4]
结果(2014年7月10日第1212号图纸的结果):


对于url(1154)中具有绘图编号的其他页面,您可以获得任何绘图

import requests
import lxml, lxml.html

r = requests.get('http://www.lebanon-lotto.com/lebanese-loto-results/draw-number/1154.php')

html = lxml.html.fromstring(r.text)

imgs =  html.cssselect('img')

for x in imgs:
    src = x.attrib['src']
    #print src
    if 'lotto_balls_gray' in src:
        print src[-6:-4]
结果:

01
03
12
14
16
32
30
结果(2014年7月10日第1212号图纸的结果):


对于url(1154)中具有绘图编号的其他页面,您可以获得任何绘图

import requests
import lxml, lxml.html

r = requests.get('http://www.lebanon-lotto.com/lebanese-loto-results/draw-number/1154.php')

html = lxml.html.fromstring(r.text)

imgs =  html.cssselect('img')

for x in imgs:
    src = x.attrib['src']
    #print src
    if 'lotto_balls_gray' in src:
        print src[-6:-4]
结果:

01
03
12
14
16
32
30

这当然是可能的。在python中,可以使用scikit库();使用它,您可以“读取”图像并将其保存为数字矩阵。为此,最好将图像保存为“黑白”,这样您将有一个单独的矩阵,每个数字对应一个像素,灰度值范围为0到255。从这个矩阵中,您可以识别数字模式并将其保存为文本。这是一个很大的工作,但它肯定是可行的


Matlab还可以轻松地“读取”图像并将其转换为矩阵。

这当然是可能的。在python中,可以使用scikit库();使用它,您可以“读取”图像并将其保存为数字矩阵。为此,最好将图像保存为“黑白”,这样您将有一个单独的矩阵,每个数字对应一个像素,灰度值范围为0到255。从这个矩阵中,您可以识别数字模式并将其保存为文本。这是一个很大的工作,但它肯定是可行的



Matlab还可以轻松地“读取”图像并将其转换为矩阵。

首先,我将研究图像抓取。例子。后来,我将使用(C++库)的包装器进行光学字符识别

首先,我会调查一下图像抓取。例子。后来,我将使用(C++库)的包装器进行光学字符识别

最好看一下图像的文件名-有那个数字。@furas在赚钱-刮去HTML看看图像名。例如,第一个链接的图像以
35;##.gif
结尾,现在您可以将其中一个答案标记为已接受。@furas当然,测试您的答案,最有可能是您的答案,我对所有答案都投了赞成票,认为所有答案都很有趣,您的答案更简单,现在已经快凌晨2点了,所以我现在不想集中精力:)最好看一下图像的文件名——有那个数字。@furas在赚钱——刮下HTML,看看图像名。例如,第一个链接的图像以
35;##.gif
结尾,现在您可以将其中一个答案标记为已接受。@furas当然,测试您的答案,最有可能是您的答案,我对所有答案都投了赞成票,认为所有答案都很有趣,您的答案更简单,现在快凌晨2点了,所以我现在没有集中注意力:)你忘了导入CSS选择一个小问题,如何获得旧的结果,比如1和2画?这个网站没有它们,而在其他网站上,url没有改变,都是ajax之类的东西,如何从url中的更改编号获得通过的结果
http://www.lebanon-lotto.com/lebanese-loto-results/draw-number/1154.php
-是抽签号码。是的,但如果我想说
http://www.lebanon-lotto.com/lebanese-loto-results/draw-number/23.php
该站点上不存在该绘图,该网站仅从2013年初或2012年开始抽奖,黎巴嫩乐透自2002年以来一直在网站上更新,因此这些结果必须从这里或这里获取。请尝试0023.php-如果有过去抽奖的链接,请查看-可能他们过去使用了不同的URL。您忘记了导入CSS选择一个小问题,如何获得旧的结果,例如1和2画?这个网站没有它们,而在其他网站上,url没有改变,都是ajax之类的东西,如何从url中的更改编号获得通过的结果
http://www.lebanon-lotto.com/lebanese-loto-results/draw-number/1154.php
-是抽签号码。是的,但如果我想说
http://www.lebanon-lotto.com/lebanese-loto-results/draw-number/23.php
该站点上不存在该绘图,该网站仅从2013年初或2012年开始抽奖,黎巴嫩乐透自2002年以来一直在网站上更新,因此这些结果必须从这里或这里获取。请尝试0023.php-如果有过去抽奖的链接,请检查它-可能他们在过去使用了不同的URL。