Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/344.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何在Python中从epub提取文本(从url源)_Python_Extract_Epub - Fatal编程技术网

如何在Python中从epub提取文本(从url源)

如何在Python中从epub提取文本(从url源),python,extract,epub,Python,Extract,Epub,我想从epub中提取内容,但我不知道如何从url源中提取内容。我的代码现在是这样的:() 错误,很明显: AttributeError: 'bytes' object has no attribute 'seek' 有人能给我点灯吗?先保存epub文件,然后使用电子书库打开文件 使用urllib下载电子书 使用电子书库打开电子书并获取图像 代码如下: import urllib.request import ebooklib from ebooklib import epub m

我想从epub中提取内容,但我不知道如何从url源中提取内容。我的代码现在是这样的:()

错误,很明显:

    AttributeError: 'bytes' object has no attribute 'seek'

有人能给我点灯吗?

先保存epub文件,然后使用电子书库打开文件

  • 使用urllib下载电子书
  • 使用电子书库打开电子书并获取图像
代码如下:

import urllib.request
import ebooklib
from ebooklib import epub

myurl = "https://diegooli.s3.us-east-2.amazonaws.com/Cabana.epub"

with urllib.request.urlopen(myurl) as url:
    s = url.read()
    
with open(r"c:\tmp\test.epub", "wb") as f:
    f.write(s)

book = epub.read_epub(r"c:\tmp\test.epub")

for image in book.get_items_of_type(ebooklib.ITEM_IMAGE):
    print(image)

为什么这个错误会很明显?因为我意识到我做错了什么
import urllib.request
import ebooklib
from ebooklib import epub

myurl = "https://diegooli.s3.us-east-2.amazonaws.com/Cabana.epub"

with urllib.request.urlopen(myurl) as url:
    s = url.read()
    
with open(r"c:\tmp\test.epub", "wb") as f:
    f.write(s)

book = epub.read_epub(r"c:\tmp\test.epub")

for image in book.get_items_of_type(ebooklib.ITEM_IMAGE):
    print(image)