为什么python打印会延迟?
我尝试使用请求下载文件,每次检索100k大小的文件时都打印一个点,但所有的点都在最后打印出来。参见代码为什么python打印会延迟?,python,python-3.x,web-crawler,python-requests,Python,Python 3.x,Web Crawler,Python Requests,我尝试使用请求下载文件,每次检索100k大小的文件时都打印一个点,但所有的点都在最后打印出来。参见代码 with open(file_name,'wb') as file: print("begin downloading, please wait...") respond_file = requests.get(file_url,stream=True) size = len(respond_file.content)//1000000 #the next l
with open(file_name,'wb') as file:
print("begin downloading, please wait...")
respond_file = requests.get(file_url,stream=True)
size = len(respond_file.content)//1000000
#the next line will not be printed until file is downloaded
print("the file size is "+ str(size) +"MB")
for chunk in respond_file.iter_content(102400):
file.write(chunk)
#print('',end='.')
sys.stdout.write('.')
sys.stdout.flush()
print("")
@kevin在评论中写道,
respond.file.content
会阻止执行,直到整个内容下载完毕。我的回答和他的评论之间的唯一区别在于我不是在猜测;) 正如@kevin在评论中所写,respond.file.content
会阻止执行,直到下载完全部内容。我的回答和他的评论之间的唯一区别在于我不是在猜测;) 这应该是你所期望的。获取respond_文件的长度不是您想要的。而是检查内容长度标题
注意:我将代码改为显示KB(用于测试)
这应该是你所期望的。获取respond_文件的长度不是您想要的。而是检查内容长度标题 注意:我将代码改为显示KB(用于测试)
您正在访问
request.content
此处:
size = len(respond_file.content)//1000000
访问该属性会强制下载整个响应,对于大型响应,这需要一些时间。使用int(respond_file.headers['content-length'])
代替:
size = int(respond_file.headers['content-length']) // 1000000
Content-Length
标题由服务器提供,由于它是标题的一部分,您可以访问该信息,而无需先下载所有内容
如果服务器选择使用传输编码:chunked
来流式传输响应,则无需设置内容长度
头;您可能需要考虑到这一点:
content_length = respond_file.headers.get('content-length', None)
size_in_kb = '{}KB'.format(int(content_length) // 1024) if content_length else 'Unknown'
print("the file size is", size_in_kb)
其中,以KB为单位的大小是通过长度除以1024(而不是一百万)来计算的
或者,在单独的HEAD请求中请求大小(仅获取标题):
您正在访问
request.content
此处:
size = len(respond_file.content)//1000000
访问该属性会强制下载整个响应,对于大型响应,这需要一些时间。使用int(respond_file.headers['content-length'])
代替:
size = int(respond_file.headers['content-length']) // 1000000
Content-Length
标题由服务器提供,由于它是标题的一部分,您可以访问该信息,而无需先下载所有内容
如果服务器选择使用传输编码:chunked
来流式传输响应,则无需设置内容长度
头;您可能需要考虑到这一点:
content_length = respond_file.headers.get('content-length', None)
size_in_kb = '{}KB'.format(int(content_length) // 1024) if content_length else 'Unknown'
print("the file size is", size_in_kb)
其中,以KB为单位的大小是通过长度除以1024(而不是一百万)来计算的
或者,在单独的HEAD请求中请求大小(仅获取标题):
哪些部件延迟?一些
print()
调用或sys.stdout.write()
调用也可以?胡乱猜测:访问respond\u file.content
会强制请求在进入下一行之前完整完成。尝试删除size=…
和print(“文件大小是…
行,看看你的点是否以更及时的方式打印出来。@凯文:我错过了,但猜测是正确的。是的。内容导致打印点延迟,可以根据答案解决。延迟了哪些部分?一些print()
调用或sys.stdout.write()
调用?胡乱猜测:访问respond\u file.content
会强制请求完整完成,然后才能继续下一行。请尝试删除大小=…
和打印(“文件大小是…
行,看看你的点是否能以更及时的方式打印出来。@Kevin:我没有注意到,但猜测是正确的。是的。内容会导致打印点延迟,可以根据答案解决。谢谢大家,但当我试着从标题中获取内容长度时,我遇到了以下错误:keyerror,我打印了e响应标题:{'server':'nginx/1.4.2','date':'Tue,05 May 2015 16:18:44 GMT','transfer encoding':'chunked','content type':'text/html','connection':'close'},还有什么办法可以解决吗?@1a1a11a:那么服务器没有提前给你一个长度,你将无法给出有关大小的消息。将更新。下载之前有没有其他方法可以知道文件的大小?@1a1a11a:你可以在URL上使用HEAD
请求。谢谢大家,但当我尝试获取内容len时从headers中,我得到了以下错误:keyerror,我打印了响应头:{'server':'nginx/1.4.2','date':'Tue,05 May 2015 16:18:44 GMT','transfer encoding':'chunked','content type':'text/html','connection','close'},还有什么办法可以解决吗?@1a1a11a:那么服务器没有提前给你一个长度,你将无法给出有关大小的消息。将更新。下载之前有没有其他方法可以知道文件的大小?@1a1a11a:你可以在URL上使用HEAD
请求。谢谢大家,但当我尝试获取内容len时从headers中,我得到了以下错误:keyerror,我打印了响应头:{'server':'nginx/1.4.2','date':'Tue,05 May 2015 16:18:44 GMT','transfer encoding':'chunked','content type':'text/html','connection','close'},还有其他方法可以解决吗?谢谢大家,但是当我试图从标题中获取内容长度时,我遇到了以下错误:keyrerror,我打印了响应标题:{'server':'nginx/1.4.2','date':'Tue,05 May 2015 16:18:44 GMT','transfer encoding':'chunked','content type':'text/html','connection':'close',还有其他方法可以解决吗?