用Python打印HTML输出_Python_Python 3.x_Web Scraping_Beautifulsoup_Python Requests

用Python打印HTML输出

python python-3.x web-scraping

用Python打印HTML输出,python,python-3.x,web-scraping,beautifulsoup,python-requests,Python,Python 3.x,Web Scraping,Beautifulsoup,Python Requests,我一直在创建一个具有多种用途的程序。我称之为直接收益电子数据库（EDDY）。我遇到的最大问题是EDDY的google搜索功能。EDDY将要求用户提供输入。EDDY随后将通过将任何空格（“”）替换为加号（“+”）来稍微编辑输入，然后转到生成的url（无需打开浏览器）。然后，它从网页复制html，并应给出网站的结果和描述，并指定，而不使用html代码这就是我目前所拥有的 import urllib from urllib.request import urlopen, Request from b

我一直在创建一个具有多种用途的程序。我称之为直接收益电子数据库（EDDY）。我遇到的最大问题是EDDY的google搜索功能。EDDY将要求用户提供输入。EDDY随后将通过将任何空格（“”）替换为加号（“+”）来稍微编辑输入，然后转到生成的url（无需打开浏览器）。然后，它从网页复制html，并应给出网站的结果和描述，并指定，而不使用html代码

这就是我目前所拥有的

import urllib
from urllib.request import urlopen, Request
from bs4 import BeautifulSoup
import requests


    

def cleanup(url):
    

    html_content = requests.get(url).text
    soup = BeautifulSoup(html_content, "lxml")
    length = len(soup.prettify()) - 1
    print(soup.prettify()[16800:length])
    
    print(soup.title.text)

    print(soup.body.text)
    
    
def eddysearch():
    
    headers = {'User-Agent': 'Chrome.exe'}
    reg_url = "http://www.google.com/search?q="
    print("Ready for query")
    query = input()
    if(query != "quit"):
        print("Searching for keyword: " + query)
        print("Please wait...")
        search = urllib.parse.quote_plus(query)
        url = reg_url + search
        req = Request(url=url, headers=headers)
        html = urlopen(req).read()
    
        cleanup(url)

        eddysearch()

    
eddysearch()

有人能帮我吗？提前谢谢

如果不想使用SSL证书，可以执行

.read（）

#Python 2.7.x
导入URL库
url=”http://stackoverflow.com"
f=urllib.urlopen（url）
打印f.read（）


#Python3.x
导入urllib.request
url='1〕http://www.stackoverflow.com'
f=urllib.request.urlopen（url）
打印（f.read（））

您需要什么样的帮助？