运行python脚本并输出到txt以获取URL列表

运行python脚本并输出到txt以获取URL列表,python,Python,我有一个python脚本用于删除一些URL。URL位于txt文件的列表中 python脚本(仅相关部分)如下所示: import urllib2 from bs4 import BeautifulSoup quote_page = 'https://www.example.com/post/1245' # rest of the code is here print quote_page print url print title print description print actors

我有一个python脚本用于删除一些URL。URL位于txt文件的列表中

python脚本(仅相关部分)如下所示:

import urllib2
from bs4 import BeautifulSoup
quote_page = 'https://www.example.com/post/1245'

# rest of the code is here

print quote_page
print url
print title
print description
print actors
print director
我想在一个txt文件中为多个URL运行这个脚本,并输出到一个txt文件


您知道如何在txt文件中为我的URL运行此命令吗?

您可能希望使用Python语句(在中介绍)和内置函数:

# Python 2
import urllib2
import BeautifulSoup

# Python 3
# import urllib3
# from bs4 import BeautifulSoup

# Python 2.6+ and Python 3
with open('urls.txt','r') as url_file, open('output.txt', 'w') as output_file:

    url_list = url_file.readlines()

    for url_item in url_list:

        # quote_page = 'https://www.example.com/post/1245'
        quote_page = url_item

        # rest of the code is here

        # Python 2 and 3
        output_file.write(quote_page)
        output_file.write(url)
        output_file.write(title)
        output_file.write(description)
        output_file.write(actors)
        output_file.write(director)
        output_file.write('\n')
在这种情况下,我们:

  • open()
    文件句柄(
    url\u文件
    output\u文件
    )到我们的输入和输出文本文件(
    'url.txt'
    'output.txt'
    ),同时(分别使用
    'r'
    进行读取和
    'w'
    进行写入)

  • 在我们完全处理完URL后,使用
    with
    语句自动关闭这些文件。通常,我们需要发出单独的命令,例如
    url\u file.close()
    output\u file.close()
    命令(例如步骤5)

  • 将我们的url放入列表(
    url\u list=url\u file.readlines()

  • 循环浏览我们的URL列表并
    write()
    将我们想要的数据写入
    输出文件

  • close()

  • 请注意,要简单地将数据添加到现有的
    输出\u文件
    ,您可能希望使用
    'a'
    (追加模式)而不是
    'w'
    (写入模式)。例如,
    open('output.txt',w')作为输出文件
    将变成
    open('output.txt',a')作为输出文件
    。这一点很重要,因为如果文件已经存在(即,您将丢失原始数据),则
    'w'
    (写入模式)将截断该文件