在列表中下载之前排除重复行（Python3）_Python_Python 3.x - Fatal编程技术网

在列表中下载之前排除重复行（Python3）

python python-3.x

在列表中下载之前排除重复行（Python3）,python,python-3.x,Python,Python 3.x,我有一个代码，可以将信息加载到web页面中的列表U_INSERT中。该网页包含一个表，我使用pandas从表中提取数据例如，3个包含字符串的url地址： url 1: [[55323600, '1234_MB] ,[55323601, '1582_MB]] url 2: [[55323602, '1245_MB] ,[55323603, '1579_MB]] url 3: [[55323602, '1245_MB] ,[55323603, '1579_MB]] 我写了这篇文章，但这不

我有一个代码，可以将信息加载到web页面中的列表U_INSERT中。该网页包含一个表，我使用pandas从表中提取数据

例如，3个包含字符串的url地址：

url 1: 
[[55323600, '1234_MB]
,[55323601, '1582_MB]]
url 2: 
[[55323602, '1245_MB]
,[55323603, '1579_MB]]
url 3: 
[[55323602, '1245_MB]
,[55323603, '1579_MB]]

我写了这篇文章，但这不是排除重复行的最佳方法：

RESULTU = []    #contains a list of url-addresses
U_INSERT = []   #data from web pages
for ind,val in enumerate(RESULTU):
    df = pd.read_html(val,header=0)[0]
    df = df.as_matrix().tolist()
    for i in df:
        U_INSERT.append(i)
print (list(set(U_INSERT)))

我正在寻找一种方法来检查该行以前是否加载到列表U_INSERT中，然后不要下载它并转到下一个url地址。

您可能希望将

RESULTU

定义为一个集合，以确保没有重复的条目

查看有关集合的更多信息

因为您的值是可散列的，并且您只想在处理之前进行检查，所以我将使用

集合

并在中使用

进行检查




[python 3.x]相关文章推荐



                                                        
Python 3.x 如何将Python3.xGUI应用程序分发给最终用户？
python-3.x 
Python 3.x 如何将文本文件数据插入python字典
python-3.x 
Python 3.x 烧瓶SQLAlchemy：自动过滤'；删除'；条目
python-3.xflasksqlalchemy 
Python 3.x 如何通过input（）获取01字符串？
python-3.x 
Python 3.x Python 3.5.2中使用Codeacademy函数的语法无效
python-3.xsyntax 
Python 3.x Python：定义类中某些对象属性的总和？
python-3.x 
Python 3.x 您如何使您的程序在索引i处查找并返回项？
python-3.x 
Python 3.x python函数从子目录读取文件
python-3.xfunctionpandas 
Python 3.x 在Python中，分层Groupby然后按另一列进行值计数
python-3.xpandasdataframe 
Python 3.x 获取timeseries数据帧中每个日期的最后一个条目
python-3.xpandas 
Python 3.x 简单问题：Python函数中变量的作用域
python-3.x 
Python 3.x Python—读取两个n间隔的序列作为列表，减去列表并打印最大的差异。[CodeChef]
python-3.x 
Python 3.x 在字典、列表中创建字典
python-3.xdictionary 
Python 3.x 如何求图像的一阶和二阶导数矩阵
python-3.xopencv 
Python 3.x （Python）我想将以下带有return语句的for循环放在一行上：
python-3.xfor-loop 
Python 3.x 在Pandas和Numpy中合并数据帧
python-3.xpandasnumpydataframe 
Python 3.x tempfile模块和IO类文件对象之间有什么区别
python-3.x 
Python 3.x 解释K-均值聚类中心输出
python-3.x 
Python 3.x 如何计算一组行的唯一值，并使用该值为所有记录创建列？
python-3.xpandasdask 
Python 3.x 在python中删除csv中的多个列（标题）
python-3.xpandasalgorithmdataframecsv 
                                       





随机文章推荐



                                                        
Sml 输出在REPL中被截断为#-符号
sml 
是否有内置函数检查SML中的数字是否为整数
sml 
如何在SML中将字符串解析为（int*int）元组？
sml 
如何在SML中推导函数类型（fun-foo f=f 5；）
sml 
SML中扁平化的简单实现有问题
sml 
将命令行参数写入SML中的文件
sml 
Sml 为什么要使用这个函数？
sml


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 从网站打开文件
									Python
							 
Python AppleScript:字符串和文件管理
									Python
							 									File Io
							 									Applescript
							 
Python 为什么这个Fizzbuzz程序失败的数字是100而不是25？
									Python
							 
语法：python中的比较
									Python
							 									Syntax
							 
Python-从txt文件创建元组
									Python
							 									File
							 									Text
							 
Python 选择查询中的行范围
									Python
							 									Sqlalchemy
							 
Python 我该如何消除“错误”'；str'；对象不可调用"；？
									Python
							 									Python 3.x
							 
Python列表循环到输出平均值-返回的记录太多
									Python
							 									Python 3.x
							 
Python 字符串列表中的匹配字符串
									Python
							 									String
							 									List
							 
Python 是否可以循环遍历存储在元组中的函数列表？
									Python
							 									Python 3.x
							 
Python genfromtxt（）是否可以返回列数据列表，而不是行数据？
									Python
							 									Numpy
							 
Python 如何将p值作为图例添加到matplotlib中的轴中
									Python
							 									Pandas
							 									Matplotlib
							 
Python `return`在循环的第一次迭代后退出函数
									Python
							 
Python 为什么在下面的代码中调用_urepr _uu？
									Python
							 
通过使用python对字典中的所有ID进行分组来生成列表
									Python
							 									Json
							 									List
							 									Dictionary
							 
使用beautifulsoup python从页面中刮取特定元素时出现问题
									Python
							 
Python打印计数器中的前3项
									Python
							 
Python 位于'的键错误；数据'；在基于Django类的视图中
									Python
							 									Django
							 
Python Beautifulsoup迭代以获取其中一个<；td>；sometext</td>；或url
									Python
							 
Python 如何基于列值标记多个dataframe行
									Python
							 									Pandas
							 
Python 不断更新呈现的Matplotlib训练指标绘图到我的显示器
									Python
							 									Matplotlib
							 
Python3.5代码相同，在两台机器上有不同的输出
									Python
							 
Python 导入库Utils
									Python
							 
Python 如何处理非'；t分组大小的倍数？
									Python
							 
Python：在类实例中使用变量动态调用字典键
									Python
							 									Function
							 									Class
							 
Python 从不协调用户读取输入
									Python
							 
Python np.polyfit（x，y，1）-类型错误：必须是str，而不是float
									Python
							 									Error Handling
							 
Python 首次使用后重新分配局部变量时出现UnboundLocalError
									Python
							 									Variables
							 
Python 如何从字典中生成加权图？
									Python
							 									Graph
							 
Python 如何利用Yolo目标检测在推理上平铺图像
									Python
							 									Opencv
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Ionic Framework
Asynchronous
Sdk
Google Chrome Devtools
Django Models
Navigation
Email
Linq To Sql
Verilog
Computer Science
Web Services
Tags
Google Chrome Extension
Raspberry Pi
Vue.js
Apache
Asp.net Mvc
Tsql
Laravel 4
Java 8
Tabs
Hyperlink
Windbg
Jira
Ssis
Tree
Lotus Notes
Tinymce
Teamcity
Loopbackjs
Cassandra
Wpf
Extjs4
Soap
Instagram
Office365
Biztalk
Javafx 2
Abap
Qml
Jpa
Floating Point
Windows Phone 8.1
Inno Setup
Autocomplete
Parameters
Ms Office
Cron
Dependency Injection
Character Encoding
Openlayers
Iis 7
Passwords
Process
Coding Style
Hyperledger Fabric
Atom Editor
Asterisk
Xampp
Canvas
Java
Ip
Ssl
Angular Material
Laravel 5
Uml
Oracle
Deep Learning
Tcp
Firebase
Influxdb
Random
Function
Doctrine
Database
Snowflake Cloud Data Platform
Model
Cordova
Postman
Hybris
Cocos2d X
Monitoring
C++ Cli
Bash
Parse Platform
Amazon S3
Linker
Highcharts
Jar
Azure
Dotnetnuke
D
Blockchain
Apache Spark
Inheritance
Mercurial
Vagrant
Twilio
Web Crawler
Db2
Amazon Cloudformation
Scripting
Discord.py
Laravel
Sorting
Sql Server 2008
Matrix
Batch File
Log4net
Php
Migration
Content Management System
Zurb Foundation
Arangodb
Java Me
Common Lisp
Elm
Jasper Reports
Facebook
Path
Maven 2
Authentication
Machine Learning
Hive
Web Applications
Vb6
Exception
Numpy
Sails.js
Date
Regex
File Upload
Google Calendar Api
Memory Management
Xpath
Git
Maps
Join
Seo
Windows 10
Xquery
Json
Akka
Css
Parsing
Localization
Jms
File
Zend Framework2
Polymer
Oauth 2.0
Ldap
.net Core
Macos
Amp Html
Dask
Rally
Appium
Ionic2
Joomla
Google Apps Script
Csv
Sharepoint 2010
Kibana
Outlook
Types
Virtual Machine
Reactjs
Google Cloud Platform
Download
Http
Magento
E Commerce
Enums
Mapping
Ethereum
Imagemagick
Chart.js
Pycharm
Google Bigquery
Titanium
Open Source
Jboss
Kendo Ui
Caching
Gridview
Activemq
Methods
Drupal 7
Asp.net Core Mvc
Wxpython
Testng
Sequelize.js
Serial Port
Maven
Plugins
Synchronization
Spring Cloud
Less
Fonts
Objective C


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网