确保没有重复的行写入CSV Python_Python_Csv - Fatal编程技术网

确保没有重复的行写入CSV Python

python csv

确保没有重复的行写入CSV Python,python,csv,Python,Csv,目前，我正在使用以下代码将数据集中的行写入CSV文件： with open('Private-Jet-Data.csv', 'a') as f: writer = csv.writer(f,delimiter=",") for row in data: writer.writerow(row) 是否有更有效的方法确保文件中没有任何一行与另一行重复，而不首先打开文件并对我的数据列表中的每一行遍历整个文件？不，这是不可能的您需要将数据保存在内存中的某个位置以进行比

目前，我正在使用以下代码将数据集中的行写入CSV文件：

with open('Private-Jet-Data.csv', 'a') as f:
    writer = csv.writer(f,delimiter=",")
    for row in data:
        writer.writerow(row)

是否有更有效的方法确保文件中没有任何一行与另一行重复，而不首先打开文件并对我的

数据列表中的每一行遍历整个文件？
不，这是不可能的
您需要将数据保存在内存中的某个位置以进行比较，这意味着您必须从文件中读取以前的数据，并只追加其中缺少的数据集
还要注意的是，在当前的代码片段中，您无法与.csv
文件中的条目进行比较。
您只需将“可见”值动态添加到集合中即可：
with open('Private-Jet-Data.csv', 'a') as f:
    writer = csv.writer(f,delimiter=",")
    seen = set()
    for row in data:
        if row in seen:
            continue 
        writer.writerow(row)
        seen.add(row)

它比两次读取源文件效率更高，但如果处理大文件，它仍会占用一些内存
 我不认为这是OP的要求。实际上，他在文件中有一些数据（称为dataset_A），他在脚本中生成了更多的数据（称为dataset_B），现在只想将dataset_B中不在dataset_A中的那些值打印到文件中。基本上，dataset_B-dataset_A.crossion（dataset_B）




[csv]相关文章推荐



                                                        
我想将文本文件转换为csv文件，其中包含多行数据类型
csv 
Csv 在记事本中每隔一行删除一行++
csvnotepad++ 
显示随机特征的CSV文件
csv 
如何将.csv或.xlsx转换为多个.txt文件？
csv 
配置单元查询o/p到HDFS作为CSV文件
csvhadoophive 
在Jmeter中的断言结果文件名中使用变量形式的CSV数据集
csvjmeter 
属性不存在时如何合并topojson和csv
csv 
从远程超链接读取信息（知道通过超链接它将是csv文件，但无法找到一般方法）
csvpython-3.xhyperlink 
Csv PowerShell导出所有Active Directory属性，包括多值
csvpowershellactive-directory 
将多个csv数据文件导入H2O流
csv 
奏鸣曲和导出csv和xls
csv 
Csv 将datatable列转换为双C#
csv 
读取.CSV文件并将其插入SQL SERVER-缺少某些内容
csvsql-server-2012vb6 
Csv Camel Bindy应用程序JBoss EAP 6.1部署问题
csvapache-camel 
如何将两个csv文件导入同一数据帧（文件目录不同）
csvapache-sparkpyspark 
Csv 在univocity中使用默认空转换时出现问题
csvparsing 
如何要求turtles为NETLOGO中的csv.file导入值
csvnetlogo 
如何将非常大的csv文件与另一个csv文件连接起来？
csvjoin 
需要在CSV中添加一列，为每行数据（1、2、3等）添加一个数字
csvvbscript 
如何在pyspark中读取具有不同模式的多个csv文件？
csvpyspark 
                                       





随机文章推荐



                                                        
If statement 由通配符引起的参数太多
if-statement 
If statement Windows批处理文件如果失败-30000000000如何等于40000000000？
if-statementbatch-file 
If statement c：如果条件评估不为真
if-statementprimefaces 
If statement Rails 4.0-嵌套的'；如果'；视图中的语句
if-statementviewruby-on-rails-4 
If statement 从ksh中的子外壳检测进程结束
if-statement 
If statement 谁能解释一下这是怎么回事吗如果我的sql中还有其他内容
if-statement 
If statement 如果单元格1=x，则单元格2=y，或单元格1=y，则单元格2=z，以此类推
if-statementgoogle-sheets 
If statement 如果/和谷歌表单错误
if-statementsyntaxgoogle-sheets 
If statement ImageJ if语句不会执行ROIMAger（“Select”，）；
if-statementselect 
If statement Else语句没有'；你不能团结一致吗？
if-statementunity3d 
If statement gbz80-IF语句
if-statement 
If statement 我想阻止这一切'；if语句'；避免重复
if-statementprinting 
If statement 消除if-else以提高流水线体系结构中的性能
if-statementoptimizationconcurrencyexception-handling 
If statement 检查PyGame混音器频道是否正在播放声音
if-statementaudio 
If statement 如果文本字段为空，如何禁用按钮？
if-statementjavafxtext 
If statement SAS错误：SUM的Null参数无效
if-statementsas 
If statement 条件格式自定义函数的Countblank和ImportRange
if-statementgoogle-sheetsreference 
If statement 根据另一个google工作表列的内容更改单元格的值
if-statementgoogle-sheets 
If statement 在查询公式中使用IF函数（谷歌工作表）
if-statementgoogle-sheets 
If statement makefile：基于布尔环境变量切换变量值
if-statementmakefile


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
需要了解etree xml for python使用标记结构的帮助吗
									Python
							 									Xml
							 									Loops
							 
在Sphinx中注释Python代码
									Python
							 									Python Sphinx
							 
Python 在包含列表的列表中查找最接近的列表匹配项
									Python
							 									Python 2.7
							 
Python 为什么sysconfig.get_path（）在Ubuntu上包含本地/子目录？
									Python
							 
Python 获取请求的URL-Flask RESTful
									Python
							 									Rest
							 									Flask
							 
python mechanize不'；t超时，无法打开url
									Python
							 
在Python中使用yield？
									Python
							 
Python 2内存错误
									Python
							 									Audio
							 
Python：用来自另一个数据帧的数据填充一个数据帧
									Python
							 									Pandas
							 									Dataframe
							 
在不使用第三方库的情况下反转矩阵
我需要使用python反转包含浮点的矩阵，但不使用第三方库（即numpy）。以这种方式求逆矩阵的计算量最小的方法是什么？
									Python
							 									Matrix
							 
无限循环python
									Python
							 
如何使FOR循环中的IF在数据帧上工作？python
									Python
							 									Pandas
							 									For Loop
							 									If Statement
							 									Dataframe
							 
Python 蟒蛇杂货店
									Python
							 									Python 3.x
							 									Python 2.7
							 
Python 为什么git clone无法在LinuxMint上统计文件？
									Python
							 									Git
							 
VS代码/python中的for循环未启动
									Python
							 									For Loop
							 									Visual Studio Code
							 
Python 某些图表在使用Matplotlib的GridSpec时不显示
									Python
							 									Pandas
							 									Matplotlib
							 
如果Python源代码在解释/JIT之前编译成字节码，为什么不'；运行时之前没有捕获此错误吗？
									Python
							 									Compilation
							 
Python 当我执行file.read（1）时，是否有返回1字节的方法？
									Python
							 									File
							 
Python ValueError:无法将字符串转换为浮点值，CSV中的值可以'；不能转换为浮动
									Python
							 									String
							 									Csv
							 									Floating Point
							 
Python 名称错误：全局名称'；烧瓶'；没有定义
									Python
							 									Twitter
							 									Routes
							 
Python 正在将JSON文件上载到DynamoDB表中的现有行
									Python
							 									Json
							 									Amazon Dynamodb
							 
Python 在给定字符串中查找所有可能的子序列
									Python
							 
Python 进行了一些更改，现在在尝试关闭顶级时出现错误
									Python
							 									Python 3.x
							 									Tkinter
							 
Python 我不知道为什么我的if语句不起作用
									Python
							 									Python 3.x
							 									If Statement
							 
如果不在python中将值对添加到列表中，则列表中已经存在值对
									Python
							 
Python 如何使用group by绘制图形？
									Python
							 									Matplotlib
							 									Graph
							 
Python 我可以使用requests库读取404页面的内容吗？
									Python
							 
Python B.汤结果的问题
									Python
							 
Python 如何对行中的某些列求和
									Python
							 									Dataframe
							 
Python ImportError:无法从AWS EC2上的“psutil”导入名称“\u psutil\u linux”
									Python
							 									Amazon Web Services
							 									Amazon Ec2
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Here Api
Xslt
Cloud Foundry
Blackberry
Raspberry Pi
Verilog
Sms
Excel Formula
Parse Platform
Iis
Entity Framework 4
Couchdb
Google Cloud Firestore
Automated Tests
Install4j
Browser
Sencha Touch
Cors
Msbuild
Socket.io
Docker Compose
Centos
Ruby On Rails 3.1
Cypress
Telerik
Memory Management
Hbase
Apache2
Ssl
Linkedin
Heroku
Dynamics Crm 2011
Vim
Google App Engine
Python Sphinx
Mapbox
Compression
Google Bigquery
Pascal
Shopify
Twitter Bootstrap
Colors
Apache Storm
Single Sign On
Http
3d
Meteor
Xsd
Sublimetext2
Pentaho
Google Plus
Sql Server 2008 R2
Build
Virtual Machine
Grid
Xmpp
Sml
Apache Flink
Encoding
Snmp
Antlr4
Terminal
Joomla
Autocomplete
Ionic2
Layout
Silverlight 4.0
Synchronization
Dataframe
Asp.net Web Api
Sugarcrm
Sharepoint
Azure Service Fabric
Jasper Reports
Plsql
Function
Vuejs2
Sapui5
R
Lucene
Responsive Design
Interface
Neural Network
Asp.net
Spotify
Google Visualization
Angularjs
Domain Driven Design
C#
Editor
Xamarin.android
Bootstrap 4
Excel
Youtube
Jqgrid
Jmeter
Charts
Abap
Visual Studio Code
Mdx
Jwt
Sharepoint 2010
Hazelcast
Sql Server
Listview
Crystal Reports
Asterisk
Visual Studio 2010
Antlr
Javascript
Jhipster
Functional Programming
Wix
Mvvm
Modelica
Java Me
Xamarin.forms
Python 3.x
Jdbc
Mono
Jaxb
Windows
Download
Jquery Plugins
Servlets
Bison
Gwt
Content Management System
Post
Clang
Oracle10g
Asp.net Mvc 2
Machine Learning
Cucumber
Inheritance
Microsoft Graph Api
Architecture
Wicket
Playframework 2.0
Elm
Windows 7
Ag Grid
Winforms
Computer Science
Error Handling
Amazon Redshift
Orchardcms
Android Ndk
Dependency Injection
Language Agnostic
Sip
Notifications
Select
Imagemagick
Shiny
Xampp
Discord
Discord.py
Oracle11g
Google Sheets
Anaconda
Embedded
Oauth
Mapreduce
Numpy
Parallel Processing
Ubuntu
Windows Phone 7
Swiftui
Asp.net Mvc 3
Yii2
Vmware
Tomcat
Qt4
Azure Ad B2c
Signalr
Laravel
Llvm
Merge
Asynchronous
Qml
Zend Framework
Jersey
Jquery Mobile
Aws Lambda
Wordpress
Windows Installer
Jquery
Geolocation
Frameworks
Oauth 2.0
Sprite Kit
Grafana
Batch File
Filesystems
Docker
Ssrs 2008
Visual Studio 2008
Model View Controller
Oracle Apex
Hybris


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网