在Python/NumPy中删除文件中的所有重复行_Python_Numpy - Fatal编程技术网

在Python/NumPy中删除文件中的所有重复行

python numpy

在Python/NumPy中删除文件中的所有重复行,python,numpy,Python,Numpy,我的问题是删除两个重复的行。我有一个文本文件： 192.168.1.18 --- B8:27:EB:48:C3:B6 192.168.1.12 --- 00:A0:57:2E:A6:12 192.168.1.11 --- 00:1D:A2:80:3C:CC 192.168.1.7 --- F0:9F:C2:0A:48:E7 192.168.1.6 --- 80:2A:A8:C9:85:1C 192.168.1.1 --- F0:9F:C2:05:B7:A6 192.168.1.9 --- DC:

我的问题是删除两个重复的行。我有一个文本文件：

192.168.1.18 --- B8:27:EB:48:C3:B6
192.168.1.12 --- 00:A0:57:2E:A6:12
192.168.1.11 --- 00:1D:A2:80:3C:CC
192.168.1.7 --- F0:9F:C2:0A:48:E7
192.168.1.6 --- 80:2A:A8:C9:85:1C
192.168.1.1 --- F0:9F:C2:05:B7:A6
192.168.1.9 --- DC:4A:3E:DF:22:06
192.168.1.8 --- 80:2A:A8:C9:8E:F6
192.168.1.1 --- F0:9F:C2:05:B7:A6

192.168.1.7 --- F0:9F:C2:0A:48:E7

192.168.1.12 --- 00:A0:57:2E:A6:12

192.168.1.11 --- 00:1D:A2:80:3C:CC

192.168.1.6 --- 80:2A:A8:C9:85:1C

192.168.1.8 --- 80:2A:A8:C9:8E:F6

文本文件与它的外观完全相同。请帮助我，我想删除两个重复的行，使其只保留：

192.168.1.18 --- B8:27:EB:48:C3:B6

192.168.1.9 --- DC:4A:3E:DF:22:06

谢谢你们的帮助。

问题中没有太多细节，您已经标记了

numpy

，这是一个要求还是一个兴趣

如果没有具体要求，请使用标准库：

d = {}
with open('/file/path', 'r') as f:
    for line in f:
        if line not in d:
            d[line] = 1
        else:
            d[line] += 1

no_dup = [line for line in d if d[line] < 2]

d={}
将open（'/file/path'，r'）作为f：
对于f中的行：
如果行不在d中：
d[行]=1
其他：
d[行]+=1
如果d[line]<2，则无_dup=[line for line in d]

问题中没有太多细节，您已经标记了

numpy

，这是一个要求还是一个兴趣

如果没有具体要求，请使用标准库：

d = {}
with open('/file/path', 'r') as f:
    for line in f:
        if line not in d:
            d[line] = 1
        else:
            d[line] += 1

no_dup = [line for line in d if d[line] < 2]

d={}
将open（'/file/path'，r'）作为f：
对于f中的行：
如果行不在d中：
d[行]=1
其他：
d[行]+=1
如果d[line]<2，则无_dup=[line for line in d]

选项1
使用

numpy

首先，用

np.loadtxt

加载文件

接下来，将

np.unique

与

return\u counts=True

一起使用，并查找所有未重复的唯一条目

unique, counts = np.unique(x, return_counts=True)
out = unique[counts == 1]

out
array(['192.168.1.18 --- B8:27:EB:48:C3:B6',
       '192.168.1.9 --- DC:4A:3E:DF:22:06'],
      dtype='<U34')

要保存到文本，您可以使用

pd.To\u csv

：

选项1
使用

numpy

首先，用

np.loadtxt

加载文件

接下来，将

np.unique

与

return\u counts=True

一起使用，并查找所有未重复的唯一条目

unique, counts = np.unique(x, return_counts=True)
out = unique[counts == 1]

out
array(['192.168.1.18 --- B8:27:EB:48:C3:B6',
       '192.168.1.9 --- DC:4A:3E:DF:22:06'],
      dtype='<U34')

要保存到文本，您可以使用

pd.To\u csv

：

另一个简短的选择是

集合。计数器对象：
import collections

with open('lines.txt', 'r') as f:
    for k,c in collections.Counter(f.read().splitlines()).items():
        if c == 1:
            print(k)

输出：
192.168.1.18 --- B8:27:EB:48:C3:B6
192.168.1.9 --- DC:4A:3E:DF:22:06

另一个简短的选择是集合。计数器对象：
import collections

with open('lines.txt', 'r') as f:
    for k,c in collections.Counter(f.read().splitlines()).items():
        if c == 1:
            print(k)

输出：
192.168.1.18 --- B8:27:EB:48:C3:B6
192.168.1.9 --- DC:4A:3E:DF:22:06

如上所述，你可以使用熊猫。Numpy还具有独特的删除重复项的功能。如上所述，您可以使用Pandas。Numpy还具有用于删除重复项的unique
功能。这也不是Numpy…@cᴏʟᴅsᴘᴇᴇᴅ 是的，我知道。不幸的是，我没有太多的经验。虽然在帖子中对其进行了标记，但我没有看到针对该库的特定解决方案的特定请求。如果你可以简单地用标准库来做，为什么不呢？@cᴏʟᴅsᴘᴇᴇᴅ, 完全在numpy上做这件事不是强制性的。主要的标记是python
，python3
，…
@shash678在您的例子中，答案无论如何都是不正确的。但一般来说，你不应该对这样的事情做出假设。请OP澄清。@cᴏʟᴅsᴘᴇᴇᴅ 说得对。因此，我做了一次编辑，要求OP澄清，但现在仍然保留我的解决方案。这也不是numpy…@cᴏʟᴅsᴘᴇᴇᴅ 是的，我知道。不幸的是，我没有太多的经验。虽然在帖子中对其进行了标记，但我没有看到针对该库的特定解决方案的特定请求。如果你可以简单地用标准库来做，为什么不呢？@cᴏʟᴅsᴘᴇᴇᴅ, 完全在numpy上做这件事不是强制性的。主要的标记是python
，python3
，…
@shash678在您的例子中，答案无论如何都是不正确的。但一般来说，你不应该对这样的事情做出假设。请OP澄清。@cᴏʟᴅsᴘᴇᴇᴅ 说得对。因此，我做了一次编辑，要求OP澄清，但现在仍然保留了我的解决方案。您只需将文件对象f
传递给计数器，而不是先对其执行读取（）.splitlines（）
。@Blckknght，不，这不起作用，因为中间为空lines@RomanPerekhrest非常感谢。你的答案就是我一直在寻找的：）@A.Babik，你是welcome@RomanPerekhrest我现在想知道如何检测文本文件中的更改。示例：如果上次读取时有新行。有什么想法吗？你可以把文件对象f
传递给计数器
，而不是先对其执行read（）.splitlines（）
。@Blckknght，不，这不起作用，因为中间为空lines@RomanPerekhrest非常感谢。你的答案就是我一直在寻找的：）@A.Babik，你是welcome@RomanPerekhrest我现在想知道如何检测文本文件中的更改。示例：如果上次读取时有新行。有什么想法吗？谢谢你的回答：“A.A. Babik注意到你有能力，所以，请考虑做这件事。”CaldFufft说：“谢谢你的回答。”A.Babik你只能接受一个。我希望你确定你接受了你想要的（我也收到了通知，这就是为什么我问）@COLDSPEED我希望我能接受这两个，因为两个答案都是正确的。我已经接受了一个最干净的输出。谢谢你的回答：“@ A.Babik注意到你有能力，所以，请考虑做它。”CaldFEEST制作：）谢谢你的回答。@ A.Babik你只能接受一个。我希望你确定你接受了你想要的（我也收到了通知，这就是为什么我问）@COLDSPEED我希望我能接受这两个，因为两个答案都是正确的。我已经接受了一个最干净的输出。




[numpy]相关文章推荐



                                                        
Numpy 指定轴的SciPy单变量样条线？
numpy 
在gpu上对numpy矩阵进行排序
numpy 
Numpy 将ndarray除以它自己的列索引
numpy 
Numpy Scipy imresize最近邻在下采样时给出不正确的结果
numpyimage-processing 
Numpy 分析FFT数据的平均频率？
numpy 
如何"；“银行标识代码”；使用自定义（非线性间隔）桶的numpy数组？
numpy 
有效的numpy子矩阵视图
numpy 
Numpy hat矩阵对角线的有效计算：inv（X'；WX）'；X'；
numpymatrix 
有没有办法为numpy.random.uniform提供概率？
numpyrandom 
Numpy Julia中的批处理矩阵乘法
numpyjulia 
Numpy ValueError:无法将字符串转换为浮点：'\ufeff2'；，如何将数组中不同类型的数据转换为浮点类型？
numpy 
为什么random.choices比NumPy快；什么是随机选择？
numpyrandom 
为什么在Pytorch张量上调用.numpy（）之前要调用.detach（）？
numpypytorch 
Numpy 如何在特定轴上做np.dot
numpy 
创建三维图像numpy阵列
numpy 
NumPy Tensordot轴=2
numpy 
如何从numpy中选择行
numpy 
为什么高阶函数在numpy中不流行
numpy 
Numpy 我对马克洛夫概率模型有问题
numpy 
Numpy 具有单个颜色条的少数行的线条集合
numpymatplotlib 
                                       





随机文章推荐



                                                        
Pagination ExpressionEngine分页-一个模板，多个通道
pagination 
Pagination 防止ItExpExt在PDFP表的中间放置一个分页符？
pagination 
Pagination 将底部分页置于CS购物车的类别页面顶部时，底部分页不起作用？
pagination 
Pagination ng zorro表默认分页
pagination 
Pagination 什么'；使用带有页面参数的GET请求的分页API的适当响应代码，其中参数不生成任何记录？
pagination


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 英语和/或芬兰语文本验证
									Python
							 
在Python 2.4中，如何将基数为10的浮点转换为十六进制？
									Python
							 									Floating Point
							 
Python Django AdminSite-实现困难还是简单？
									Python
							 									Django
							 
如何在python setup.py中创建chmod文件？
									Python
							 									Linux
							 									Security
							 
使用python 3.4安装numpy
									Python
							 									Numpy
							 
Python 如果发现多个匹配项，请将值行写入一个字段
									Python
							 									Pandas
							 									Merge
							 
Python 损失函数的正确方法
									Python
							 									Tensorflow
							 									Keras
							 
Python 与sklearn.neights.nearestneights的输出混淆
									Python
							 									Scikit Learn
							 
python docker如何打印脚本的返回代码以了解测试脚本是否通过或失败
									Python
							 									Docker
							 
python错误：需要以下参数
									Python
							 
Python 如何阻止asyncio.Task调用
									Python
							 									Asynchronous
							 
Python 如何将多个颜色指定给"；X"；波基的轴心国？
									Python
							 
Python Selenium选择器和输入不工作。建议？
									Python
							 									Selenium
							 
Python (1))[0]
max\u token\u id=token2id[max\u id]
将open（embedding_name，encoding=“utf8”，errors='ignore'）作为f：
对于f中的o：
标记，*vector=o.split
									Python
							 									Machine Learning
							 
Python 类型错误："；在'；str'；和'；浮动；？
									Python
							 
Python 试图理解生成器的递归运行
									Python
							 
Python 输出CSV文件而不下载它
									Python
							 									Django
							 
Python 如何修复操作既不是'；阵列op阵列'；使用cv2.absdiff时
									Python
							 									Python 3.x
							 									Opencv
							 
Python 如何对值列表进行api请求调用？
									Python
							 									Python 3.x
							 									Api
							 									Loops
							 									For Loop
							 
Python 转换不工作的日期格式系列
									Python
							 									Pandas
							 
Python 根据（分组）条件向数据帧添加标志
									Python
							 									Pandas
							 									Dataframe
							 
如何在Python中安装Pygame
									Python
							 
Python 如何为表中列中的每个逗号分隔值创建新行
									Python
							 									Pandas
							 
Python正则表达式忽略日期模式
									Python
							 									Regex
							 
Python 元素有时出现，有时不出现，如何继续脚本？
									Python
							 									Html
							 									Selenium
							 									If Statement
							 
如何使用python修改多个woocommerce产品
									Python
							 									Wordpress
							 									Woocommerce
							 
Python 在Pandas中使用iloc和负整数进行切片
									Python
							 									Pandas
							 									Machine Learning
							 
python中的空值
									Python
							 
Python Can'；不要在PyCharm中导入pygame
									Python
							 									Pycharm
							 
多表单处理Django python 3.x
									Python
							 									Django
							 									Web
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Phantomjs
Yaml
Asp.net Mvc 2
Rabbitmq
Woocommerce
Interface
Ios7
Angular6
Powerbi
Eclipse Rcp
Localization
Xcode
Scrapy
Windows 10
Apache Flex
Vhdl
Numpy
Transactions
Datatables
Playframework 2.0
Tags
Laravel 4
Parameters
Database Design
Chef Infra
Sugarcrm
Asterisk
Inheritance
Kdb
Jupyter Notebook
Elm
Leaflet
Asp.net
Api
E Commerce
D
Checkbox
Ffmpeg
Django Rest Framework
Spring
Cors
Protocol Buffers
Jasper Reports
Stm32
Sql Server 2008 R2
Pip
Com
Redirect
Rust
Wxpython
Cryptography
Java
Nosql
Gatsby
Ipad
Ftp
Android Studio
Firefox Addon
Openid
EmptyTag
Titanium
Silverstripe
Playframework
Entity Framework Core
Ssl
Ssas
Jar
Clearcase
Windows Installer
Caching
Verilog
Nsis
List
Asp.net Mvc 3
Teradata
Embedded
Arangodb
Ionic Framework
Scikit Learn
Mercurial
File Upload
Shiny
Amazon Dynamodb
Sonarqube
Xpages
Mono
Groovy
Methods
Google Sheets
Itext
Redis
String
Google Visualization
File Io
Dynamic
Logic
Sdk
Wicket
Web Applications
Omnet++
Amazon Cloudformation
Cocos2d X
Compression
Rss
Ag Grid
Merge
Performance
Laravel 5
Dotnetnuke
Project Management
Grails
Mediawiki
Arm
Amazon Ec2
Debugging
Operating System
Deployment
Macros
Google Colaboratory
Windows 8
Arduino
Tridion
Cakephp
Log4j
Telegram
Graphql
Mvvm
Autodesk Forge
Intellij Idea
Graph
Doctrine Orm
Tcp
Nestjs
Xml
Google Calendar Api
Css
Bluetooth
Openerp
Instagram
Sql Server 2005
Kubernetes
Ios8
Netty
Opengl
Opencv
Lua
Xamarin.ios
Inno Setup
Sitecore
C++11
Ionic2
Silverlight
Cron
Nginx
Phpstorm
Vector
Telerik
Winforms
Docker Compose
Webstorm
Google Drive Api
Jvm
Google Cloud Dataflow
Jms
Symfony1
Redux
Iframe
Pine Script
Visual Studio 2008
Authentication
Ssrs 2008
Linux
Jestjs
Julia
Debian
Postgresql
Map
Fiware
Routes
Websphere
Unicode
Xamarin.android
Navigation
Sapui5
Combobox
Magento
Google Compute Engine
Docker
Llvm
Sencha Touch
Apache Zookeeper
Spring Boot
Keycloak
Gdb
Neural Network
Reactjs
Uml
Google Maps
Pyspark
Exception Handling
Timer


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网