Python 消除数据帧中列值的重复-该列包含多个URL'；s_Python_Pandas_Dataframe - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/325.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 消除数据帧中列值的重复-该列包含多个URL'；s_Python_Pandas_Dataframe - Fatal编程技术网

Python 消除数据帧中列值的重复-该列包含多个URL'；s

python pandas dataframe

Python 消除数据帧中列值的重复-该列包含多个URL'；s,python,pandas,dataframe,Python,Pandas,Dataframe,因此，在我的DataFrame Pd1中有一个名为“URL”的列 URL row 1 : url1,url1,url2 row 2 : url2,url2,url3 输出： URL row 1 : url1,url2 row 2 : url2,url3 如果数据 URL 0 url1,url1,url2 1 url2,url2,url3 然后我假设您的列只包含URL列表可能的解决办法之一是：将函数应用于URL列，包

因此，在我的DataFrame Pd1中有一个名为“URL”的列

        URL

row 1 : url1,url1,url2
row 2 : url2,url2,url3

输出：

        URL
row 1 : url1,url2
row 2 : url2,url3

如果数据

URL 0 url1,url1,url2 1 url2,url2,url3
然后

我假设您的列只包含URL列表
可能的解决办法之一是：

将函数应用于URL列，包括以下步骤：

在每个逗号上拆分源字符串（tre result是碎片）

从该列表中创建一个集合（从而消除重复）

使用逗号连接此集中的键

将结果保存回源列

比如：

df.URL = df.URL.apply(lambda x: ','.join(set(re.split(',', x))))
由于此代码使用re模块，您必须在之前导入re。
拆分并应用集合

d={“url”：[“url1，url1，url2”， “url2、url2、url3”]} df=pd.数据帧（d） df.url.str.split（“，”）.apply（集合）
您尝试过什么代码，我也假设您使用的是pandas？
URL
列只是一个字符串，还是它包含一个列表？干得不错，但我感觉“row1:”和“Row2:”不是
URL
列的一部分，而是他编写df索引的方式。啊！！我使用了
，所以在我的数据帧Pd1中有一个名为“URL”的列，如果OP发生了变化，那么我会相应地进行改变 URL 0 url1,url1,url2 1 url2,url2,url3 df['URL'] = df.URL.str.split(',').apply(lambda x: ','.join(sorted(set(x)))) ##print(df) URL 0 url1,url2 1 url2,url3 df.URL = df.URL.apply(lambda x: ','.join(set(re.split(',', x))))

[pandas]相关文章推荐

Pandas 对无效命名列的属性访问 pandas

Pandas 如何将文件夹中的每个文件读取到以文件名和覆盖列名命名的数据框中？ pandas dataframe

Pandas 多指标GroupBy（）的散点图 pandas

Pandas 标记大小/带窗口大小的alpha缩放/放大打印/分散 pandas matplotlib

Pandas 根据数据帧中的值（每行前20列）进行列选择，数据帧具有多列，同时保留所有行 pandas dataframe

Pandas 将熊猫中的一列按另一列分组？ pandas sorting

Pandas 如何获取具有相同名称的单行列的值？ pandas dataframe

Pandas 将groupby对象转换为dataframe，同时保留组语义 pandas

Pandas 熊猫导出为_csv（），列名周围带引号 pandas csv

Pandas 如果存在NaN，如何将1添加到以前的数据中 pandas

如何用字符串“替换pandas数据帧中的所有NAN？”；无”； pandas

Pandas 如何从示例dataframe的“创建时间”列中获取小时数，并将其作为另一个dataframe进行计数 pandas

Pandas 如何将数据帧（df）列的每个值的第一位提取到新的数据帧（df1） pandas

Pandas 如何像'；在excel中合并并居中'；熊猫？ pandas

Pandas 熊猫分级索引&x27；s使用n-d numpy数组作为索引的数据帧 pandas numpy dataframe

Pandas 如何以这种方式删除行索引和展平索引 pandas dataframe

Pandas 在方法链中指定列名 pandas

Pandas 从特定列生成随机数 pandas random

Pandas 如何在pyspark dataframe中对单个列执行整形操作？ pandas numpy apache-spark pyspark

Pandas read_html无法读取表格 pandas

随机文章推荐

Drupal 7 如何更改Drupal7的字段值 drupal-7

Drupal 7 第二个分类法自动完成依赖于第一个分类法自动完成 drupal-7

Drupal 7 编辑摘要按钮编辑器-Drupal 7 drupal-7 ckeditor

Drupal 7 Drupal 7 FAPI类型按钮不工作 drupal-7

Drupal 7 Drupal 7节点自定义显示 drupal-7

Drupal 7 如何在drupal 7中包含/调用profile2注册表 drupal-7

Drupal 7 drupal 7使用挂钩禁用nolink菜单项 drupal-7

Drupal 7 Ccontent entity引用字段以表单形式存储实体ID，而不是视图中的值 drupal-7

Drupal 7 Drupal Commerce设置订单总数规则 drupal-7

Drupal 7 Drupal7Boost正在创建但不提供缓存页面 drupal-7

Drupal 7 如何使用菜单钩子获取节点id drupal-7

Drupal 7 使用cli将Drupal站点复制到登台模式 drupal-7

Drupal 7 Drupal-获得视野 drupal-7

Drupal 7 更新模块版本时获取灰色错误消息“无法获取可用更新数据”。如何立即更新 drupal-7

Drupal 7 Drupal表单提交处理程序不工作，但为什么？ drupal-7

Drupal 7 如何在Drupal7中添加链接rel代码？ drupal-7

Drupal 7 Drupal Commerce Kickstart2中的其他字段 drupal-7

[python]相关推荐

Tags

Windows Sencha Touch 2 Tree Debian Android Ndk Composer Php Html Big O Spring Fiware Shopify Paypal Properties Date Git Sapui5 If Statement Mediawiki Symfony1 Leaflet Serial Port Jms Error Handling Mvvm Reflection Applescript Functional Programming Cron Razor Ember.js Generics Hash Datatables Iis Arangodb Java 8 Tcp Qml Sap Xmpp Azure Ad B2c Gitlab React Native Opengl Es Cluster Computing Ibm Midrange String Sql Server 2008 Cocos2d X Ide Windows Runtime Object Layout Aws Lambda Pyspark Openlayers 3 Asp.net Mvc 5 Apache Kafka Less Windows Phone 8.1 Omnet++ Opencart Ssas Gps Grid Imagemagick Android Azure Sql Database Octave Docker Resharper Swing Service Formatting Uwp Websocket Xquery Orchardcms Browser Sms Optimization Nginx Hbase Testing Google Drive Api Jsf 2 Character Encoding Devexpress Tensorflow Telerik Swift3 File Io Gradle Documentation Gatsby Workflow Phantomjs Nsis Continuous Integration Drupal Sitecore Mqtt Gmail Jasmine Scrapy C Project Management Scroll Marklogic Java Virtualbox Lucene Silverstripe Safari Qt4 Sorting Swift2 Javafx Amazon Dynamodb Post Uiview Serialization Extjs Google Chrome Ruby On Rails 3.2 C# Neural Network Excel Data Structures Debugging Dynamics Crm Jboss Domain Driven Design Google Cloud Dataflow Cobol Dom Dask Google Plus Ajax Installation Bazel Orientdb Django Adobe Unicode Mono Events Nservicebus Vhdl Xcode4 Jwt Gwt Keras Mapbox Content Management System Drupal 6 Testng Libgdx Geolocation Linux Kernel Google Calendar Api Internet Explorer Utf 8 Cocoa Touch Memory Management Crystal Reports Fluent Nhibernate Material Ui Playframework 2.0 Magento Dialogflow Es Subsonic Coq Xampp Doctrine Merge Transactions Scripting Exchange Server Rust Filesystems Julia Command Line Shiny Jdbc Twilio Rx Java Air Scheme Checkbox Oracle Nunit Map Tfs Asp.net Core Mvc Loopbackjs Linker Module Codeigniter Programming Languages Vaadin

Copyright © 2024. All Rights Reserved by - Fatal编程技术网