Python 如何计算数据框中所有行的列列表中包含的字数和唯一字数？_Python_Pandas - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/312.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何计算数据框中所有行的列列表中包含的字数和唯一字数？_Python_Pandas - Fatal编程技术网

Python 如何计算数据框中所有行的列列表中包含的字数和唯一字数？

python pandas

Python 如何计算数据框中所有行的列列表中包含的字数和唯一字数？,python,pandas,Python,Pandas,我在pandas数据框中生成了一列df['approxers']，其中包含另一列的所有形容词列表，df['reviews'] df[“形容词”]的值采用这种格式，例如： [“优秀”、“更好”、“大”、“意外”、“优秀”、“大”] 我想创建一个新列，计算df['approxers']中的单词总数以及df['approxers']中的“唯一”单词数函数应该遍历整个数据帧，并应用每行的计数对于上面的行示例，我希望df['totaladj']为6，df['uniqueadj']为4（因为“优秀”和“

我在pandas数据框中生成了一列

df['approxers']

，其中包含另一列的所有形容词列表，

df['reviews']

df[“形容词”]

的值采用这种格式，例如：

[“优秀”、“更好”、“大”、“意外”、“优秀”、“大”]

我想创建一个新列，计算

df['approxers']

中的单词总数以及

df['approxers']

中的“唯一”单词数

函数应该遍历整个数据帧，并应用每行的计数

对于上面的行示例，我希望

df['totaladj']

为6，

df['uniqueadj']

为4（因为“优秀”和“大”是重复的）

将熊猫作为pd导入
df=pd.read_csv（'./data.csv'）
df['totaladj']=df['adximates'].str.count（''）+1
df.to_csv（'./data.csv'，index=False）

以上代码在计算形容词总数时有效，但不计算形容词的唯一数量。

这就是您要寻找的行为类型吗

根据您的描述，我假设形容词列中的值是一个格式类似列表的字符串，例如“['big'、'excellent'、'small']”
下面的代码使用split（）将字符串转换为列表，然后使用len（）获取长度。在使用len（）之前，通过将列表转换为集合来查找唯一形容词的数量

df['adjcount']=df['adjmatexes'].apply（lambda x:len（x[1:-1]）。split（'，'）） df['uniqueadjcount']=df['adximates'].apply（lambda x:len（set（x[1:-1]）。split（'，'））
很高兴我能帮忙@youngguv如果此答案解决了您的问题，请确保您将其标记为已接受答案。

[pandas]相关文章推荐

Pandas 熊猫：多层次群体的聚合 pandas

Pandas 获取面板布尔索引错误 pandas indexing

Pandas 更改选定行的列中的值 pandas dataframe

Pandas 如何从另一个数据帧中查找一个数据帧中多个列的值 pandas dataframe

Pandas 将时间值减去熊猫中的时间列 pandas datetime dataframe time

如何将整数掩码作为位编码到pandas中的伪变量中 pandas

Pandas 如何在两级参数中取消Pivot pandas

Pandas 将GroupBy转换为DataFrame pandas

Pandas Dataframe.read\u sql\u query（）和sql Alchemy中十进制类型的TypeDecorator pandas sqlalchemy

Pandas 在列中搜索字符串，并通过在数据框中添加另一列来提及该字符串 pandas

Pandas 请阅读“gbq（）”；无效凭证"；错误 pandas google-bigquery jupyter-notebook

Pandas 计算这两列中唯一值的数量 pandas

Pandas 基于第二个数据帧中的列从一个数据帧中选择数据 pandas dataframe datetime

Pandas 转换数据帧后的列名 pandas dataframe

Pandas 了解如何使用.filter（）选择列的范围 pandas

Pandas 拼花地板分区将Int32降级为浮动64 pandas

根据pandas中的列名快速使用datetime填充单元格？ pandas datetime

Pandas-基于列值除去NAN pandas

比较组并获得所有组的相等值（pandas groupby） pandas

Pandas 基于数据帧、序列和字典的Q编码 pandas numpy

随机文章推荐

Stream 公共lisp灰色流 stream common-lisp

Stream 在dr.Racket中构建无限流会使我的内存过载吗？ stream racket

Stream 无法使用FMS直播H.264视频 stream

OCaml:Stream.peek不使用消费行？ stream ocaml

Stream 如何制作键盘事件流'；长按该键时触发的？（飞镖） stream dart angular

Stream 将SCADA系统中的数据捕获到HDFS（Hadoop DataLake）中进行分析 stream

Stream 束流 stream

Stream 通过VLC传输桌面 stream udp

Stream RSocket服务器的邮递员 stream postman

Stream 使用Bento4 mp4dash在仪表盘清单（mpd）中添加多个带有单个音轨的字幕 stream

Stream 如何在Deno中获取文件校验和？ stream

[python]相关推荐

Tags

Entity Framework Arrays Virtualbox Hive Design Patterns Matplotlib Drupal 7 Reactjs D3.js Tridion Menu Influxdb Objective C Ionic2 Ruby Joomla Codenameone Processing Vagrant Asynchronous Zend Framework2 Azure Ad B2c Bots Unix Filter Csv Microsoft Graph Api Lua Gulp Android Layout Airflow Centos Netlogo Vhdl Erlang Oracle Imagemagick Salesforce Ibm Mobilefirst Boost Maps Activerecord Ignite Map Zend Framework Amazon S3 Kendo Ui Snowflake Cloud Data Platform Active Directory Opencv Exchange Server Ide Powerbi Talend Sharepoint 2010 Sublimetext2 Nginx Sphinx Asterisk Jsf Woocommerce Indexing Migration Google App Engine Rxjs Authentication Node.js Vbscript Liferay Editor Dialogflow Es Sass Methods Programming Languages Ionic Framework Fluent Nhibernate Tags Jsp Kernel Serialization Stripe Payments Windows Services Jetty Windows 7 Nosql Webpack Sqlite Compilation Ajax Multithreading Animation Grafana Asp.net Mvc 4 Ibm Cloud Sugarcrm Orientdb Phpstorm Sql Server 2008 R2 Jaxb Iphone Sparql Dataframe Internet Explorer Domain Driven Design Memory Leaks Ipython Modelica Exception Binding Sublimetext3 Time Import Caching Sql Server 2012 Azure Service Fabric Project Management Uwp Requirejs Blazor Amazon Dynamodb Tcp Url Architecture Rust Math Twitter Bootstrap 3 If Statement Azure Apache Zookeeper .htaccess Ruby On Rails 3 Highcharts Sas Internationalization Apache Flink Windows Network Programming Pine Script Windows 10 Hbase Testng Dask Ios4 Pip Git Compiler Construction Certificate Osgi Javafx Swift3 Weblogic Dojo Dns Gruntjs Twitter Bootstrap Gcc Google Cloud Dataflow C++ Cli Plsql Visual Studio 2010 .net 4.0 Cygwin Hadoop Plugins Stm32 Spring Mvc Model View Controller Visual Studio 2013 Aframe Jboss C# 3.0 Jira Dotnetnuke Ssrs 2008 Facebook Akka Excel Scroll Here Api Kdb Biztalk Charts Wpf Dom Loopbackjs Pycharm Robotframework Selenium Webdriver Elm Office365 Sorting Open Source Actionscript 3 Sonarqube Playframework Composer Php Umbraco Junit Bootstrap 4 Blockchain Mqtt

Copyright © 2024. All Rights Reserved by - Fatal编程技术网