Unix 打印最频繁的行并删除重复项_Unix_Awk - Fatal编程技术网

Unix 打印最频繁的行并删除重复项

unix awk

Unix 打印最频繁的行并删除重复项,unix,awk,Unix,Awk,我一直在尝试打印最频繁的行，并删除一个大文件中由tab分隔的键值的重复项，第一个字段中有许多不同的值输入示例： a|gofortheeyeboo 0.61 a|gofortheeyeboo 0.81 a|gofortheeyeboo 0.81 a|gofortheeyeboo 0.81 a|gofortheeyeboo 0.81 a|gofortheeyeboo 0.81 a|gofortheeyeboo 0.91 a|gofortheeyeboo-g

我一直在尝试打印最频繁的行，并删除一个大文件中由tab分隔的键值的重复项，第一个字段中有许多不同的值

输入示例：

a|gofortheeyeboo    0.61
a|gofortheeyeboo    0.81
a|gofortheeyeboo    0.81
a|gofortheeyeboo    0.81
a|gofortheeyeboo    0.81
a|gofortheeyeboo    0.81
a|gofortheeyeboo    0.91
a|gofortheeyeboo-gone   0.07
a|gofortheeyeboo-gone   0.07
a|gofortheeyeboo-abouttogone    0.61
a|gofortheeyeboo-abouttogone    0.12
b|attaack-attack        0.07

不同键的所需输出：

a|gofortheeyeboo    0.81
a|gofortheeyeboo-gone   0.07
a|gofortheeyeboo-abouttogone    0.61
a|gofortheeyeboo-abouttogone    0.12
b|attaack-attack        0.07

到目前为止，管理了在第二个制表符分隔的字段中获取最大值的输出，通过删除重复项

awk -F '\t' '{ if (l[$1] <= $2) l[$1] = $2} END {for (i in l) print i"\t"l[i];}'

试试
uniq
和
head
怎么样？这是一个大的文本文件。不幸的是，不是关于boo。
a|gofortheeyeboo 0.91 a|gofortheeyeboo-abouttogone 0.61 b|attaack-attack 0.07 a|gofortheeyeboo-gone 0.07

sort input | uniq -c | sort -nr | \ awk 's[$2] == $1 { print $2,$3} !s[$2] { print $2,$3; s[$2]=$1; }'

keys = {} for line in sys.stdin: line = line.strip() k, v = line.split('\t') if k in keys: if v in keys[k]: keys[k][v] += 1 else: keys[k][v] = 1 else: keys[k] = {v: 1} for k in keys: items = keys[k].items() # Some pair emerged more than once if any(map(lambda x: x[1] > 1, items)): # Calucalte max frequence freq = reduce( lambda acc, e: acc if acc[1] > e[1] else e, items )[0] print '{0}\t{1}'.format(k, freq) # None pair emereged more than once else: # Print every pair for v in items: print '{0}\t{1}'.format(k, v[0])

[awk]相关文章推荐

用awk从DSSP中提取螺旋残基 awk

Awk 对于模式1唯一且对于模式2具有最高值的输出行 awk

Awk 基于公共行前缀将文件拆分为多个文件 awk

Awk 如果两行之间没有文本，则使用sed删除两行 awk sed

Awk 如何将三个文件合并为一个文件 awk

使用awk或linux命令基于密钥合并多个文件中的行 awk

awk打印文件中每一行和下一行的字段 awk sed

awk提取日期之间的数据 awk

Awk 在第一列上拆分 awk

Ruby段落模式与Awk和Perl awk perl ruby bash

Awk 即使找不到模式，也要进行转义序列 awk

合并多个awk输出以在一行上打印 awk zsh

Awk 需要在单行中打印异常，并根据搜索字符串和时间戳过滤数据 awk

AWK（igawk）@include语句失败 awk

Awk 如何仅输出正在运行的进程的用户 awk grep

Awk 如何在合并的日期和时间中添加1小时 awk

grep/awk优化了netstat或ss的输出 awk grep

使用awk或sed将关联数组索引替换为其值 awk

Awk 当递增变量的另一个值时，文件de中的变量值递增 awk sed

如何使用awk打印基于匹配模式的数字索引？ awk

随机文章推荐

SAPUI5-Sap.m.RadioButton值字段？ sapui5

sapui5中的饼图 sapui5

Sapui5 sap.m.表格选择不带单选按钮的单选模式 sapui5

Sapui5 SAP UI5表格导出 sapui5

Sapui5 SAP UI5中的滚动条 sapui5

如何在SAPUI5输入建议字段上启用自动聚焦 sapui5

Sapui5 如何在SAP UI5中单击相应列即可获取图表数据 sapui5

Sapui5 接入组件'；从OpaTest得到的si18n模型 sapui5

SAPUi5使用网格和网格数据 sapui5

Sapui5 使用声明性支持将项目添加到sap.m.list sapui5

Sapui5 如何在UI5的SmartField值帮助中通过defalt隐藏高级搜索？ sapui5

数组层次结构的SAPUI5绑定上下文 sapui5

Sapui5 图像加载问题 sapui5

Sapui5 UI5应用程序的执行顺序是什么？单机版和Fiori Launchpad嵌入式UI5应用程序的执行顺序有何不同？ sapui5

Sapui5 滚动时，表格中的文本输入单元格值将被清除 sapui5

sapui5如何在径向图上显示超过100%的值 sapui5

Sapui5 View1.controller.js？eval:8未捕获（承诺中）类型错误：无法读取属性‘；getModel’；未定义的 sapui5

Sapui5 如何使用JavaScript绑定customData sapui5

Sapui5 不会从片段触发sap.m.SelectDialog的选择、确认、关闭事件 sapui5

Sapui5 是否可以在UI5中的片段加载（从另一个视图）上执行方法（最好是onInit方法）？ sapui5

[unix]相关推荐

Unix Shell脚本错误
Unix Shell Scripting

如何在UNIX中创建新的环境变量。。。。？
Unix

Unix 如何忽略程序'；使用/usr/bin/time时的输出？
Unix Shell Time

Unix 从vi中的单词分隔符中排除破折号（-）
Unix

Unix 在AIX中找不到命令历史记录
Unix

Unix 按列筛选文件
Unix Awk

Unix 如何放置标题和标题；Tar文件格式的数据？我试图编写一个纯C++的TAR文件操作库。你能简单地把tar头跟在数据后面，中间没有什么特别的东西吗？我浏览了维基百科和gnu网站，找到了我需要的一切，除了一些东西，包括这个。我正在尝试使用（新的？）ustar格式
Unix

Unix 查找，排除dir，不降序到dir，并使用maxdepth和mindepth
Unix

Unix 在支持ssh的机器上执行remsh
Unix Ssh

grep^-在UNIX中是什么意思？
Unix

正则表达式从Unix中的.txt文件中删除垃圾
Unix

Unix 轮流使用信号灯
Unix Process

Unix 按扩展名查找文件
Unix

模糊Unix查找命令语法理解
Unix

Unix 无法将数据加载到SharePoint查找列
Unix Curl Sharepoint 2010

Unix 如何使用循环结构匹配两个不同文件中的字符串列表？
Unix File Io Awk

Unix 如果第二列的第一个字符以零开头，如何删除它
Unix

Unix 如何使用awk验证HTT，并输出一个字符串作为结果？
Unix Command Line Awk

如何从Unix计算机中删除Excel文件？
Unix

通过网络将文件从unix服务器传输到云中的共享文件夹？
Unix

Unix 仅当上一行中的字符串不同时，才对内容进行Grep
Unix Awk Sed Grep

如何在终端中使用Unix命令创建新文件？
Unix

Unix SSH重新协商无法正常工作
Unix Ssh

Unix 除了用很长的文件名保存文件，还有什么替代方法？
Unix Directory

Unix Bash代码行为模糊：大型文件处理
Unix Hadoop

Unix 替换包含环境变量的路径字符串
Unix Awk Log4j

如何在UNIX AIX中显示登录菜单？
Unix Ssh Login

如何获取变量'；在UNIX中使用source命令从文件中获取的名称？
Unix

Unix awk命令来执行特定的逻辑
Unix Awk

Unix awk当我指向文件时冻结
Unix Awk

Tags

Floating Point Entity Framework 4 Url Rewriting Printing Osgi Kernel Javafx Windows 8 Ant Blazor Nestjs Calendar Salesforce Entity Framework Core Windows Mobile Usb Isabelle Ibm Cloud Linq To Sql Makefile Transactions Awk Automation Xna Playframework 2.0 Coq Ckeditor Netbeans Logging Stata Drupal Sharepoint Machine Learning Gstreamer Parameters Delphi Julia Mysql Java Me Wcf Azure Cosmosdb Autocomplete Ssrs 2008 Collections Sql Server Fluent Nhibernate Wpf Dataframe Zend Framework Seo Pyspark Razor Cluster Computing Ios4 Computer Vision Sms Arduino Timer Video Streaming Iphone Azure Active Directory Error Handling Pandas Adobe Windows Phone 8.1 Phpstorm Ms Access Mercurial Cloud Foundry Unicode Scikit Learn Drupal 7 Gis User Interface Twig Module Resharper Python Sphinx Plsql Laravel 5 Vb6 Silverlight Sql Server 2008 Ecmascript 6 C++ Cli Replace Nosql Google Calendar Api Instagram Docusignapi Teamcity Geolocation Operating System Time Complexity Safari Azure Service Fabric Zend Framework2 Passwords Lua Data Structures Notifications Button Visual Studio 2015 Vuejs2 Matplotlib Dotnetnuke Aframe Flash Assembly Vue.js Web Scraping Corda Azure Devops Excel Formula List View Canvas Dependency Injection Vb.net Drop Down Menu Ipython Elm Azure Data Factory Sip Navigation Jquery Optimization Concurrency Opencl Google Drive Api Knockout.js Kubernetes Scrapy Cucumber Webpack Reactjs Testing Mobile Tfs Applescript Function Json Server Phpunit Playframework Eclipse Https Windows Installer Heroku Nhibernate Phantomjs Arangodb Download Ide Latex Version Control Magento Yaml C# 3.0 Intellij Idea Woocommerce Dialogflow Es Coffeescript Exchange Server Sparql Spring Mvc Perforce Orchardcms Ionic Framework Xsd Colors Octave Uiview Android Studio Ember.js Marklogic Checkbox Codeigniter Angular Material Cocos2d Iphone Debian Sass Lambda Phpmyadmin Compiler Errors Oauth 2.0 Monitoring Ios Google Chrome Eclipse Rcp Microsoft Graph Api Hash Stm32 Azure Sql Database Input Search Performance Cmd Asynchronous Couchbase Visual Studio 2008

Copyright © 2024. All Rights Reserved by - Fatal编程技术网