Awk：一个文本文件中的字符频率？_Awk_Character_Cjk_Frequency Analysis_Word Frequency - Fatal编程技术网

Awk：一个文本文件中的字符频率？

awk

Awk：一个文本文件中的字符频率？,awk,character,cjk,frequency-analysis,word-frequency,Awk,Character,Cjk,Frequency Analysis,Word Frequency,给定一个多语言.txt文件，例如： But where is Esope the holly Bastard But where is 생 지 옥 이 군 지 옥 이 지 옥 지 我是你的爸爸！爸爸！！！你不會的！ I使用此Awk函数计算空格分隔词的词频： $ awk '{a[$1]++}END{for(k in a)print a[k],k}' RS=" |\n" myfile.txt | sort 获得优雅： 1 생 1 군 1 Bastard 1 Eso

给定一个多语言.txt文件，例如：

But where is Esope the holly Bastard
But where is 생 지 옥 이 군
지 옥 이
지 옥
지
我 是 你 的 爸 爸 ！
爸 爸 ！ ！ ！
你 不 會 的 ！

I使用此Awk函数计算空格分隔词的词频：

$ awk '{a[$1]++}END{for(k in a)print a[k],k}' RS=" |\n" myfile.txt | sort

获得优雅：

1 생
1 군
1 Bastard
1 Esope
1 holly
1 the
1 不
1 我
1 是
1 會
2 이
2 But
2 is
2 where
2 你
2 的
3 옥
4 지
4 爸
5 ！

如何将其更改为计数字符频率？

编辑：对于字符频率，我使用了（@Sudo_O的答案）：
对于词频，请使用：

$ grep -o '\w*' myfile.txt | awk '{a[$1]++}END{for(k in a)print a[k],k}' | sort > myoutput.txt
一种方法：

$ grep -o '\S' file | awk '{a[$1]++}END{for(k in a)print a[k],k}' 3 옥 4 h 2 u 2 i 3 B 5 ！ 2 w 4 爸 1 군 4 지 1 y 2 l 1 E 1 會 2 你 1 是 2 a 1 不 2 이 2 o 1 p 2 的 1 d 1 생 3 r 6 e 4 s 1 我 4 t
使用重定向将输出保存到文件：

$ grep -o '\S' file | awk '{a[$1]++}END{for(k in a)print a[k],k}' > output
对于排序输出：

$ grep -o '\S' file | awk '{a[$1]++}END{for(k in a)print a[k],k}' | sort > output

谢谢很高兴你回答了！有趣的是，两者都是$grep-o。文件和$grep-o'\S'文件工作正常。他们都对吗？@Hugolpz说得对。不，这是不对的。。最初我发布了
grep-o.
，但是将匹配空格，因此我将其更改为
grep-o'\S'
，其中
\S
是匹配任何非空格字符的regexp速记。
$ grep -o '\S' file | awk '{a[$1]++}END{for(k in a)print a[k],k}' | sort > output

[drop down menu]相关文章推荐

Drop down menu 无法在页面加载时检索dropdownlist.selectedvalue？ drop-down-menu

Drop down menu 显示/隐藏IE8中下拉列表中的选定选项不工作 drop-down-menu internet-explorer-8

Drop down menu 是否不可能使用引导下拉菜单nav获得指向根目录外页面的链接？ drop-down-menu

Drop down menu 如何启动Orchard高级菜单？ drop-down-menu content-management-system orchardcms

Drop down menu Dart，polymer-如何动态创建上下文相关的下拉菜单 drop-down-menu dart

Drop down menu 我应该如何在Flatter中自定义DropdownButtons和DropdownMenuItems？ drop-down-menu flutter

Drop down menu 将TCA更改保存在选择框的TYPO3中 drop-down-menu typo3

随机文章推荐

Vaadin中的缓存问题 vaadin

使用Vaadin创建facebook应用程序？ vaadin

Vaadin是否将所有gui小部件下载到客户端？ vaadin

如何在客户端调试Vaadin组件？ vaadin

Vaadin ListSelect中的setFilteringMode vaadin

vaadin7从容器中获取值 vaadin

Vaadin 7.3.2中没有会话过期通知 vaadin

如何在Vaadin中生成序列号列 vaadin

Vaadin网格8-从Vaadin 7升级后未加载内容 vaadin

Vaadin 使用Google/MS Azure/LinkedIn/Box进行身份验证 vaadin

为Vaadin Flow 14.2（或16）应用程序的生产版本禁用ES5传输 vaadin

Vaadin 7 widgetset编译失败，返回“0”；检查您的模块是否继承'；com.google.gwt.core.core'&引用； vaadin

[awk]相关推荐

需要有关awk命令不匹配的帮助'；
Awk

如何强制AWK停止应用规则？
Awk

Awk 如何读取文件并在每行进行查询？
Awk

Awk 使用ksh脚本获取子字符串
Awk

列的Awk宽度
Awk

awk：以原始格式打印列
Awk

Awk——基于另一个文件编辑两个文件中的字段值'；内容
Awk

awk命令使用for循环计算两个字段
Awk

Awk 比较两个文件，第一列匹配文本，第二列匹配第一个文件>；大于第二个文件的第二列值
Awk

管道符号前awk中按字段计数
Awk

如何使用awk或sed删除多个元字符
Awk Sed

Awk 从dstat获取可变数量内核的每个内核的CPU空闲百分比
Awk Grep

Awk 拆分大文件，添加第一行作为文件名
Awk Sed Grep

Awk 从一行中提取多个信息
Awk Sed Grep

Awk getline需要越来越多的时间
Awk

Awk 如何重复脚本？
Awk

Awk 向制表符删除文本中的列添加百分比
Awk

当我设置FS=”时，为什么AWK打印很奇怪&引用；而不是FS="\t"；？
Awk Printing

Awk 合并两个文件并将行转换为列
Awk

Awk 改变大小病例
Awk Sed

Awk 我如何计算字母的频率
Awk Sed

Awk 是否有一种方法可以替换某些字符的所有出现，但只能替换每N行？
Awk

Awk 如何在同一字段中查找/打印两个连续的对号浮点数？
Awk

Awk 拆分行的第二列以使用bash oneliner创建多行
Awk Sed

Awk 如何使用sed和find替换基于列表的文本
Awk

Awk 搜索图案并每次打印到特定图案上方
Awk Sed

用于获取gnome终端配置文件的AWK函数
Awk Grep

Awk 如何从一个文件中grep数据，执行小操作，然后将它们附加到另一个文件中
Awk Sed Grep

Awk 从另一个文件中删除与特定图案匹配的行
Awk Grep

awk中的sub（）函数对于某些字符串的工作方式与预期不同
Awk

Tags

Opengl Parse Platform Visual Studio Odoo Camera Blackberry Computer Vision Jquery Ui Report Oop Web Crawler Wpf Security Puppet Sparql Android Layout X86 Mobile Jaxb C# 3.0 Discord.js Coffeescript Elm Webrtc Download Redis Jsf Ionic2 Go Jasmine Windows Mobile Ember.js Salesforce Matlab Model Cuda Apache Storm .net Core Docusignapi Less Text Joomla Interface Routing Hyperlink Io Nunit Java Me Facebook Graph Api Ios8 Coq Gps Vb6 Xpath Dojo Unix Graphics Prometheus Kdb Google Cloud Firestore Openshift Tridion Umbraco Jupyter Notebook Binary Webview Cors Eclipse Plugin Mono Xamarin.forms Redirect Sql Server 2012 Codenameone Continuous Integration Sharepoint 2013 Vector Highcharts Markdown Primefaces Replace Jvm Ms Word Oauth 2.0 Sms Antlr Architecture Xampp Apache Zookeeper Nsis Kibana Vaadin Keras Mqtt Nativescript Cron Binding Methods Swagger Aws Lambda Configuration Email Racket Logic Modelica Telegram Apache Flink Ssis Wso2 Vim Neo4j Entity Framework Core Telerik Cryptography Delphi Ruby Triggers Silverstripe Blazor Sql Server 2008 R2 Rx Java Install4j Maps Sqlite Spring Dependencies Jar Database Laravel 5 Codeigniter Authentication Omnet++ Video Isabelle Azure Cosmosdb Ruby On Rails Ibm Cloud Oracle10g Influxdb Asp.net Mvc 2 Calendar Pyspark Ip Mediawiki File Asp Classic Web Project Management Windows Phone 8.1 Electron Marklogic Nlp Web Services Cobol Datatables Ssh Swift Cluster Computing Leaflet Flask Pine Script Audio Google Api Material Ui Dom Pdf Google Colaboratory Flutter Post Axapta Javafx 2 Curl Routes Usb Gdb Cucumber Fiware Anaconda Wolfram Mathematica Service Fortran Core Data Stm32 Imagemagick Jenkins Swiftui Uiview Combobox Merge Pagination Common Lisp Excel Formula Jetty Windows Store Apps Http Verilog Chart.js Instagram Typescript Matplotlib Docker Compose Spring Boot

Copyright © 2024. All Rights Reserved by - Fatal编程技术网