Unix 从文本文件中删除异常值_Unix_Awk_Statistics - Fatal编程技术网

Unix 从文本文件中删除异常值

unix awk statistics

Unix 从文本文件中删除异常值,unix,awk,statistics,Unix,Awk,Statistics,我需要在Linux中检测并删除文本文件中的异常值，也许使用某种标准偏差 vals.txt 57 60.95 61 66.80 74.42 <--- OUTLIER/BAD DATA 57 60.95 61 66.80 74.42你的问题相当模糊，因此我将假设一个异常值是总体平均值的一个以上标准偏差（也不包括57），并且所有非异常值的平均值是你最后想要的（以下用于进行数字运算，因为我不想查找（总体）标准偏差公式并用awk计算） $awk'NR==FNR{low=$1-$2；high=$1

我需要在Linux中检测并删除文本文件中的异常值，也许使用某种标准偏差

vals.txt

57
60.95
61
66.80
74.42 <--- OUTLIER/BAD DATA

57
60.95
61
66.80
74.42你的问题相当模糊，因此我将假设一个异常值是总体平均值的一个以上标准偏差（也不包括57），并且所有非异常值的平均值是你最后想要的
（以下用于进行数字运算，因为我不想查找（总体）标准偏差公式并用awk计算）
$awk'NR==FNR{low=$1-$2；high=$1+$2；next}
$1>=低&&$1您的问题非常模糊，因此我将假设一个异常值是总体平均值的一个以上标准偏差（也不包括57），并且所有非异常值的平均值是您最后想要的
（以下用于进行数字运算，因为我不想查找（总体）标准偏差公式并用awk计算）
$awk'NR==FNR{low=$1-$2；high=$1+$2；next}
$1>=低和$1为什么74.42是异常值而57不是？grep-v异常值文件
应该解决当前信息的问题。为什么74.42是异常值而57不是？grep-v异常值文件应该解决当前信息的问题。
awk '{
cnt[$1]++
val[$1] = (val[$1] ? val[$1] "," $1 : $1)
sum[$1] += $1
    } END {
for (i in val) {
    n = split(val[i], a, " ")
    for (k=1; k<=n; k++)
        if (!((sqrt((a[k] - (sum[i]/cnt[i]))^2)) < ((sum[i] / cnt[i]) * (30/100)))) {
            cnt[i]--
            sum[i] -= val[i]
        }
}
for (i in sum)
    printf "%8.5f   %6.2f   %6d   %6.3f\n", i, sum[i], cnt[i], sum[i] / cnt[i] | "sort -nk1"
}' vals.txt

$ awk 'NR == FNR { low = $1 - $2; high = $1 + $2; next }
       $1 >= low && $1 <= high { sum += $1; count += 1 }
       END { print sum / count }' <(datamash mean 1 pstdev 1 < vals.txt) vals.txt
62.9167




[awk]相关文章推荐



                                                        
awk，计算不同时间间隔的平均值
awk 
如何从awk获取总计列
awk 
awk中的整数除法
awkfloating-point 
如何按AWK 3.1.3中定义的顺序打印数组
awk 
如何跳过awk中的特定行并打印其余行
awk 
2个文件组合在一列中，但使用awk的列号不同
awk 
使用awk时在字段中保留空白
awk 
Awk 摆脱与linux匹配的行尾模式
awksed 
AWK：跨任意数量的列（单列文件或列矩阵）查找公共元素
问题
awk 
Awk 使用sed多次替换文件中的文本
awksed 
Awk 如何替换括号内的一个字符，保持其他字符不变
awksedgrep 
通过AWK向（VCF文件的）指定列的值添加前缀
awk 
“是什么意思？”；[|]和#x2B&引用；在；awk-F'；[|]和#x2B'&引用；？
awk 
Awk 列增量条件
awk 
Awk Bash：从特定行中删除特定字符范围
awk 
Awk 比较两个文件是否匹配，打印找到的所有匹配项
awk 
如何使用awk将值保存为新列？
awk 
awk命令解析由新行分隔的文件
awk 
使用awk，提取文本文件中一列中两个字符串之间的第一个和最后一个数字，然后将它们区别开来？
awk 
如何使用awk输出数据集的选定元素
awk 
                                       





随机文章推荐



                                                        
Google visualization 如何设置工具提示以显示与Google可视化折线图中的轴匹配的百分比？
google-visualization 
Google visualization 如何下载csv格式的谷歌公共数据？
google-visualization 
Google visualization 如何在Google图表工具中绘制甘特图？
google-visualization 
Google visualization 谷歌可视化API-堆叠条形图-自定义工具提示
google-visualization 
Google visualization 谷歌图表-如何防止选择某些点？
google-visualization 
Google visualization 如何设置艺术中每个州的区域颜色？
google-visualization 
Google visualization 柱状图：如何在水平轴上显示所有标签
google-visualization 
Google visualization Pieslice标签在谷歌饼图中不可见如果它的比例很小，我可以让它可见吗？
google-visualization 
Google visualization 谷歌差异条形图-更改条形图颜色
google-visualization 
Google visualization 如何在古勒查特艺术中处理多个事件/听众
google-visualization 
Google visualization 如何更改谷歌图表中的图表区背景色？
google-visualization 
Google visualization 使用；角色：'；注释'&引用；垂直放置文本的步骤
google-visualization 
Google visualization 合并堆叠条形图的总计
google-visualization 
Google visualization “如何开火”；选择"；谷歌折线图上的事件？
google-visualization 
Google visualization Google柱形图X轴标签与值不同
google-visualization 
Google visualization 在hAxis中显示所有日期
google-visualization


                                        

                                        
                                        


                                                
                                                        [unix]相关推荐
                                                        
Unix semget失败时使用了“退出”；“拒绝许可”；
									Unix
							 
Unix 如何提取即时目录的名称和文件名？
									Unix
							 									Sed
							 									Awk
							 
Unix 带保险丝的谷歌硬盘
									Unix
							 									Google Drive Api
							 
Unix 从Windows编辑“开发”框会添加奇数字符
									Unix
							 									Ssh
							 									Editor
							 
Unix 为什么我需要使用'-P'；我什么时候给你一张单子？
									Unix
							 									Grep
							 
Unix 如何在VIm和终端中始终具有相同的当前目录？
									Unix
							 									Vim
							 
Unix LSF父作业正在等待子作业
									Unix
							 
Unix HP-UX ksh递归查找和替换
									Unix
							 									Sed
							 
Unix sh脚本：在装入的文件系统中运行时没有输出
									Unix
							 									Permissions
							 
Unix 如何对find的所有结果运行命令？
									Unix
							 
还可以运行Unix命令的Web自动化
									Unix
							 									Web
							 									Automation
							 
使用fhinfo的HP UNIX Cobol文件格式
									Unix
							 									Cobol
							 
Unix:solaris中的Egrep-a
									Unix
							 									Grep
							 
Unix 如果变量为false，则中断循环
									Unix
							 									If Statement
							 									For Loop
							 
Unix ksh脚本解释器“/usr/bin/ksh“；未找到错误
									Unix
							 
是否有unix命令转储当前目录中每个文件夹中的所有文件？
									Unix
							 
在Unix中，如何用字符串中的\$$替换$
									Unix
							 									Replace
							 
如何从unix（AIX、RHEL或UB）服务器响应HTTP POST？
									Unix
							 									Curl
							 									Post
							 
替换大型.txt文件标题中的列-unix
									Unix
							 									Awk
							 									Sed
							 
Unix HP-UX中的GCC 6.2生成错误
构建环境

HP-UX RX2660 B.11.31 U ia64
通用条款4.2.3

构建目标

通用条款6.2

swlist
									Unix
							 									Gcc
							 
Unix 在文件中查找重复记录并将其输出到另一个文件中
									Unix
							 									Awk
							 
Unix Kubernetes吊舱将陷入崩溃回退：说启动容器的许可被拒绝
									Unix
							 									Kubernetes
							 
Unix 从文本文件中删除异常值
									Unix
							 									Awk
							 									Statistics
							 
Unix Java虚拟机信号
									Unix
							 									Jvm
							 
Unix HP-UX上的备份命令失败
									Unix
							 
在UNIX中计算以特定字母表开始的行数？
									Unix
							 
Unix 最佳做法
									Unix
							 									Rust
							 
Unix 基于shell脚本中csv文件的日期统计记录数
									Unix
							 
Unix 我需要一个2字节的文件，其中包含2位数字
									Unix
							 									Vim
							 
在unix中如何将多行合并为单行？
我的文本文件如下所示：-
									Unix
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Erlang
Qt
Tsql
Sms
Sharepoint
Zend Framework
Angular
X86
Django Models
Primefaces
Socket.io
Bash
Ldap
Ruby
Kotlin
Scripting
Vhdl
Vaadin
Jvm
Keras
Project Management
Cobol
Axapta
Sprite Kit
Excel Formula
Ruby On Rails
Google Colaboratory
Sails.js
Workflow
Perforce
Coq
Jekyll
Tensorflow
Version Control
Arduino
Apache Storm
Mariadb
Hybris
Google Cloud Platform
Smalltalk
Apache2
Openid
Qml
Internet Explorer
Gruntjs
Mercurial
Collections
Common Lisp
Google Compute Engine
Datetime
Meteor
Jquery
Entity Framework 4
Swing
Rabbitmq
Apache Nifi
Ibm Midrange
Powershell
Azure Service Fabric
Automated Tests
Elm
Mediawiki
Weblogic
Gremlin
Xampp
Gmail
Opengl Es
Linkedin
Abap
Validation
Continuous Integration
Inheritance
Download
Plot
Uml
Tcp
Emacs
Encoding
Google Calendar Api
Openstack
Kernel
Notifications
Woocommerce
Logging
Windows Phone 8.1
Post
Opencv
Swift2
Google Visualization
Ada
Lisp
E Commerce
Virtual Machine
Typescript
Macos
Json
Operating System
Modelica
Asynchronous
Phpmyadmin
Input
Proxy
Unit Testing
Mapping
Knockout.js
Sql Server 2008
Biztalk
Angular6
Omnet++
Computer Vision
Debugging
Lotus Notes
Haskell
Silverstripe
Cakephp
Yii
Protractor
Nosql
Sip
Ember.js
Oracle11g
Office365
Monitoring
Objective C
Bots
Xaml
C# 4.0
Artificial Intelligence
Gwt
Hadoop
Nlp
Mule
Rss
Swagger
Gcc
Git
Oop
Embedded
Github
Activerecord
Asp Classic
Odata
Compilation
Libgdx
Authentication
Bootstrap 4
Netbeans
C++
Asp.net Mvc 4
Jupyter Notebook
Url
Svg
Hbase
Ffmpeg
Loops
View
Excel
Wso2
Windbg
Ftp
Open Source
Tree
Xamarin.forms
Email
Encryption
Calendar
Asp.net Mvc
Performance
Jquery Plugins
Reflection
Gps
Youtube
Ipython
Matplotlib
Google Sheets
Kibana
Model View Controller
Azure Ad B2c
Pascal
Orchardcms
Mapbox
Import
Sqlalchemy
Cookies
Sugarcrm
Com
Protocol Buffers
Permissions
Network Programming
Graphviz
Angular Material
Generics
Combobox
Lua
Firefox
Applescript
Uiview
Visual Studio 2010
Scroll
Install4j
Mod Rewrite


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网