Bash 根据hdfs目录中的文件名统计文件数_Bash_Shell_Apache Spark Sql_Hdfs - Fatal编程技术网

Bash 根据hdfs目录中的文件名统计文件数

bash shell

Bash 根据hdfs目录中的文件名统计文件数,bash,shell,apache-spark-sql,hdfs,Bash,Shell,Apache Spark Sql,Hdfs,我有一个HDFS目录，有超过1000条记录，其中包含不同的文件名。我必须根据文件名数数文件。因为我有上千个文件，所以我不能给出具体的文件名例如，目录包含以下文件 /a/b/a.txt /a/b/b.txt /a/b/c.txt /a/b/a.txt /a/b/b.txt /a/b/c.txt 结果应该是 a、 txt 2 b、 txt 2 c、 txt 2决不是一个有效的解决方案，但如果您只是想快速编写脚本，它可以： find . -exec basename {} \; | sort |

我有一个HDFS目录，有超过1000条记录，其中包含不同的文件名。我必须根据文件名数数文件。因为我有上千个文件，所以我不能给出具体的文件名

例如，目录包含以下文件

/a/b/a.txt

/a/b/b.txt

/a/b/c.txt

/a/b/a.txt

/a/b/b.txt

/a/b/c.txt

结果应该是

a、 txt 2

b、 txt 2

c、 txt 2决不是一个有效的解决方案，但如果您只是想快速编写脚本，它可以：

find . -exec basename {} \; | sort | uniq -c | sort

说明：

查找当前目录中的所有文件，并打印其基本名称（仅文件名，删除父目录）。要更改搜索的根目录，请指定路径，而不是

按字母顺序对列表排序（这是下一步工作所必需的）

计数每个项目（-c
uniq的标志
统计每个事件）

按升序排列要查看的列表

在我的系统中，这给出了

... removed some output for clarity ... 2 CMakeLists.txt 2 heads 2 hello 2 info 2 origin 2 refs 2 remotes 2 test 2 test.cpp 4 .gitignore 4 HEAD 4 master 5 Makefile

我认为文件夹中不可能有相同的文件名。你是说
a/a/a.txt
，
a/b/a.txt
，…？我做错了…更正了…谢谢你的帮助。

[shell]相关文章推荐

Shell 多行Grep正则表达式 shell grep

Shell 看看今天是不是某个特定的日期 shell

替换文件名的字符串并在同一shell脚本中使用它 shell

使用Shell脚本将分隔文本文件导出到Excel文件 shell unix

Bourne Shell-从文件读取和打印选项卡 shell tabs

Shell 执行命令并测试其退出状态的Unix实用程序 shell unix ocaml automated-tests

Shell 使用多行文件连接和打印uniq记录 shell

Shell 将多行堆栈合并为一行 shell

在Finder中选择的文件上执行shell命令 shell terminal applescript

Shell 自动运行一系列unix和jmp脚本 shell unix

Shell 为什么一个bteq脚本有效，而另一个却无效 shell unix

Shell sudowhoami vs sudoecho`whoami` shell ubuntu scripting

Shell 用于输出其名称的可执行awk脚本 shell awk

在Jenkins管道shell中运行嵌套命令 shell jenkins

Shell 使用awk和for循环替换文件名 shell for-loop awk

在radare2中插入文件作为用户输入（VS shell&VS gdb）（linux） shell debugging gdb

能否从Shell脚本触发SSRS报告？ shell reporting-services scripting

如何从shell脚本设置环境变量 shell

Shell 根据搜索条件复制行 shell awk

Shell 如何使用zsh glob expansion多次运行同一命令？ shell zsh

随机文章推荐

Pandas 是否从现有数据框列创建新的数据框列？ pandas

Pandas 数据帧行删除 pandas

Pandas 如何根据不同的条件分组和计数？ pandas

Pandas 熊猫未熔化数据集 pandas

Pandas 如何在连接两个字符串列时避免使用指数表示法 pandas

Pandas 熊猫：如何显示列的最大差异？ pandas

Pandas 在Jupyter中编写SQL查询的最佳实践 pandas jupyter-notebook

Pandas 熊猫：从截止级别中选择最后四个日期 pandas date datetime

Pandas 熊猫-使用pivot_表将1列中的每个唯一元素转换为唯一列 pandas

Pandas 用此列中已存在的另一个值填充nan值 pandas

Pandas 如何在熊猫中通过匹配数据帧中的字符串来使用索引 pandas indexing mapping

Pandas 如何将该函数应用于tweets数据帧？ pandas dataframe

Pandas 创建多索引数据帧时如何合并常用索引 pandas dataframe

Pandas 如何从数据框中删除“库存日期”列 pandas

pandas-合并并唯一重命名具有相同列名的两个数据帧的列 pandas dataframe merge

Pandas 熊猫'&燃气轮机'；在'；str'；和'；int'； pandas

Pandas Seaborn：注释热图上缺少的值 pandas matplotlib

Pandas 尝试使用Panda Dataframe保存Ipyleaflet映射时，我得到的对象列不可序列化错误 pandas pyspark jupyter-notebook

Pandas 熊猫：通过排序将csv数据输出到嵌套的json pandas csv

使用pandas从字符串中删除所有字母数字单词 pandas dataframe

[bash]相关推荐

在bash中，在一个文件中进行多个替换的最紧凑或最有效的方法是什么
Bash Sed

Bash:“我不知道；xargs cat“类”；，在每个文件后添加换行符
Bash

Bash awk-将负数转换为正数，反之亦然
Bash Sed Awk

Bash 通过shell脚本进行串口控制
Bash Serial Port

Bash 为什么ls-1 | xargs-I{}echo-n{}{}{}{}没有按正确的顺序打印？
Bash Printing

Bash 如何以编程方式将XYZUpperCamelCase文件重命名为xyzLowerCamelCase？
Bash

Bash 应用程序总是给出-1708
Bash Applescript

Bash 如果从另一个shell脚本运行构建脚本，如何并行打印构建日志
Bash Shell Unix Scripting

Bash 使用awk或sed重新格式化文本文件
Bash Awk Sed

bash函数中转义字符的保留
Bash

使用bash flickr api、方法flickr.auth.getToken的签名无效
Bash

bash-展开包含环境变量引用的字符串
Bash Shell Unix

Bash 如何在使用sed的特定单词之后替换文本？
Bash Shell Sed

bash分割csv文件并输出相同的扩展名，并删除最后一行空行
Bash Csv Unix

Bash 按数字顺序处理文件
Bash Shell

Bash布尔变量检查显示未找到命令
Bash Macos Shell

如何在bash脚本中使用getopts？
Bash

Bash 计算所有.c和.h文件中的行总和
Bash Shell

BASH-使用选择菜单导航目录
Bash

在Bash变量赋值的右侧引用时，波浪线未展开
Bash

Bash 使用grep从列表中删除两个值的所有匹配项
Bash Awk Sed Grep

对每行中的所有数字求和，并将它们的平均值添加到行末尾Bash
Bash

Bash 一列到某个计数的总和
Bash Shell Unix Scripting

bash脚本循环检查变量是否包含字符串-不工作
Bash Loops

Bash 当用户与ssh断开连接时如何运行脚本
Bash Ssh

如何为命令“创建bash别名”；cd~1“；
Bash

为什么OSX Catalina上带有bash的终端会有额外的代码行？
Bash Macos

Bash 如何使用sed删除非英语语言的非字母数字字符？
Bash Sed

使bash脚本打印集-x输出为粗体，但输出为普通文本
Bash

Bash 在命令行中为批处理脚本添加参数
Bash Shell

Tags

Validation Pointers Windows Installer Ip Csv Cobol Webview Common Lisp Parsing Docusignapi Amazon Cloudformation Computer Science Firefox Javascript Computer Vision Gstreamer Next.js Single Sign On For Loop Matrix Kentico Triggers Kdb Redux Swagger Virtualbox Twitter Bootstrap 3 Exception Handling Requirejs Nosql Map Migration Sqlalchemy Google Maps Protocol Buffers Activerecord Doctrine Orm Hbase Enums Jquery Odoo Build Dataframe Applescript Gradle Java Matlab Rxjs Sql Server 2005 Openlayers Acumatica Windows 7 Objective C System Verilog Amp Html Windows C# 4.0 Spring Mvc File Io Oracle11g Terminal Instagram Video Uiview Ruby On Rails 3.1 Crystal Reports Drools Text Dialogflow Es Phantomjs Magento2 Nest Glassfish Google App Maker Linux Iframe Nativescript .net Formatting Cygwin Amazon Redshift Seo Apache Zookeeper Configuration Mqtt Scheme Gremlin Go Datetime Javafx Sencha Touch Microsoft Graph Api Wpf Grep Angularjs Tinymce Laravel 4 Twilio Clojure Google Chrome Extension Exception Firefox Addon Centos Blockchain Aws Lambda Lucene Jekyll Virtual Machine Twig Flask Swing Sublimetext3 Logic Jboss Geometry Xpages Llvm Vb.net Dask Tree Actionscript Primefaces Shopify Inno Setup Timer Jvm Stm32 Windows 8 Backbone.js Phpmyadmin Unit Testing Silverlight Synchronization E Commerce Visual Studio Code Encoding Notifications Sql Server 2012 Rust Azure Ad B2c Wicket Interface Elixir Hibernate Video Streaming Mod Rewrite Inheritance Asp.net Web Api Plugins Asp.net Mvc 2 Windows Services Combobox Salesforce Vbscript Linkedin Ravendb Routing Android Emulator Tags Ms Access Delphi Vim Browser Biztalk Input Ldap Lisp Ada Optimization Ms Word Pdf Angular Material Apache Nifi Iis Parse Platform Airflow Kendo Ui Orm Rss Opencl Google Analytics Azure Active Directory Puppet Gitlab Coding Style Webgl Graphics Nuget Mariadb Paypal Logstash Plsql Post Jestjs Autohotkey Stream Pycharm Ajax Charts Dynamic .net Core

Copyright © 2024. All Rights Reserved by - Fatal编程技术网