Text 如何删除第一个&;最后的角色。。。但只是数字

Text 如何删除第一个&;最后的角色。。。但只是数字,text,Text,我有10000个文本站点,基本上是字幕文本。。。我想删除每一行的最后5个数字和前2个数字,而不触摸/更改文本 以下是一个例子: 18:00:03:13:05 00:03:16:1703:12Moi,j'aurais misçaála même auteur queça 19:00:03:18:02 00:03:21:0503:03 20:00:03:23:15 00:03:26:0702:17啊,辛苦了 粗体数字应该删除。有很多方法可以实现这一点 将字符串拆分为子字符串,然后连接所需的子字符串

我有10000个文本站点,基本上是字幕文本。。。我想删除每一行的最后5个数字前2个数字,而不触摸/更改文本

以下是一个例子:

18:00:03:13:05 00:03:16:1703:12Moi,j'aurais misçaála même auteur queça

19:00:03:18:02 00:03:21:0503:03

20:00:03:23:15 00:03:26:0702:17啊,辛苦了


粗体数字应该删除。

有很多方法可以实现这一点

  • 将字符串拆分为子字符串,然后连接所需的子字符串
  • 用于从文本中提取回指的正则表达式
  • 由于您的数据看起来非常规范化,并且基本上是以空格分隔的,因此您可以基于空格对字符串进行标记化,然后将第二个、第三个和“rest”放回一起,扔掉第一个和第四个标记

    您没有说您想要使用什么工具或语言,但在Java中您可以使用


    对于Vim,类似于
    :0,$s/\d\+://
    的东西应该删除第一部分。类似于
    :0,$s/\d\d:\d\d/
    的模式应该删除第二部分。

    假设文件中的所有行都相同,并且您有一个固定宽度的文件,在类UNIX系统(UNIX、Linux、Mac、FreeBSD)上,您可以尝试

    cut -b 1-4,28-33 --complement INPUTFILENAME > OUTPUTFILENAME
    
    如果没有,您应该能够通过以下两个步骤完成此操作:

    cut -d : -f 1 --complement INPUTFILENAME > OUTPUTFILENAME
    cut -b 24-29 --complement OUTPUTFILENAME > OUTPUTFILENAME
    

    第二个解决方案的第一步删除第一个数字标识符字段,而不考虑其长度。第二步改变了应该是类似宽度的行(对于感兴趣的列)。

    谢谢jdv实际上我正在寻找一个简单的脚本解决方案,在World中使用“查找和替换”或类似的简单方法……如果你是指“Word”,我不知道,但大多数文本编辑器都允许您根据Aseem Raj Baranwal的评论构建模式。如果您的本地计算机上存在文本,那么您可以使用优秀的文本编辑器(如sublime或vim)打开它,然后使用适当的正则表达式进行查找和替换。很棒的Aseem ray Baranwal。我将用崇高来尝试。您知道要实现的“适当”表达式吗?请参见此处:我的示例与Sublime文档相结合,应该可以让您开始学习。我假设会有类似“100:…”的行,因此字段位置将不再匹配。@jdv很好。这使得它更加复杂,除非它是一个固定宽度的文件,而它可能不是。一个可能的解决办法是分两步进行,正如我在编辑后的答案中所示。