Arrays 批处理脚本，逐行读取选项卡分隔的文本文件，并将一列提取到新文件中_Arrays_Regex_Batch File_Sed_Substring

Arrays 批处理脚本，逐行读取选项卡分隔的文本文件，并将一列提取到新文件中

arrays regex batch-file sed

Arrays 批处理脚本，逐行读取选项卡分隔的文本文件，并将一列提取到新文件中,arrays,regex,batch-file,sed,substring,Arrays,Regex,Batch File,Sed,Substring,我有从iTunes播放列表导出的文本文件，这些列表是选项卡分隔的数组。它们有27列，但为了简单起见，我只在示例中包括四列： Name Artist My Rating Location Pod1 Show1 0 E:\Podcasts\Show1\Episode99.m4a Pod2 Show2 100 E:\Podcasts\Show2\Show2 Ep 101 - Subtitle.mp3 Pod3 Show2 6

我有从iTunes播放列表导出的文本文件，这些列表是选项卡分隔的数组。它们有27列，但为了简单起见，我只在示例中包括四列：

Name    Artist  My Rating   Location
Pod1    Show1   0           E:\Podcasts\Show1\Episode99.m4a
Pod2    Show2   100         E:\Podcasts\Show2\Show2 Ep 101 - Subtitle.mp3
Pod3    Show2   60          E:\Podcasts\Show2\News 11-17-2014.aicc

等等。我只需要提取位置（始终是最后一列）并将其放置在新的文本文件中，使其看起来像这样：

E:\Podcasts\Show1\Episode99.m4a
E:\Podcasts\Show2\Show2 Ep 101 - Subtitle.mp3
E:\Podcasts\Show2\News 11-17-2014.aicc

以下是我迄今为止为实现这一目标而编写的代码：

@ECHO OFF

type Podcasts.txt | findstr /v Grouping > Podcasts1.txt
del Podcasts.txt
rename Podcasts1.txt Podcasts.txt

虽然我找到了一些关于修改单行和逐行阅读文本文件的单独教程，但我甚至很难按照自己喜欢的方式修改单行，更不用说合并这两个原则了。我想这可能是一个非常快速的答案，我只是没有进行正确的搜索

我发现可以使用以下正则表达式在Notepad++中获得我想要的结果：

Find: .+(E\:)
Replace: \1

因此，在批处理脚本中逐行执行该操作的方法将非常有用

好处：我将生成的文件用作删除不在播放列表中的文件的白名单。如果你有一个链接或者可以快速编写一段代码，这会很有帮助。否则，我会想到如何计划完成这项工作，这将需要使用单个文件夹

编辑：我发现，由于某些列是空白的，因此使用以下方法：

for /f "usebackq tokens=1-26,* delims=  " %%a in ("Podcasts.txt") do (
   echo %%q >> PodcastsTest.txt
)

有时会打错方向。我需要一些东西，可以搜索两个字符“E:”并从那里开始行动，或者在查找第一个选项卡时从右向左搜索行

我刚刚创建的搜索反斜杠（当前仅显示在位置中）的快速脏方法如下所示：

for /f "usebackq tokens=1,* delims=\" %%a in ("Podcasts.txt") do (
    echo E:\%%b >> PodcastsTest.txt
)

这不是一个安全的方法，因为没有任何东西可以阻止其他字段使用反斜杠，但作为一个临时解决方案，它可以工作

我发现了。也许有一种方法可以适应下面的Notepad++REGEX搜索

Find: .+(E\:)
Replace: \1

这是一个新的解决方案，基于源数据的限制和问题中添加的额外信息，以及接受使用其他工具：

call jrepl ".*(E:.*)" "$1" /i /f "Podcasts.txt" /o "Podcasts2.txt"

上面的代码使用名为

Jrepl.bat

（由dbenham编写）的本机Windows批处理脚本
jrepl.bat可从以下位置下载：
也可以在这里找到：

将其与批处理文件放在同一文件夹中，或放在系统路径上的文件夹中

第二部分

然后，可以使用下面的代码生成一个文件，其中列出了当前文件夹中的所有文件，这些文件不在由上面的jrepl代码生成的文件中

您提到的是单个文件夹，所以这就是它所处理的，并且可以在使用它来检查文件之前对其进行检查

事实上，如果文件名只在文件中出现一次，则可以将其用于原始源文件。

@echo off
(
for %%a in (*.*) do (
   if /i not "%%~nxa"=="%~nx0" if /i not "%%~nxa"=="Podcasts2.txt" find /i "\%%~nxa" < "Podcasts2.txt" >nul || echo del "%%a"
)
)>delfiles.bat.txt"