Awk 我需要从斯洛伐克语文本文件中删除单词

Awk 我需要从斯洛伐克语文本文件中删除单词,awk,words,Awk,Words,我有斯洛伐克语的文本文件: SLOVESÁ Sloveso, infinitív, obojvidové, afirmácia: abandonovať /VIj+ Sloveso, infinitív, obojvidové, negácia: abandonovať, neabandonovať /VIj- Sloveso, prézent, obojvidové, singulár, 1. osoba, všeobecný rod, afirmácia: abandonovať, aban

我有斯洛伐克语的文本文件:

SLOVESÁ
Sloveso, infinitív, obojvidové, afirmácia: abandonovať /VIj+
Sloveso, infinitív, obojvidové, negácia: abandonovať, neabandonovať /VIj-
Sloveso, prézent, obojvidové, singulár, 1. osoba, všeobecný rod, afirmácia: abandonovať, abandonujem /VKjsah+
Sloveso, prézent, obojvidové, singulár, 2. osoba, všeobecný rod, afirmácia: abandonovať, abandonuješ /VKjsbh+
Sloveso, prézent, obojvidové, singulár, 3. osoba, mužský rod, afirmácia: abandonovať, abandonuje /VKjscm+
我需要删除每行中的所有单词,直到“:”,然后删除“/”之后的所有单词(包括“:”、“/”和所有第一行)。
有人能帮我吗?我最适合用什么?AWK?

如果您有GNU grep,您可以:

$ grep -oP "(?<=: ).*(?= /)" inputfile
abandonovať
abandonovať, neabandonovať
abandonovať, abandonujem
abandonovať, abandonuješ
abandonovať, abandonuje

$grep-oP”(?如果你有GNU grep,你可以做:

$ grep -oP "(?<=: ).*(?= /)" inputfile
abandonovať
abandonovať, neabandonovať
abandonovať, abandonujem
abandonovať, abandonuješ
abandonovať, abandonuje

$grep-oP”(?很有效,谢谢。我还有一个小问题。如果我输入命令grep-oP”(?不应该在一行中(这里不适合我)。你使用Windows检查文件吗?是的,我使用Windows。cmd中的输出与你的帖子中的一样,但是如果我使用“>outputfile”输入命令“最后,in-outputfile是一行中的所有内容。那么您的输出文件可能是Unix格式的,具有不同的行分隔符。Do
unix2dos outputfile
,您将拥有一个具有正确行分隔符的文件。它可以工作,谢谢。我还有一个小问题。如果我输入命令grep-oP”(?不应该在一行中(这里不是给我的)。你在用Windows检查文件吗?是的,我在用Windows。cmd中的输出与你的帖子中的一样,但如果我用“>outputfile”输入命令“最后,in outputfile是一行中的所有内容。那么您的输出文件可能是Unix格式,具有不同的行分隔符。执行
unix2dos outputfile
,您将拥有一个具有正确行分隔符的文件。