Notepad++ 为什么这个代码不';在记事本+中无法正常工作+;
3天前,一位朋友给了我一个代码,可以保存一些句子,删除记事本++中不需要的其他句子。今天,我的老师告诉我,这个代码并不适用于所有的句子,它可以清除我们需要的大部分标记。请帮助我更正此代码。 请出示我明天的语料库对我来说很重要 我想在文本中找到一些特殊字符串,然后删除其他字符串 例如,在这句话中:Notepad++ 为什么这个代码不';在记事本+中无法正常工作+;,notepad++,Notepad++,3天前,一位朋友给了我一个代码,可以保存一些句子,删除记事本++中不需要的其他句子。今天,我的老师告诉我,这个代码并不适用于所有的句子,它可以清除我们需要的大部分标记。请帮助我更正此代码。 请出示我明天的语料库对我来说很重要 我想在文本中找到一些特殊字符串,然后删除其他字符串 例如,在这句话中: ( (IP-MAT (CONJ vnnd) (NP-NOM (D das) (N wort)) (BED war) (PP (P bey) (CO
( (IP-MAT (CONJ vnnd)
(NP-NOM (D das) (N wort))
(BED war)
(PP (P bey)
(CODE [2])
(NP-DAT (NPR Gott)))
(. ,))
我想定期保持:CONJ D N BED p NPR
。
并删除此文本中的其他字符串
第二个例子:
( (IP-MAT-SPE (NP-NOM-LFD (D diser) (NPR Jhesus)
(, ,)
(CP-REL-SPE (WNP-1 (WPRO wilcher)) (C 0)
(IP-SUB-SPE (NP-NOM T-1) (PP (P von) (NP-DAT (PRO euch))) (BEPI ist) (RP auff) (VAN genomen) (PP (P gen)
(NP-ACC-XXX (NPR hymel))))))
(, ,)
(NP-NOM-RSP (D der)) (RDPI wirt) (VB komen)
(PP (P wie) (CP-ADV-SPE (C 0) (IP-SUB-SPE (NP-NOM (PRO yhr)) (NP-ACC-2 (PRO yhn)) (VBN gesehen) (HVPI habt)
(IP-INF-SPE (NP-ACC-SBJ ICH-2) (PP (P gen)
(NP-ACC-XXX (NPR hymel))) (VB faren)))))
(. .))
我想把它们改成这样:
D NPR , WPRO C NP-NOM P PRO BEPI RP VAN P NPR , D RDPI VB , P C PRO PRO VBN HVPI NP-ACC-SBJ P NPR VB . –
代码是:
查找:
[美元,然后是“1”,然后是空格]
但它不适用于以下句子:
(IP-MAT (CODE [4])
(CONJ vnd)
(NP-NOM *con*)
(RDD wurden)
(Q alle)
(ADJP (ADJ voll)
(NP-GEN (D des)
(ADJ heyligen)
(NPR geysts)))
(. ,)) (ID SEPTEMBERTESTAMENT-ACTS,.45))
( (IP-MAT (CODE [7])
(NP-NOM (PRO sie))
(VBD entsatzten)
(NP-ACC-RFL (PRO sich))
(ADVP (ADV aber))
(Q alle)
(. ,)
(IP-MAT (NP-NOM *con*)
(VBD verwunderten)
(NP-ACC-RFL (PRO sich)))
(IP-MAT (CONJ vnnd)
(NP-NOM *con*)
(VBD sprachen)
(PP (P+D+ADJ vnternander))
(, ,)
(IP-MAT-SPE (CODE [8])
(CP-QUE-SPE (WADVP (WADV wie))
(IP-SUB-SPE (VBPI horen)
(NP-NOM (PRO wyr)
(NP-NOM-PRN *ICH*-1))
(ADVP (ADV denn))
(, ,)
(NP-NOM-PRN-1 (D eyn) (ADJ iglicher))
(NP-ACC (PRO$ seyne) (N sprach)
(, ,)
(CP-REL-SPE (WPP-2 (WADV $dar) (P $ynnen))
(C 0)
(IP-SUB-SPE (PP *T*-2)
(CODE {TEXT:darynnen})
(NP-NOM (PRO wyr))
(VAN geporn)
(BEPI sind))))))
(. ?)) (ID SEPTEMBERTESTAMENT-ACTS,.52))
必须显示:CONJ NP-NOM RDD Q ADJP D ADJ D ADJ NPR
或不在此代码中工作:
(IP-MAT (CODE [4])
(CONJ vnd)
(NP-NOM *con*)
(RDD wurden)
(Q alle)
(ADJP (ADJ voll)
(NP-GEN (D des)
(ADJ heyligen)
(NPR geysts)))
(. ,)) (ID SEPTEMBERTESTAMENT-ACTS,.45))
( (IP-MAT (CODE [7])
(NP-NOM (PRO sie))
(VBD entsatzten)
(NP-ACC-RFL (PRO sich))
(ADVP (ADV aber))
(Q alle)
(. ,)
(IP-MAT (NP-NOM *con*)
(VBD verwunderten)
(NP-ACC-RFL (PRO sich)))
(IP-MAT (CONJ vnnd)
(NP-NOM *con*)
(VBD sprachen)
(PP (P+D+ADJ vnternander))
(, ,)
(IP-MAT-SPE (CODE [8])
(CP-QUE-SPE (WADVP (WADV wie))
(IP-SUB-SPE (VBPI horen)
(NP-NOM (PRO wyr)
(NP-NOM-PRN *ICH*-1))
(ADVP (ADV denn))
(, ,)
(NP-NOM-PRN-1 (D eyn) (ADJ iglicher))
(NP-ACC (PRO$ seyne) (N sprach)
(, ,)
(CP-REL-SPE (WPP-2 (WADV $dar) (P $ynnen))
(C 0)
(IP-SUB-SPE (PP *T*-2)
(CODE {TEXT:darynnen})
(NP-NOM (PRO wyr))
(VAN geporn)
(BEPI sind))))))
(. ?)) (ID SEPTEMBERTESTAMENT-ACTS,.52))
必须显示:NP-NOM VBD PRO ADV Q。
NP-NOM VBD PRO CONJ NP-NOM VBD P+D+ADJ
或关于此示例:
(IP-MAT (CODE [4])
(CONJ vnd)
(NP-NOM *con*)
(RDD wurden)
(Q alle)
(ADJP (ADJ voll)
(NP-GEN (D des)
(ADJ heyligen)
(NPR geysts)))
(. ,)) (ID SEPTEMBERTESTAMENT-ACTS,.45))
( (IP-MAT (CODE [7])
(NP-NOM (PRO sie))
(VBD entsatzten)
(NP-ACC-RFL (PRO sich))
(ADVP (ADV aber))
(Q alle)
(. ,)
(IP-MAT (NP-NOM *con*)
(VBD verwunderten)
(NP-ACC-RFL (PRO sich)))
(IP-MAT (CONJ vnnd)
(NP-NOM *con*)
(VBD sprachen)
(PP (P+D+ADJ vnternander))
(, ,)
(IP-MAT-SPE (CODE [8])
(CP-QUE-SPE (WADVP (WADV wie))
(IP-SUB-SPE (VBPI horen)
(NP-NOM (PRO wyr)
(NP-NOM-PRN *ICH*-1))
(ADVP (ADV denn))
(, ,)
(NP-NOM-PRN-1 (D eyn) (ADJ iglicher))
(NP-ACC (PRO$ seyne) (N sprach)
(, ,)
(CP-REL-SPE (WPP-2 (WADV $dar) (P $ynnen))
(C 0)
(IP-SUB-SPE (PP *T*-2)
(CODE {TEXT:darynnen})
(NP-NOM (PRO wyr))
(VAN geporn)
(BEPI sind))))))
(. ?)) (ID SEPTEMBERTESTAMENT-ACTS,.52))
必须显示:WADV VBPI PRO NP-NOM-PRN ADV,D ADJ POR$N,WADV p C PP PRO VAN BEPI
该代码不幸地删除了PRO$或NP-NOM或PP或Q+N等
对不起,我不能编辑这篇文章。我希望我的代码将出现在所有人面前。
如果没有,我可以上传语料库文本文件。好吧,使用前面的正则表达式:
(?:(?!\n\n).(?<!\n\n))*?\(([\w,.-]+)\s+[\w,.-]+\)+|(?:(?!\n\n).(?<!\n\n))+$
我添加了更多的字符,但我认为有些事情是不规则的,或者你可能有一些打字错误,比如ID
,你在问题中没有提到
还记得上次我链接到你的regex演示站点吗?对于这些样品。你可以玩玩它;请注意,更换后,蓝色部分将被删除,而绿色部分将保留。@nixda请帮助我。没有人帮我吗??:((哦..我真不敢相信这个世界上没有人能帮助我不因为这个代码而丢掉工作。请帮助我,这非常重要,因为meThis更适合StackOverflow。不要重新发布,因为这可能很快就会被迁移,@Dave M what?我现在什么都不知道,因为压力太大了!)((可能是@user259288的副本希望下次你不用等太久,我告诉过你如何根据需要修改表达式,但正如前面提到的,它可能不适用于所有情况,因为模式中似乎存在一些古怪的异常。我想,如果没有太多异常,你可以手动处理。Jerry非常非常非常谢谢你的回答。你相信我现在哭是因为这个答案吗?!!看起来是正确的。谢谢。我现在再检查一遍。但我认为它是正确的。再次感谢你,我的朋友。手动工作太难了,浪费时间。我工作了5个小时,但我只能分出500个句子!!!我的程序有120000个句子。但是这个code将帮助我。如果它不起作用,我可以很容易地手动检查。谢谢。我永远不会忘记一位帮助我的未知朋友。@user259288有趣的是,在我改为“Jerry”xP之前,我在许多网站甚至在这里使用了“unknown”作为我用户名的一部分