NLP-垃圾数据的情感处理需要时间

NLP-垃圾数据的情感处理需要时间,nlp,stanford-nlp,sentiment-analysis,pos-tagger,Nlp,Stanford Nlp,Sentiment Analysis,Pos Tagger,我试图找到输入文本的情感。这个测试是一个垃圾句子,当我试图找到情感时,解析这个句子的注释大约需要30秒。对于普通文本,只需不到一秒钟的时间。如果我需要处理数以百万计的数据,这将增加处理时间。任何解决办法 String text = "Nm n n 4 n n bkj nun4hmnun Onn njnb hm5bn nm55m nbbh n mnrrnut but n rym4n nbn 4nn65 m nun m n nn nun 4nm 5 gm n my b bb b b rtmrt55t

我试图找到输入文本的情感。这个测试是一个垃圾句子,当我试图找到情感时,解析这个句子的注释大约需要30秒。对于普通文本,只需不到一秒钟的时间。如果我需要处理数以百万计的数据,这将增加处理时间。任何解决办法

String text = "Nm n n 4 n n bkj nun4hmnun Onn njnb hm5bn nm55m nbbh n mnrrnut but n rym4n nbn 4nn65 m nun m n nn nun 4nm 5 gm n my b bb b b rtmrt55tmmm5tttn b b bb g bn nn n h r ret n nun bn d. B bbbbbbbbbbr bung NHnhn nn nk, v v v n gain t g 4gnyhimmigration ndn nb NVnb bin uny 7 nbbbbbnn vv bbvb ninn njnj n4 nm n km n n n cb j bun. Nhfnt bn nn. N hm nn nun m bum my b mmmnbjk nn n by nn nun nun n nun nn bn n nhn n nn n n m NH nb4mnm mkn 4 n n n n hm r b rnfngg4d in b nut mmmkmmm5 bbjn n n ij BBM 8u8i by nun n.nn hm n. n4n By 4n4n bunny RN bny hm j mi. Nymmn FBT not mn n n nm g by n n nnm? Rnyb vCard n5 Yu nn n n n n nt .nm mn nt n nb n n n n by y5nnnhyyh h b b nt njj n m f4n re";
Properties props = new Properties();
            props.setProperty("annotators","tokenize, ssplit, pos,parse,sentiment");
            StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
            Annotation annotation = pipeline.process(text);
对于NLP情绪计算,我必须解析数据,我认为这就是它需要时间的原因


感谢

是的,标准PCFG解析器(默认情况下运行的解析器,没有指定任何其他选项)将阻塞这种长时间无意义的数据。您可能会更幸运地使用,它大大快于PCFG,并且几乎同样准确。

谢谢jon。我使用的是3.4.1,它不支持shift-reduce。还有其他想法吗。谢谢helpprops.setProperty(“注释器”、“标记化、ssplit、pos、解析、情感”);props.put(“parse.model”、“com/toyota/nlp/englishSR.ser.gz”);我已将解析模型更改为shift-reduce。但是它在edu.stanford.nlp.parser.shiftreduce.ShiftReduceParserQuery的线程“main”java.lang.NullPointerException中抛出空指针异常。我想问题已经解决了,因为我改成了shift-reduce,执行速度必须更快。这只会在加载文件时花费时间。我得到的错误只是因为模型版本错误。谢谢你的帮助