apachetika:MSG删除结果字符串中的额外换行符
我有一个带有正文的msg文件:apachetika:MSG删除结果字符串中的额外换行符,apache,apache-tika,Apache,Apache Tika,我有一个带有正文的msg文件: <html><head></head><body><div style="font-family: Verdana;font-size: 12.0px;"> <div>Test message.</div> <div> </div> <div>More content here...</div> <div>
<html><head></head><body><div style="font-family: Verdana;font-size: 12.0px;">
<div>Test message.</div>
<div> </div>
<div>More content here...</div>
<div> </div>
<div>Best regards,</div>
<div>Mr. Crowley</div></div></body></html>
…除额外换行符外,一切正常:
Test message.
More content here...
Best regards,
Mr. Crowley
<and 3 empty lines here>
测试消息。
更多内容在这里。。。
顺致敬意,
克劳利先生
有可能避免这种行为吗?是否有可能获得更多的预期结果
帮我修一下
Test message.
More content here...
Best regards,
Mr. Crowley
<and 3 empty lines here>