apachetika:MSG删除结果字符串中的额外换行符

apachetika:MSG删除结果字符串中的额外换行符,apache,apache-tika,Apache,Apache Tika,我有一个带有正文的msg文件: <html><head></head><body><div style="font-family: Verdana;font-size: 12.0px;"> <div>Test message.</div> <div>&nbsp;</div> <div>More content here...</div> <div>

我有一个带有正文的msg文件:

<html><head></head><body><div style="font-family: Verdana;font-size: 12.0px;">
<div>Test message.</div>
<div>&nbsp;</div>
<div>More content here...</div>
<div>&nbsp;</div>
<div>Best regards,</div>
<div>Mr. Crowley</div></div></body></html>
…除额外换行符外,一切正常:

Test message.



More content here...



Best regards,

Mr. Crowley
<and 3 empty lines here>
测试消息。
更多内容在这里。。。
顺致敬意,
克劳利先生
有可能避免这种行为吗?是否有可能获得更多的预期结果

帮我修一下

Test message.



More content here...



Best regards,

Mr. Crowley
<and 3 empty lines here>