Java mssql处理行返回相当笨拙

Java mssql处理行返回相当笨拙,java,python,sql-server,formatting,jython,Java,Python,Sql Server,Formatting,Jython,问题是: 供参考: 数据库条目1、2和3是使用jython 2.2.1和jdbc1.2创建的。 数据库条目4是使用vb制作的,旧的替换程序使用odbc 我们发现,如果我直接从SQL Server Enterprise Manager软件将jython和vb邮件体条目复制并粘贴到写字板上,它会以正确的行返回完美地输出格式。如果我将每个文件的字节与十六进制编辑器或KDiff3进行比较,它们的二进制相同 有一个使用此数据的第三方程序。遗憾的是,第三方程序读取数据,对于条目1到条目3,它显示数据而不返

问题是:

供参考:

数据库条目1、2和3是使用jython 2.2.1和jdbc1.2创建的。 数据库条目4是使用vb制作的,旧的替换程序使用odbc

我们发现,如果我直接从SQL Server Enterprise Manager软件将jython和vb邮件体条目复制并粘贴到写字板上,它会以正确的行返回完美地输出格式。如果我将每个文件的字节与十六进制编辑器或KDiff3进行比较,它们的二进制相同

有一个使用此数据的第三方程序。遗憾的是,第三方程序读取数据,对于条目1到条目3,它显示数据而不返回行。尽管对于条目4,它正确设置了文本格式。进一步证明,我们可以在图中看到,数据库中的数据显示方式不同。 不知何故,vb条目的行返回被保存在数据库中,而jython条目则被忽略。如果我点击条目4的“邮件正文”字段,我可以按下,我可以看到邮件的其余部分。而jython的数据显示在一行中

什么给了我,我错过了什么,我该如何处理? 下面是一段代码片段,我将其发送到数据库

编辑:仅供参考:请忽略“已处理”列中的差异,这是无关的。 编辑:我想做的是让jython程序以与vb程序相同的方式输入数据。这样第三方程序就会出现并正确显示数据。 所以它看起来像是‘MailBody’中的每个条目都会显示“这只是一个测试!”然后下一行是“等等”,所以如果我要做一个屏幕转储,所有条目都会类似于数据库条目4

解决

在混合物中加入_force_CRLF:

def _force_CRLF(self, data):
    '''Make sure data uses CRLF for line termination.
    Nicked the regex from smtplib.quotedata. '''
    print data
    newdata = re.sub(r'(?:\r\n|\n|\r(?!\n))', "\r\n", data)
    print newdata
    return newdata

def _execute_insert(self):
    try:
        self._stmt=self._con.prepareStatement(\
            "INSERT INTO EmailHdr (EntryID, MailSubject, MailFrom, MailTo, MailReceive, MailSent, AttachNo, MailBody)\
             VALUES (?, ?, ?, ?, ?, ?, ?, cast(? as varchar (" + str(BODY_FIELD_DATABASE) + ")))")
        self._stmt.setString(1,self._emailEntryId)
        self._stmt.setString(2,self._subject)
        self._stmt.setString(3,self._fromWho)
        self._stmt.setString(4,self._toWho)
        self._stmt.setString(5,self._format_date(self._emailRecv))
        self._stmt.setString(6,self._format_date(self._emailSent))
        self._stmt.setString(7,str(self._attachmentCount))
        self._stmt.setString(8,self._force_CRLF(self._format_email_body()))
        self._stmt.execute()
        self._prepare_inserting_attachment_data()
        self._insert_attachment_data()
    except:
        raise

def _format_email_body(self):
    if not self._emailBody:
        return "could not extract email body"
    if len(self._emailBody) > BODY_TRUNCATE_LENGTH:
        return self._clean_body(self._emailBody[:BODY_TRUNCATE_LENGTH])
    else:
        return self._clean_body(self._emailBody)

def _clean_body(self,dirty):
    '''this method simply deletes any occurrence of an '=20' that plagues my output after much testing this is not related to the line return issue, even if i comment it out I still have the problem.''' 
    dirty=str(dirty)
    dirty=dirty.replace(r"=20","")
    return r"%s"%dirty

我建议在程序中添加调试输出,在插入DB之前转储字符代码。Jython很可能会用单个字符替换CrLf对,并且在写入DB时不会将其还原。

您应该查看quopri模块(以及其他有关电子邮件的模块),这样您就不必使用肮脏的技巧,因为当我输出调试信息时,有正确的格式。请注意,任何连接?似乎答案正确,投票被禁用!!无论如何,让我更新我所做的调试信息。请不要添加“编辑已解决”。将您的解决方案作为答案发布或关闭问题。编辑是令人困惑的。