Function 在UIPath中提取PDF格式的数据

Function 在UIPath中提取PDF格式的数据,function,pdf,split,extract,uipath,Function,Pdf,Split,Extract,Uipath,我试图使用IUPath从PDF文件中提取一些特定数据 PDF格式的数据如下所示: ****hjeprj3****詹姆斯·费什****JDR0929879****jdloin2 B5339|| 我需要准确地说出“詹姆斯·菲什”的名字。 它将始终具有相同的格式,始终为****文本****姓名****文本 我将总是提取名称,这将是不同的 我使用了这个函数: PDFText.Substring(PDFText.IndexOf(“****”,0)+15,16),但由于名称始终不同,因此它不会返回正确的值

我试图使用IUPath从PDF文件中提取一些特定数据

PDF格式的数据如下所示:

****hjeprj3****詹姆斯·费什****JDR0929879****jdloin2 B5339||

我需要准确地说出“詹姆斯·菲什”的名字。 它将始终具有相同的格式,始终为****文本****姓名****文本 我将总是提取名称,这将是不同的

我使用了这个函数: PDFText.Substring(PDFText.IndexOf(“****”,0)+15,16),但由于名称始终不同,因此它不会返回正确的值

你能给点建议吗


感谢您的帮助

@O.p.-稍微调整您的答案,使其适用于任何长度的名称:

Strings.Trim(Strings.Split(PDFText.Substring(PDFText.IndexOf("**** ",0)+15,30),"*")(0))
在这里,我已经将子字符串的长度从16更改为30,我认为对于大多数名称来说,这个长度都足够长(如果需要,可以调整长度)。这应该返回“jamesfish****JDR0929879***”,或者如果我遗漏了一两个字符,则返回类似的内容

然后,使用“*”作为分隔符的Strings.Split()函数将此子字符串拆分为其他几个子字符串,其中第一个子字符串位于索引(0)处


然后,Strings.Trim()函数将删除姓氏末尾的多余空格。如果技术上愿意,您可以使用RTrim(),这里只需要这些。Trim()删除开头和结尾的空格,此处只需删除结尾处的空格,但最好小心字符串。

@O.p.-稍微调整您的答案,使其适用于任何长度的名称:

Strings.Trim(Strings.Split(PDFText.Substring(PDFText.IndexOf("**** ",0)+15,30),"*")(0))
在这里,我已经将子字符串的长度从16更改为30,我认为对于大多数名称来说,这个长度都足够长(如果需要,可以调整长度)。这应该返回“jamesfish****JDR0929879***”,或者如果我遗漏了一两个字符,则返回类似的内容

然后,使用“*”作为分隔符的Strings.Split()函数将此子字符串拆分为其他几个子字符串,其中第一个子字符串位于索引(0)处


然后,Strings.Trim()函数将删除姓氏末尾的多余空格。如果技术上愿意,您可以使用RTrim(),这里只需要这些。Trim()从开始和结束处删除空格,这里只需要从结束处删除,但最好小心字符串。

您只需要提取***和第二个1外观中的值。作为子串函数,类似这样

Substring (int startIndex, int length);
使用indexOF,您可以获取起始索引,并且可以通过执行第二个索引位置-第一个索引位置来获得长度


或者你可以使用***将其拆分成数组,并在其中获得第二个幻影。检查此链接以实现此解决方案


您只需提取***和第二个外观中的值。作为子串函数,类似这样

Substring (int startIndex, int length);
使用indexOF,您可以获取起始索引,并且可以通过执行第二个索引位置-第一个索引位置来获得长度


或者你可以使用***将其拆分成数组,并在其中获得第二个幻影。检查此链接以实现此解决方案


如果您的函数当前使用的是此名称,而不是其他名称,那么我建议将字符串变长。然后使用Strings.Split()函数用“*”字符分隔字符串,只使用索引获取第一个字符串,如“(0)”。然后,您可以使用Strings.Trim()删除名称后可能留下的任何尾随空格。如果您的函数当前使用的是此名称,而不是其他名称,那么我建议将字符串变长。然后使用Strings.Split()函数用“*”字符分隔字符串,只使用索引获取第一个字符串,如“(0)”。然后可以使用Strings.Trim()删除名称后面可能留下的任何尾随空格。您好,我试过了,但没有成功。它返回了一个完全不同的结果:“5001281960\r\n\r\n这次购买”我不明白为什么。它似乎无法识别“*”符号。糟糕,它正在工作,我写错了一个变量。非常感谢你的帮助!你好,我试过了,但没用。它返回了一个完全不同的结果:“5001281960\r\n\r\n这次购买”我不明白为什么。它似乎无法识别“*”符号。糟糕,它正在工作,我写错了一个变量。非常感谢你的帮助!