Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/gwt/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 我想从图像文件中提取文本并将其存储在excel中_Java - Fatal编程技术网

Java 我想从图像文件中提取文本并将其存储在excel中

Java 我想从图像文件中提取文本并将其存储在excel中,java,Java,保龄球O M R W经济0 S 45 6 WD NB始终以击球手身份失去德奥尼 对我们来说很难-雷娜 塔布尔40 3 0 925米2 3 1 0钦奈超级国王队击球手 在淡季和冬季之后形成 杰特德6 0=4 0 0赞扬了多尼在折痕处的支持 奇莫里斯40 4 NSO9 8 1对德里首都 阿尔·帕特尔3 o 3 1 1033 6 3 2 o“看球,击球”——多尼的 期末考试的公式 CSK队长在比赛中打出了554分 在IPL的第20圈中,e PR el 227个球 匹配。这是他所有跑步记录的13% 我参

保龄球O M R W经济0 S 45 6 WD NB始终以击球手身份失去德奥尼 对我们来说很难-雷娜 塔布尔40 3 0 925米2 3 1 0钦奈超级国王队击球手 在淡季和冬季之后形成 杰特德6 0=4 0 0赞扬了多尼在折痕处的支持 奇莫里斯40 4 NSO9 8 1对德里首都 阿尔·帕特尔3 o 3 1 1033 6 3 2 o“看球,击球”——多尼的 期末考试的公式 CSK队长在比赛中打出了554分 在IPL的第20圈中,e PR el 227个球 匹配。这是他所有跑步记录的13% 我参加了这次比赛 德里首都投球局目标:从20个过投点中获得180分-德奥尼是巴别林吗-

这是我的绳子
我想在excel中使用

基于对您想做什么的稀疏描述,我建议:

从图像中读取文本 用冒号替换所有空格 字符串csvContent=imgData.replaceAll,;; 将文本保存到csv文件 用excel打开csv文件 以下示例假定您已成功检索数据,然后对其进行后处理以提供csv格式。内容将写入一个文件,您只需双击该文件即可查看数据是否按要求拆分为列

字符串[]数据=新字符串[]{ BOWLING O M R W ECON 0s 45 6,//请注意,您的OCR软件无法正确识别此处的字符串 塔布尔4 0 3 0 925 M 2 3, 喷射6 0=4 0 0 0 }; BufferedWriter writer=new BufferedWriter new FileWriter System.getProperty user.home+System.getProperty file.separator+data.csv; 对于字符串记录:数据{ writer.write record.replaceAll; writer.write\n; } writer.close;
正如我在上面的评论中所说,您的OCR无法正常工作。我建议您查看JSOUP html解析器以获取信息并从中继续。否则您将不会对结果感到满意。

驱动程序。gethttps://www.espncricinfo.com/series/8048/scorecard/1178425/chennai-super-kings-vs-delhi-capitals-50th-match-indian-英超联赛-2019; WebElement=driver.findElementBy.xpath//article[@class='sub-module scorecard'][1]; JavascriptExecutor js=JavascriptExecutor驱动程序; js.executeScriptarguments[0]。scrollIntoViewtrue;,元素

    File screen = ((TakesScreenshot)driver).getScreenshotAs(OutputType.FILE);
   File file = new File("C:\\Users\\user\\Desktop\\screenshot1\\screenshotOfElement2.png");
    FileHandler.copy(screen, file);
    
    ITesseract instance = new Tesseract();
    instance.setDatapath("C:\\selenium_work\\ScrapingText.PDF\\tessdata");
    String result = instance.doOCR(file);
    //System.out.println(result);
    String[] lines  = result.split("\\n");
    this one what am trying

也许你首先要告诉我们你想要达到什么目的。保龄球经济,每个单词都在一个单元格中,然后在下一行Taboult 4 0 3 0 925 m2 3 10plz@Arnnuem plz帮助。我不知道怎么做这是@etishree如何将这些行输入excel的。这是一个符合问题的答案。你能把代码发给我吗@arnon因为我想要保龄球,所以每一个单词都应该出现在每一个专栏中。你能到这个链接看看我想要的金奈超级保龄球台吗?我可以给你代码,但你必须先提供代码,检索你在问题中发布的信息。但是@arnnuem你给了什么字符串[]数据是我们手动写入的。我们如何从该字符串中获取该数据