Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/466.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 自动从图像中提取文本_Javascript_Node.js_Amazon Web Services_Machine Learning_Text Extraction - Fatal编程技术网

Javascript 自动从图像中提取文本

Javascript 自动从图像中提取文本,javascript,node.js,amazon-web-services,machine-learning,text-extraction,Javascript,Node.js,Amazon Web Services,Machine Learning,Text Extraction,我有500个文件夹在AWS S3存储桶中。在每个文件夹中,都有2到3个图像。如何在每个图像上应用Textract,并使用node js提取完整的文本(所有文本连接)?我编写了以下代码来获取S3对象: const aws = require('aws-sdk'); const config = require('./config.js'); (async function(){ aws.config.setPromisesDependency(); try{ aws

我有500个文件夹在AWS S3存储桶中。在每个文件夹中,都有2到3个图像。如何在每个图像上应用Textract,并使用node js提取完整的文本(所有文本连接)?我编写了以下代码来获取S3对象:

const aws = require('aws-sdk');
const config = require('./config.js');
(async function(){
    aws.config.setPromisesDependency();
    try{
        aws.config.update({
            accessKeyId: config.accessKeyId,
            secretAccessKey: config.secretAccessKey,
            region: config.awsRegion
        });
        const s3 = new aws.S3();
        const response = await s3.listObjectsV2({
            Bucket : '<Bucket Name>',
            Prefix : '<Prefix>'

        }).promise();
        console.log(response);
    }
    catch(e)
    {
        console.log('our err.',e);
    }
    
})();
const aws=require('aws-sdk');
const config=require('./config.js');
(异步函数(){
aws.config.setPromisesDependence();
试一试{
aws.config.update({
accessKeyId:config.accessKeyId,
secretAccessKey:config.secretAccessKey,
地区:config.awsRegion
});
const s3=新的aws.s3();
const response=wait s3.listObjectsV2({
桶:“”,
前缀:“”
}).promise();
控制台日志(响应);
}
捕获(e)
{
console.log('our err',e);
}
})();
如何循环浏览其中的子文件夹和图像?

您可以:

  • 使用S3API列出并循环浏览所有图像,为每个图像应用文本提取
  • 使用S3清单循环浏览所有图像,并执行相同的操作

对于新文件,您可以设置Lambda函数和S3
PUT
触发器,以自动对新文件应用文本检测。

我已编辑了我的问题,以更新我所做的工作。如何前进?对每个对象使用
S3.listObjectV2
的结果,然后使用
Textract.detectDocumentText