Javascript 自动从图像中提取文本_Javascript_Node.js_Amazon Web Services_Machine Learning_Text Extraction

Javascript 自动从图像中提取文本

javascript node.js amazon-web-services machine-learning

Javascript 自动从图像中提取文本,javascript,node.js,amazon-web-services,machine-learning,text-extraction,Javascript,Node.js,Amazon Web Services,Machine Learning,Text Extraction,我有500个文件夹在AWS S3存储桶中。在每个文件夹中，都有2到3个图像。如何在每个图像上应用Textract，并使用node js提取完整的文本（所有文本连接）？我编写了以下代码来获取S3对象： const aws = require('aws-sdk'); const config = require('./config.js'); (async function(){ aws.config.setPromisesDependency(); try{ aws

我有500个文件夹在AWS S3存储桶中。在每个文件夹中，都有2到3个图像。如何在每个图像上应用Textract，并使用node js提取完整的文本（所有文本连接）？我编写了以下代码来获取S3对象：

const aws = require('aws-sdk');
const config = require('./config.js');
(async function(){
    aws.config.setPromisesDependency();
    try{
        aws.config.update({
            accessKeyId: config.accessKeyId,
            secretAccessKey: config.secretAccessKey,
            region: config.awsRegion
        });
        const s3 = new aws.S3();
        const response = await s3.listObjectsV2({
            Bucket : '<Bucket Name>',
            Prefix : '<Prefix>'

        }).promise();
        console.log(response);
    }
    catch(e)
    {
        console.log('our err.',e);
    }
    
})();

const aws=require（'aws-sdk'）；
const config=require（'./config.js'）；
（异步函数（）{
aws.config.setPromisesDependence（）；
试一试{
aws.config.update({
accessKeyId:config.accessKeyId，
secretAccessKey:config.secretAccessKey，
地区：config.awsRegion
});
const s3=新的aws.s3（）；
const response=wait s3.listObjectsV2({
桶：“”，
前缀：“”
}).promise（）；
控制台日志（响应）；
}
捕获（e）
{
console.log（'our err'，e）；
}
})();

如何循环浏览其中的子文件夹和图像？

您可以：

使用S3API列出并循环浏览所有图像，为每个图像应用文本提取
使用S3清单循环浏览所有图像，并执行相同的操作

对于新文件，您可以设置Lambda函数和S3

PUT

触发器，以自动对新文件应用文本检测。

我已编辑了我的问题，以更新我所做的工作。如何前进？对每个对象使用

S3.listObjectV2

的结果，然后使用

Textract.detectDocumentText

。