Javascript 自动从图像中提取文本
我有500个文件夹在AWS S3存储桶中。在每个文件夹中,都有2到3个图像。如何在每个图像上应用Textract,并使用node js提取完整的文本(所有文本连接)?我编写了以下代码来获取S3对象:Javascript 自动从图像中提取文本,javascript,node.js,amazon-web-services,machine-learning,text-extraction,Javascript,Node.js,Amazon Web Services,Machine Learning,Text Extraction,我有500个文件夹在AWS S3存储桶中。在每个文件夹中,都有2到3个图像。如何在每个图像上应用Textract,并使用node js提取完整的文本(所有文本连接)?我编写了以下代码来获取S3对象: const aws = require('aws-sdk'); const config = require('./config.js'); (async function(){ aws.config.setPromisesDependency(); try{ aws
const aws = require('aws-sdk');
const config = require('./config.js');
(async function(){
aws.config.setPromisesDependency();
try{
aws.config.update({
accessKeyId: config.accessKeyId,
secretAccessKey: config.secretAccessKey,
region: config.awsRegion
});
const s3 = new aws.S3();
const response = await s3.listObjectsV2({
Bucket : '<Bucket Name>',
Prefix : '<Prefix>'
}).promise();
console.log(response);
}
catch(e)
{
console.log('our err.',e);
}
})();
const aws=require('aws-sdk');
const config=require('./config.js');
(异步函数(){
aws.config.setPromisesDependence();
试一试{
aws.config.update({
accessKeyId:config.accessKeyId,
secretAccessKey:config.secretAccessKey,
地区:config.awsRegion
});
const s3=新的aws.s3();
const response=wait s3.listObjectsV2({
桶:“”,
前缀:“”
}).promise();
控制台日志(响应);
}
捕获(e)
{
console.log('our err',e);
}
})();
如何循环浏览其中的子文件夹和图像?您可以:
- 使用S3API列出并循环浏览所有图像,为每个图像应用文本提取
- 使用S3清单循环浏览所有图像,并执行相同的操作
对于新文件,您可以设置Lambda函数和S3
PUT
触发器,以自动对新文件应用文本检测。我已编辑了我的问题,以更新我所做的工作。如何前进?对每个对象使用S3.listObjectV2
的结果,然后使用Textract.detectDocumentText
。