Amazon dynamodb aws从另一个aws帐户访问/爬网dynamodb（跨帐户访问）_Amazon Dynamodb_Aws Glue

Amazon dynamodb aws从另一个aws帐户访问/爬网dynamodb（跨帐户访问）

amazon-dynamodb

Amazon dynamodb aws从另一个aws帐户访问/爬网dynamodb（跨帐户访问）,amazon-dynamodb,aws-glue,Amazon Dynamodb,Aws Glue,我写了一个glue作业，它导出DynamoDb表并以csv格式存储在S3上。粘合作业和表位于同一aws帐户中，但S3存储桶位于不同的aws帐户中。我已经能够从glue作业通过附加以下bucket策略访问交叉帐户S3 bucket { "Version": "2012-10-17", "Statement": [ { "Sid": "tempS3Access", "Effect": "Allow",

我写了一个glue作业，它导出DynamoDb表并以csv格式存储在S3上。粘合作业和表位于同一aws帐户中，但S3存储桶位于不同的aws帐户中。我已经能够从glue作业通过附加以下bucket策略访问交叉帐户S3 bucket

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Sid": "tempS3Access",
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::<AWS-ACCOUNT-ID>:role/<ROLE-PATH>"
            },
            "Action": [
                "s3:Get*",
                "s3:Put*",
                "s3:List*",
                "s3:DeleteObject*"
            ],
            "Resource": [
                "arn:aws:s3:::<BUCKET-NAME>",
                "arn:aws:s3:::<BUCKET-NAME>/*"
            ]
        }
    ]
}

{
“版本”：“2012-10-17”，
“声明”：[
{
“Sid”：“tempS3Access”，
“效果”：“允许”，
“委托人”：{
“AWS”：“arn:AWS:iam:：：角色/”
},
“行动”：[
“s3:获取*”，
“s3:Put*”，
“s3:列表*”，
“s3:DeleteObject*”
],
“资源”：[
“arn:aws:s3:：”，
“arn:aws:s3:：/*”
]
}
]
}

现在，我还想从另一个AWS帐户读取/访问DynamoDb表。是否可以使用Crawler访问跨帐户DynamoDb表？我需要什么来实现这一点

谢谢

简短的回答：你不能。爬虫程序只能在您自己的帐户中爬虫dynamo表

回答：
你可以使用我的变通方法

在帐户a中创建一个信任策略。您创建的信任策略就可以了

在您的帐户B中创建一个粘合作业。导入boto3并在第一个帐户中创建会话。然后使用dynamodb.resource可以扫描表。查看我的代码：

现在有了这个“数据”，它保存了所有的表元素，你可以做很多事情。如果希望以某种方式操纵数据，可以创建dynamicFrame：

达塔夫= glueContext.create_dynamic_frame.from_rdd（spark.sparkContext.parallelize（data），'data'））

或者数据帧，如果您需要的话。

我希望这有帮助。如果您有任何问题，请随时提问。

简短回答：您不能。爬虫程序只能在您自己的帐户中爬虫dynamo表