使用Apache Cassandra和Elasticsearch时,如何在Apache Atlas中保存沿袭信息
我计划部署ApacheAlas,使用ApacheCassandra作为存储后端,使用Elasticsearch作为索引后端。我想知道如何用这个保存血统信息?它提供了获取沿袭信息的get API,但似乎没有办法保存它。在Atlas中,沿袭是通过使用输入和输出的进程链接而创建的 例如: 如果要查看两种配置单元表类型之间的沿袭,请执行以下操作:使用Apache Cassandra和Elasticsearch时,如何在Apache Atlas中保存沿袭信息,cassandra,apache-atlas,Cassandra,Apache Atlas,我计划部署ApacheAlas,使用ApacheCassandra作为存储后端,使用Elasticsearch作为索引后端。我想知道如何用这个保存血统信息?它提供了获取沿袭信息的get API,但似乎没有办法保存它。在Atlas中,沿袭是通过使用输入和输出的进程链接而创建的 例如: 如果要查看两种配置单元表类型之间的沿袭,请执行以下操作: T1(配置单元表)--->P1(配置单元过程)--->T2(配置单元表) 因此,基本上需要通过流程类型链接实体 在Atlas中,流程是实体,可以使用APIPO
T1(配置单元表)--->P1(配置单元过程)--->T2(配置单元表)
因此,基本上需要通过流程类型链接实体
在Atlas中,流程是实体,可以使用APIPOST:/v2/entity
创建,其中定义了输入和输出,就像上面的hive\u流程一样:
POST: /api/atlas/v2/entity
{
"entity": {
"typeName": "hive_process",
"attributes": {
"outputs": [
{
"guid": "2",
"typeName": "hive_table",
"uniqueAttributes": {
"qualifiedName": "t2@primary"
}
}
],
"qualifiedName": "p1@primary",
"inputs": [
{
"guid": "1",
"typeName": "hive_table",
"uniqueAttributes": {
"qualifiedName": "t1@primary"
}
}
],
"name": "P1-Process"
}
}
}
在创建流程之前需要注意的重要一点是,引用的实体(输入、输出)应该预先存在,否则流程创建将失败
如果您的需求不包括预先存在的类型,您当然可以继续为Atlas实体和流程定义您自己的类型
Atlas谱系中有关Atlas类型系统的更多信息是在使用输入和输出通过流程链接时创建的
例如:
如果要查看两种配置单元表类型之间的沿袭,请执行以下操作:
T1(配置单元表)--->P1(配置单元过程)--->T2(配置单元表)
因此,基本上需要通过流程类型链接实体
在Atlas中,流程是实体,可以使用APIPOST:/v2/entity
创建,其中定义了输入和输出,就像上面的hive\u流程一样:
POST: /api/atlas/v2/entity
{
"entity": {
"typeName": "hive_process",
"attributes": {
"outputs": [
{
"guid": "2",
"typeName": "hive_table",
"uniqueAttributes": {
"qualifiedName": "t2@primary"
}
}
],
"qualifiedName": "p1@primary",
"inputs": [
{
"guid": "1",
"typeName": "hive_table",
"uniqueAttributes": {
"qualifiedName": "t1@primary"
}
}
],
"name": "P1-Process"
}
}
}
在创建流程之前需要注意的重要一点是,引用的实体(输入、输出)应该预先存在,否则流程创建将失败
如果您的需求不包括预先存在的类型,您当然可以继续为Atlas实体和流程定义您自己的类型
更多关于Atlas类型系统的信息