Bash 从包含N个三元组文件的存档生成TDB数据集

Bash 从包含N个三元组文件的存档生成TDB数据集,bash,rdf,jena,tdb,Bash,Rdf,Jena,Tdb,提前为可能的重复道歉 我有一个包含117426个文件的归档文件(每个文件都是N-TRIPLES格式),我希望将其加载到TDB数据集的默认图形中。由于文件数量很大,我需要能够执行此导入,而无需手动选择要上载的单个文件 我在Bash,Jena和Fuseki发行版由我支配 如果可能的话,我希望避免最坏的情况,即只编写一个java应用程序来实现这一点。如果我必须为此编写一个java应用程序,RIOT/TDB中存在哪些钩子来执行程序性批量加载?作为genenral注释,一种方法是连接N-Triples文件

提前为可能的重复道歉

我有一个包含117426个文件的归档文件(每个文件都是
N-TRIPLES
格式),我希望将其加载到TDB数据集的默认图形中。由于文件数量很大,我需要能够执行此导入,而无需手动选择要上载的单个文件

我在Bash,Jena和Fuseki发行版由我支配


如果可能的话,我希望避免最坏的情况,即只编写一个java应用程序来实现这一点。如果我必须为此编写一个java应用程序,RIOT/TDB中存在哪些钩子来执行程序性批量加载?

作为genenral注释,一种方法是连接N-Triples文件以生成一个文件

您可以使用
tdbloader
tdbloader2
一次加载多个文件

tdbloader --loc DB ... your files ...
117426可能会使您的操作系统无法进行单个命令行调用。您可以通过管道将文件传输到
tdbloader
(就像先连接文件一样)

其中,
是让bash对文件进行cat的某种方式(可能是从子shell)

e、 g.(您需要调整以归档所有117426个文件):


作为genenral注释,一种方法是连接N个三元组文件以生成单个文件

您可以使用
tdbloader
tdbloader2
一次加载多个文件

tdbloader --loc DB ... your files ...
117426可能会使您的操作系统无法进行单个命令行调用。您可以通过管道将文件传输到
tdbloader
(就像先连接文件一样)

其中,
是让bash对文件进行cat的某种方式(可能是从子shell)

e、 g.(您需要调整以归档所有117426个文件):


作为genenral注释,一种方法是连接N个三元组文件以生成单个文件

您可以使用
tdbloader
tdbloader2
一次加载多个文件

tdbloader --loc DB ... your files ...
117426可能会使您的操作系统无法进行单个命令行调用。您可以通过管道将文件传输到
tdbloader
(就像先连接文件一样)

其中,
是让bash对文件进行cat的某种方式(可能是从子shell)

e、 g.(您需要调整以归档所有117426个文件):


作为genenral注释,一种方法是连接N个三元组文件以生成单个文件

您可以使用
tdbloader
tdbloader2
一次加载多个文件

tdbloader --loc DB ... your files ...
117426可能会使您的操作系统无法进行单个命令行调用。您可以通过管道将文件传输到
tdbloader
(就像先连接文件一样)

其中,
是让bash对文件进行cat的某种方式(可能是从子shell)

e、 g.(您需要调整以归档所有117426个文件):


无需修改即可完美工作(1191.49秒内加载31242719个三元组)。在这个场景中,我能够解压归档文件以支持这种方法。在没有修改的情况下工作得很好(31242719个三元组在1191.49秒内加载)。在这个场景中,我能够解压归档文件以支持这种方法。在没有修改的情况下工作得很好(31242719个三元组在1191.49秒内加载)。在这个场景中,我能够解压归档文件以支持这种方法。在没有修改的情况下工作得很好(31242719个三元组在1191.49秒内加载)。在这个场景中,我能够解压归档以支持这种方法。