--- --- ブランクノードの問題を避けつつRDFデータを分割するツールSplit4Blankに関する論文が PLOS ONE 誌に掲載されました | DBCLS

ブランクノードの問題を避けつつRDFデータを分割するツールSplit4Blankに関する論文が PLOS ONE 誌に掲載されました

当センターの山口敦子特任准教授と山本泰智特任准教授による論文 “Split4Blank: Maintaining consistency while improving efficiency of loading RDF data with blank nodes ” が PLOS ONE 誌に掲載されました。
論文はオープンアクセスで、下記URLからご覧いただけます。
https://doi.org/10.1371/journal.pone.0217852

巨大なRDFデータをトリプルストアにロードするには並列化が有効ですが、ブランクノードが含まれている場合、単純に複数ファイルに分割すると問題が生じます。この論文では、この問題を回避しつつ効率よくファイルを分割するために、グラフ連結成分のアルゴリズムとスケジューリング問題のアルゴリズムを組み合わせる手法を提案しました。また、本手法を用いればブランクノードに関する問題が生じないことを数学的に示しました。さらにSplit4Blankというツールとして提供しました。ツールはMITライセンスのオープンソースで、こちらから入手可能です。