DICE

DICE共通名前空間

DICE共通名前空間 <http://dice.nims.go.jp/ontology/> では、DICEのサービスを機械可読に提供するためのURI(Uniform Resource Identifier)を提供します。

利用可能な名前空間

DICE共通名前空間の目的

URIは、各分野で使われる語を一意に定義することを意味します。
例えば、Materials Data Repository(MDR)のwork、 "XAFS spectrum of Silver(I) sulfadiazine"(https://mdr.nims.go.jp/concern/datasets/5425kd364)に収録されているスペクトルデータやメタデータのセットに一つのURI (http://dice.nims.go.jp/ontology/mdr-ont#a57d4971-b66a-4a38-8aed-f0f357b2c328) を付けて、機械が認識できるようにします。
ここで大切なことは、このURIをMDR以外の外のリソースと繋げることです。繋げる方法は様々ですが、例えば測定試料(ここではSilver(I) sulfadiazine)にも一つのURI (http://dice.nims.go.jp/ontology/mdr-xafs-ont/Item#Q1298) を付けて、これが良く知られた大きなデータベースPubChem(https://pubchem.ncbi.nlm.nih.gov/)のSilver sulfadiazineと関係があることを記述してみるには、PubChemが公表している名前空間のURI (http://rdf.ncbi.nlm.nih.gov/pubchem/compound/CID441244) を利用して、

wd:Q1298 skos:closeMatch compound:CID441244 .

のように書きます。ここで、wd、skos、compoundはprefixと呼ばれていて、それぞれ、URIの省略部分

wd: <http://dice.nims.go.jp/ontology/mdr-xafs-ont/Item#>
skos: <http://www.w3.org/2004/02/skos/core#>
compound: <http://rdf.ncbi.nlm.nih.gov/pubchem/compound/>

を示します。この一文があれば、MDRのworkでは分子量やSMILESなどの化学構造を記載していなくても、PubChemの情報を統合して利用できます。このように、それぞれのリソースに一意な名前(URI)を付け、その空間を他のリソースに繋げることが、大きな知識を生み、人智を結集した科学を生み出します。
リソースの中で使われている語の概念、語と語の関係性、語の使い方を記述するのがオントロジーです。それぞれの専門分野を整理して、各所で外の世界とつながりを定義してゆくこと。これが、このDICE共通名前空間の狙いです。MDRや一部のデータベースで取り組みを先行させますが、オープンサイエンスを目指す他のサービスにもできる限り広げます。


DICE共通名前空間で使っている外部オントロジーとそのprefixは次の通りです。

OntologyName spacePrefix
DCMIhttp://purl.org/dc/elements/1.1/dc
DCMIhttp://purl.org/dc/terms/dcterms
OWLhttp://www.w3.org/2002/07/owl#owl
PRISMhttp://prismstandard.org/namespaces/1.2/basic/prism
RDFhttp://www.w3.org/1999/02/22-rdf-syntax-ns#rdf
RDF Schemahttp://www.w3.org/2000/01/rdf-schema#rdfs
SKOShttp://www.w3.org/2004/02/skos/core#skos
XML Schemahttp://www.w3.org/2001/XMLSchema#xsd

mdr <http://dice.nims.go.jp/ontology/mdr-ont#>

  1. http://dice.nims.go.jp/ontology/mdr-ont#

mdr-ontのデータ構造を図に示します。イタリックは具体的な例です。別途公開しているMDR Schema(https://github.com/nims-dpfc/mdr-schema)はMDRのデータセットの単位であるwork内で記載するメタデータのスキーマを示していますが、ここで示すデータ構造は、MDR全体の中でのworkの位置づけを定義しています。述語は国際的に通用する上記の外部オントロジーで定義しています。MDRのworkの型をクラス(mdr:Works)とし、そのインスタンスとして各workのURIを紐づけています。


mdr-ontのデータ構造

インスタンスのアノテーションの詳細など、データのセマンティックな利用には、以下のttl形式のRDF(Resource Description Framework)ファイルをご利用ください。
(注:トリプルストアにアップロードする際に、拡張子を [.ttl] に変換する必要がある場合があります。)

ファイル名(クリックでダウンロード)バージョントリプル数記述
mdr-ont.owl 0.215,236An ontology about MDR and its LOD.


mdr-xafs-ont系列 <http://dice.nims.go.jp/ontology/mdr-xafs-ont/>

mdr-xafs-ont系列は、MDR XAFS DB(https://doi.org/10.48505/nims.1447)を外部のデータと連携させるとともに、高度な検索を可能にするプロジェクトの名前空間群を定義します。
一般的にプロジェクト遂行上必要なデータ管理は、(1)使われる語彙の定義、(2)背景となる物理・概念の定義、(3)個々の実験(サブプロジェクト)におけるデータ構造化となります。これらは、互いに矛盾することがないように定義されます。mdr-xafs-ont系列では以下のように、これらを階層化した名前空間を作ります。

mdr-xafs-ont系列の階層化した名前空間

  1. http://dice.nims.go.jp/ontology/mdr-xafs-ont/Item#
  2. http://dice.nims.go.jp/ontology/mdr-xafs-ont/Property#
  3. http://dice.nims.go.jp/ontology/mdr-xafs-ont/Schema#
  4. http://dice.nims.go.jp/ontology/mdr-xafs-ont/Subproject#

この図に示す通り、便宜上、(1)の語彙はエンティティと述語に分けてあります。語彙の定義は、一般の辞書のように分け隔てなく管理して、シソーラスのような分類や上位概念・下位概念は別の語彙管理基盤や(2)のスキーマ(オントロジー)で導入することにします。(2)はこのプロジェクトで扱うエンティティの物理概念の構造で、次の図のように定めました。ここで、mdr-xafs-ont系列固有の外部オントロジーとしてChemical Methods Ontology, CHMO (http://purl.obolibrary.org/obo/) を、XAFSの定義で参照しています。これによって、本プロジェクトで扱うXAFSが外部とリンクしたことになり、CHMOで定義された他の測定と連携できるようになります。赤い枠は、(3)のサブプロジェクトの一例であるOn Top of Single Figure (OTSF)サブプロジェクト(詳細はhttps://mdr.nims.go.jp/concern/datasets/vh53wz94cで別途公開いたします)で使用しているクラスを示します。

MDR XAFS DB Project Ontology 1

この図に、更に(1)で定義した述語を加えると、次のようになります。すなわち(1)で定義された述語は(2)で記述された制約(クラス間の関係づけのルール)に従って使用されます。

MDR XAFS DB Project Ontology 2


この図の機械可読な記述は、http://dice.nims.go.jp/ontology/mdr-xafs-ont/Schema#をご覧ください。

(3)個々の実験(サブプロジェクト)におけるデータ構造化は、(1)(2)で定義された、語彙とオントロジーの範囲で閉じていますので、サブプロジェクトの定義
http://dice.nims.go.jp/ontology/mdr-xafs-ont/Subproject#
以外は、新たな名前空間を必要としません。各サブプロジェクトはインスタンスとして、この空間に追加されて行きます。OTSFであれば
http://dice.nims.go.jp/ontology/mdr-xafs-ont/Subproject#OTSF
で定義されます。

(1)から(3)のセマンティックな利用は以下のttl形式のRDFファイルをご利用ください。
(注:トリプルストアにアップロードする際に、拡張子を [.ttl] に変換する必要がある場合があります。)

ファイル名(クリックでダウンロード)バージョントリプル数記述
mdr-xafs-ont_Item.owl0.25,384Namespace for entities used in MDR XAFS DB (https://doi.org/10.48505/nims.1447).
mdr-xafs-ont_Property.owl0.229Namespace for predicates used in MDR XAFS DB (https://doi.org/10.48505/nims.1447).
mdr-xafs-ont_Schema.owl0.296An ontology about MDR XAFS DB and its LOD.
mdr-xafs-ont_Subproject.owl0.224Namespace for Sub-project of MDR XAFS DB (https://doi.org/10.48505/nims.1447).

polymer-bio-ont系列 <http://dice.nims.go.jp/ontology/polymer-bio-ont/>

polymer-bio-ont系列は、PoLyInfo(https://polymer.nims.go.jp/)を外部のデータと連携させるとともに、高度な検索を可能にするプロジェクトの名前空間群を定義します。
一般的にプロジェクト遂行上必要なデータ管理は、(1)使われる語彙の定義、(2)背景となる物理・概念の定義、(3)個々の実験(サブプロジェクト)におけるデータ構造化となります。これらは、互いに矛盾することがないように定義されます。polymer-bio-ont系列では以下のように、これらを階層化した名前空間を作ります。

polymer-bio-ont系列の階層化した名前空間

  1. http://dice.nims.jp/ontology/polymer-bio-ont/Biodeg#
  2. http://dice.nims.jp/ontology/polymer-bio-ont/Reference#
  3. http://dice.nims.jp/ontology/polymer-bio-ont/Property#
  4. http://dice.nims.go.jp/ontology/polymer-bio-ont/Schema#
  5. http://dice.nims.go.jp/ontology/polymer-bio-ont/Subproject#


この図に示す通り、便宜上、(1)の語彙はエンティティと述語に分けてあります。このプロジェクトでのエンティティは、合成ポリマーの生分解に特化していますので、分野の語彙としてBiodeg#にまとめてあります。またその情報源となる文献情報はReference#にて機械可読化してあります。(2)はこのプロジェクトで扱う生分解の物理概念の構造で、次の図のように定めました。この概念の特徴は、生分解の定義、プロセスとしての位置づけ、そこに関わる菌種、ポリマーなど、複雑な部分は、全て外部のオントロジーに委ねている点です。こうした大きな概念間の結合を図り、分野間の連携を確立するのが今回のプロジェクトの目的の一つです。尚、今回扱う合成ポリマーの生分解の定義は、Environment Ontology, ENVO(http://purl.obolibrary.org/obo/)を参照しています。

polymer-bio-ont系列

この図の機械可読な記述は、http://dice.nims.go.jp/ontology/polymer-bio-ont/Schema#をご覧ください。
このプロジェクトで固有に使用している外部オントロジーは次の通りです。

OntologyName spacePrefix
Bibohttp://purl.org/ontology/bibo/bibo
Obohttp://purl.obolibrary.org/obo/obo
PoLyInfohttp://dice.nims.go.jp/ontology/PoLyInfo-ont/Schema#pli
Taxddbjhttp://www.w3.org/2002/07/owl#taxddbj
Taxonomyhttp://identifiers.org/taxonomy/taxonomy

(3)個々の実験(サブプロジェクト)におけるデータ構造化は、(1)(2)で定義された、語彙とオントロジーの範囲で閉じていますので、サブプロジェクトの定義
http://dice.nims.go.jp/ontology/polymer-bio-ont/Subproject#
以外は、新たな名前空間を必要としません。各サブプロジェクトはインスタンスとして、この空間に追加されて行きます。菌種を使って生分解を表現するサブプロジェクトBDG-Sであれば
http://dice.nims.go.jp/ontology/polymer-bio-ont/Subproject#BDG-S
で定義されます。

(1)から(3)のセマンティックな利用は以下のttl形式のRDFファイルをご利用ください。
(注:トリプルストアにアップロードする際に、拡張子を [.ttl] に変換する必要がある場合があります。)
polymer-bio-ont系列のRDFは、https://integbio.jp/rdf/で公開する予定です。

ファイル名(クリックでダウンロード)バージョントリプル数記述
polymer-bio-ont_Biodeg.owl0.11506Definition of bio-degradation of polymers registered in PoLyInfo.
polymer-bio-ont_Reference.owl0.11035References for bio-degradation of polymers registered in PoLyInfo.
polymer-bio-ont_Property.owl0.115Namespace for predicates used in polymer-bio-ont.
polymer-bio-ont_Schema.owl0.149An ontology for polymer-bio linked data.
polymer-bio-ont_Subproject.owl0.118Namespace for Sub-project of polymer-bio linked data.

PoLyInfo-ont系列 <http://dice.nims.go.jp/ontology/PoLyInfo-ont/>

PoLyInfo-ont系列は、PoLyInfo(https://polymer.nims.go.jp/)を高分子の概念として記述するための名前空間を提供します。
一般的にプロジェクト遂行上必要なデータ管理は、(1)使われる語彙の定義、(2)背景となる物理・概念の定義、(3)個々の実験(サブプロジェクト)におけるデータ構造化となります。これらは、互いに矛盾することがないように定義されます。PoLyInfo-ont系列では以下のように、これらを階層化した名前空間を作ります。

PoLyInfo-ont系列の階層化した名前空間

PoLyInfoはまとまった高分子の概念を持ちますので、語彙は多岐にわたり、また複雑な構造を持ちます。そのため、(1)は(3)のサブプロジェクトごとに管理することにします。つまりサブプロジェクトごとに名前空間を作ります。現在公開しているサブプロジェクトとその名前空間は以下の通りです。

SubprojectName spacePrefix
Homopolymerhttp://dice.nims.jp/ontology/PoLyInfo-ont/polyinfo-rdf/Homopolymer#homo
Constitutional unithttp://dice.nims.jp/ontology/PoLyInfo-ont/polyinfo-rdf/ConstitutionalUnit#cu

(2)はこのプロジェクトで扱う概念構造ですが、このページでご紹介するには、少し複雑すぎますので、こちらの文書(https://dice.nims.go.jp/ontology/PoLyInfo-ont_readme.pdf)や論文などで逐次公開することにします。対応するSchemaは
http://dice.nims.go.jp/ontology/PoLyInfo-ont/Schema#
で機械可読に提供します。

このスキーマのセマンティックな利用は以下のttl形式のRDFファイルをご利用ください。
(注:トリプルストアにアップロードする際に、拡張子を [.ttl] に変換する必要がある場合があります。)

ファイル名(クリックでダウンロード)バージョントリプル数記述
PoLyInfo-ont_Schema.owl0.1365The PoLyInfo ontology that provides the vocabulary needed to describe polymeric data in RDF.

お問い合わせ

DICE共通名前空間に関するご質問等は、DICEお問い合わせフォームからお願いします。
(対象サービスは「無指定」を選択してください)

PAGE TOP