DICE共通名前空間
DICE共通名前空間 <http://dice.nims.go.jp/ontology/> では、DICEのサービスを機械可読に提供するためのURI(Uniform Resource Identifier)を提供します。
利用可能な名前空間
DICE共通名前空間の目的
URIは、各分野で使われる語を一意に定義することを意味します。
例えば、Materials Data Repository(MDR)のwork、 "XAFS spectrum of Silver(I) sulfadiazine"(https://mdr.nims.go.jp/concern/datasets/5425kd364)に収録されているスペクトルデータやメタデータのセットに一つのURI (http://dice.nims.go.jp/ontology/mdr-ont#a57d4971-b66a-4a38-8aed-f0f357b2c328) を付けて、機械が認識できるようにします。
ここで大切なことは、このURIをMDR以外の外のリソースと繋げることです。繋げる方法は様々ですが、例えば測定試料(ここではSilver(I) sulfadiazine)にも一つのURI (http://dice.nims.go.jp/ontology/mdr-xafs-ont/Item#Q1298) を付けて、これが良く知られた大きなデータベースPubChem(https://pubchem.ncbi.nlm.nih.gov/)のSilver sulfadiazineと関係があることを記述してみるには、PubChemが公表している名前空間のURI (http://rdf.ncbi.nlm.nih.gov/pubchem/compound/CID441244) を利用して、
wd:Q1298 skos:closeMatch compound:CID441244 .
のように書きます。ここで、wd、skos、compoundはprefixと呼ばれていて、それぞれ、URIの省略部分
wd: <http://dice.nims.go.jp/ontology/mdr-xafs-ont/Item#>
skos: <http://www.w3.org/2004/02/skos/core#>
compound: <http://rdf.ncbi.nlm.nih.gov/pubchem/compound/>
を示します。この一文があれば、MDRのworkでは分子量やSMILESなどの化学構造を記載していなくても、PubChemの情報を統合して利用できます。このように、それぞれのリソースに一意な名前(URI)を付け、その空間を他のリソースに繋げることが、大きな知識を生み、人智を結集した科学を生み出します。
リソースの中で使われている語の概念、語と語の関係性、語の使い方を記述するのがオントロジーです。それぞれの専門分野を整理して、各所で外の世界とつながりを定義してゆくこと。これが、このDICE共通名前空間の狙いです。MDRや一部のデータベースで取り組みを先行させますが、オープンサイエンスを目指す他のサービスにもできる限り広げます。
DICE共通名前空間で使っている外部オントロジーとそのprefixは次の通りです。
Ontology | Name space | Prefix |
---|---|---|
DCMI | http://purl.org/dc/elements/1.1/ | dc |
DCMI | http://purl.org/dc/terms/ | dcterms |
OWL | http://www.w3.org/2002/07/owl# | owl |
PRISM | http://prismstandard.org/namespaces/1.2/basic/ | prism |
RDF | http://www.w3.org/1999/02/22-rdf-syntax-ns# | rdf |
RDF Schema | http://www.w3.org/2000/01/rdf-schema# | rdfs |
SKOS | http://www.w3.org/2004/02/skos/core# | skos |
XML Schema | http://www.w3.org/2001/XMLSchema# | xsd |
mdr <http://dice.nims.go.jp/ontology/mdr-ont#>
mdr-ontのデータ構造を図に示します。イタリックは具体的な例です。別途公開しているMDR Schema(https://github.com/nims-dpfc/mdr-schema)はMDRのデータセットの単位であるwork内で記載するメタデータのスキーマを示していますが、ここで示すデータ構造は、MDR全体の中でのworkの位置づけを定義しています。述語は国際的に通用する上記の外部オントロジーで定義しています。MDRのworkの型をクラス(mdr:Works)とし、そのインスタンスとして各workのURIを紐づけています。
インスタンスのアノテーションの詳細など、データのセマンティックな利用には、以下のttl形式のRDF(Resource Description Framework)ファイルをご利用ください。
(注:トリプルストアにアップロードする際に、拡張子を [.ttl] に変換する必要がある場合があります。)
ファイル名(クリックでダウンロード) | バージョン | トリプル数 | 記述 |
---|---|---|---|
mdr-ont.owl | 0.3 | 15,495 | An ontology about MDR and its LOD. |
mdr-xafs-ont系列 <http://dice.nims.go.jp/ontology/mdr-xafs-ont/>
mdr-xafs-ont系列は、MDR XAFS DB(https://doi.org/10.48505/nims.1447)を外部のデータと連携させるとともに、高度な検索を可能にするプロジェクトの名前空間群を定義します。
一般的にプロジェクト遂行上必要なデータ管理は、(1)使われる語彙の定義、(2)背景となる物理・概念の定義、(3)個々の実験(サブプロジェクト)におけるデータ構造化となります。これらは、互いに矛盾することがないように定義されます。mdr-xafs-ont系列では以下のように、これらを階層化した名前空間を作ります。
- http://dice.nims.go.jp/ontology/mdr-xafs-ont/Item#
- http://dice.nims.go.jp/ontology/mdr-xafs-ont/Property#
- http://dice.nims.go.jp/ontology/mdr-xafs-ont/Schema#
- http://dice.nims.go.jp/ontology/mdr-xafs-ont/Subproject#
この図に示す通り、便宜上、(1)の語彙はエンティティと述語に分けてあります。語彙の定義は、一般の辞書のように分け隔てなく管理して、シソーラスのような分類や上位概念・下位概念は別の語彙管理基盤や(2)のスキーマ(オントロジー)で導入することにします。(2)はこのプロジェクトで扱うエンティティの物理概念の構造で、次の図のように定めました。ここで、mdr-xafs-ont系列固有の外部オントロジーとしてChemical Methods Ontology, CHMO (http://purl.obolibrary.org/obo/) を、XAFSの定義で参照しています。これによって、本プロジェクトで扱うXAFSが外部とリンクしたことになり、CHMOで定義された他の測定と連携できるようになります。赤い枠は、(3)のサブプロジェクトの一例であるOn Top of Single Figure (OTSF)サブプロジェクト(詳細はhttps://mdr.nims.go.jp/concern/datasets/vh53wz94cで別途公開いたします)で使用しているクラスを示します。
この図に、更に(1)で定義した述語を加えると、次のようになります。すなわち(1)で定義された述語は(2)で記述された制約(クラス間の関係づけのルール)に従って使用されます。
この図の機械可読な記述は、http://dice.nims.go.jp/ontology/mdr-xafs-ont/Schema#をご覧ください。
(3)個々の実験(サブプロジェクト)におけるデータ構造化は、(1)(2)で定義された、語彙とオントロジーの範囲で閉じていますので、サブプロジェクトの定義
http://dice.nims.go.jp/ontology/mdr-xafs-ont/Subproject#
以外は、新たな名前空間を必要としません。各サブプロジェクトはインスタンスとして、この空間に追加されて行きます。OTSFであれば
http://dice.nims.go.jp/ontology/mdr-xafs-ont/Subproject#OTSF
で定義されます。
(1)から(3)のセマンティックな利用は以下のttl形式のRDFファイルをご利用ください。
(注:トリプルストアにアップロードする際に、拡張子を [.ttl] に変換する必要がある場合があります。)
ファイル名(クリックでダウンロード) | バージョン | トリプル数 | 記述 |
---|---|---|---|
mdr-xafs-ont_Item.owl | 0.3 | 6,226 | Namespace for entities used in MDR XAFS DB (https://doi.org/10.48505/nims.1447). |
mdr-xafs-ont_Property.owl | 0.2 | 29 | Namespace for predicates used in MDR XAFS DB (https://doi.org/10.48505/nims.1447). |
mdr-xafs-ont_Schema.owl | 0.3 | 96 | An ontology about MDR XAFS DB and its LOD. |
mdr-xafs-ont_Subproject.owl | 0.3 | 29 | Namespace for Sub-project of MDR XAFS DB (https://doi.org/10.48505/nims.1447). |
mdr-xps-ont系列 <http://dice.nims.go.jp/ontology/mdr-xps-ont/>
mdr-xps-ont系列は、MDRで公開しているデータベース、MDR HAXPES DB(https://doi.org/10.48505/nims.3056)とMDR XAFS DB(https://doi.org/10.48505/nims.1447)を統合的に利用するための名前空間群を定義します。
セマンティックな利用は以下のttl形式のRDFファイルをご利用ください。
(注:トリプルストアにアップロードする際に、拡張子を [.ttl] に変換する必要がある場合があります。)
ファイル名 | バージョン | トリプル数 | 記述 |
---|---|---|---|
mdr-xps-ont_Schema.owl | 0.1 | 96 | An ontology for MDR XAFS/HAXPES DB and their LOD. |
polymer-bio-ont系列 <http://dice.nims.go.jp/ontology/polymer-bio-ont/>
polymer-bio-ont系列は、PoLyInfo(https://polymer.nims.go.jp/)を外部のデータと連携させるとともに、高度な検索を可能にするプロジェクトの名前空間群を定義します。
一般的にプロジェクト遂行上必要なデータ管理は、(1)使われる語彙の定義、(2)背景となる物理・概念の定義、(3)個々の実験(サブプロジェクト)におけるデータ構造化となります。これらは、互いに矛盾することがないように定義されます。polymer-bio-ont系列では以下のように、これらを階層化した名前空間を作ります。
- http://dice.nims.jp/ontology/polymer-bio-ont/Biodeg#
- http://dice.nims.jp/ontology/polymer-bio-ont/Reference#
- http://dice.nims.jp/ontology/polymer-bio-ont/Property#
- http://dice.nims.go.jp/ontology/polymer-bio-ont/Schema#
- http://dice.nims.go.jp/ontology/polymer-bio-ont/Subproject#
この図に示す通り、便宜上、(1)の語彙はエンティティと述語に分けてあります。このプロジェクトでのエンティティは、合成ポリマーの生分解に特化していますので、分野の語彙としてBiodeg#にまとめてあります。またその情報源となる文献情報はReference#にて機械可読化してあります。(2)はこのプロジェクトで扱う生分解の物理概念の構造で、次の図のように定めました。この概念の特徴は、生分解の定義、プロセスとしての位置づけ、そこに関わる菌種、ポリマーなど、複雑な部分は、全て外部のオントロジーに委ねている点です。こうした大きな概念間の結合を図り、分野間の連携を確立するのが今回のプロジェクトの目的の一つです。尚、今回扱う合成ポリマーの生分解の定義は、Environment Ontology, ENVO(http://purl.obolibrary.org/obo/)を参照しています。
この図の機械可読な記述は、http://dice.nims.go.jp/ontology/polymer-bio-ont/Schema#をご覧ください。
このプロジェクトで固有に使用している外部オントロジーは次の通りです。
Ontology | Name space | Prefix |
---|---|---|
Bibo | http://purl.org/ontology/bibo/ | bibo |
Obo | http://purl.obolibrary.org/obo/ | obo |
PoLyInfo | http://dice.nims.go.jp/ontology/PoLyInfo-ont/Schema# | pli |
Taxddbj | http://www.w3.org/2002/07/owl# | taxddbj |
Taxonomy | http://identifiers.org/taxonomy/ | taxonomy |
(3)個々の実験(サブプロジェクト)におけるデータ構造化は、(1)(2)で定義された、語彙とオントロジーの範囲で閉じていますので、サブプロジェクトの定義
http://dice.nims.go.jp/ontology/polymer-bio-ont/Subproject#
以外は、新たな名前空間を必要としません。各サブプロジェクトはインスタンスとして、この空間に追加されて行きます。菌種を使って生分解を表現するサブプロジェクトBDG-Sであれば
http://dice.nims.go.jp/ontology/polymer-bio-ont/Subproject#BDG-S
で定義されます。
(1)から(3)のセマンティックな利用は以下のttl形式のRDFファイルをご利用ください。
(注:トリプルストアにアップロードする際に、拡張子を [.ttl] に変換する必要がある場合があります。)
polymer-bio-ont系列のRDFは、https://integbio.jp/rdf/で公開する予定です。
ファイル名(クリックでダウンロード) | バージョン | トリプル数 | 記述 |
---|---|---|---|
polymer-bio-ont_Biodeg.owl | 0.1 | 1506 | Definition of bio-degradation of polymers registered in PoLyInfo. |
polymer-bio-ont_Reference.owl | 0.1 | 1035 | References for bio-degradation of polymers registered in PoLyInfo. |
polymer-bio-ont_Property.owl | 0.1 | 15 | Namespace for predicates used in polymer-bio-ont. |
polymer-bio-ont_Schema.owl | 0.1 | 49 | An ontology for polymer-bio linked data. |
polymer-bio-ont_Subproject.owl | 0.1 | 18 | Namespace for Sub-project of polymer-bio linked data. |
PoLyInfo-ont系列 <http://dice.nims.go.jp/ontology/PoLyInfo-ont/>
PoLyInfo-ont系列は、PoLyInfo(https://polymer.nims.go.jp/)を高分子の概念として記述するための名前空間を提供します。
詳細はMDRで公開しておりますので、ご参照ください https://doi.org/10.48505/nims.4413
お問い合わせ
DICE共通名前空間に関するご質問等は、DICEお問い合わせフォームからお願いします。
(対象サービスは「無指定」を選択してください)