よむ、つかう、まなぶ。
ライフサイエンスDBの在り方について (3 ページ)
出典
公開元URL | https://www.lifescience.mext.go.jp/2024/02/112060221.html |
出典情報 | 科学技術・学術審議会 研究計画・評価分科会 ライフサイエンス委員会 (第112回 2/16)《文部科学省》 |
ページ画像
ダウンロードした画像を利用する際は「出典情報」を明記してください。
低解像度画像をダウンロード
プレーンテキスト
資料テキストはコンピュータによる自動処理で生成されており、完全に資料と一致しない場合があります。
テキストをコピーしてご利用いただく際は資料と付け合わせてご確認ください。
ライフサイエンスDBの在り方について② ー主な成果2ー
③DB統合化のための各種基盤技術の開発
○Resource Description Framework(RDF)によるDB間データの統合化
・国内外で取得される多種多様なデータを入手・利用するために必要なデータ基盤整備として、DB登録データの
記述にRDFを採用し、統合データの整備を推進。
・RDFは、関連データを検索するために共通化できるデータ形式で、W3Cによって国際標準化されている。
そのため、フォーマットの共通化やデータ統合に適している。
・PDBj等のファンディングしたDBやDDBJを含め100件を超えるDBのデータをRDF化。
・RDFによるデータ統合で個別データ(遺伝子、タンパク質、化合物等)と他のオミクスデータが下図のように
知識グラフ化されており、国内外のDBの効率的な構築や製薬企業における解析環境の構築に貢献。
RDFのデータ形式
知識グラフ化
(RDF)
各DBでバラバタのデータ
整理・関連付けがなされた
知識グラフ
知識グラフ(イメージ)
○TogoVar(日本人ゲノム情報解析など)等のアプリケーション開発
・プロジェクト横断的なヒトゲノムデータ活用のため、様々なゲノムデータからバリアントを集約した
「TogoVar」を開発。約8.6億のバリアントを収録。新規に22のバリアントを発見し、日本人PCD患者特徴的
にDRC1遺伝子のコピー数多型が多いことの解明に貢献した。
・統合データ活用インターフェースとして「TogoDX」を開発。統合された多種多様なデータを利用者の発想で
柔軟に組み合わせることができる。
3
・そのほか、統合データ利活用促進に向けたアプリケーションを3件開発。
③DB統合化のための各種基盤技術の開発
○Resource Description Framework(RDF)によるDB間データの統合化
・国内外で取得される多種多様なデータを入手・利用するために必要なデータ基盤整備として、DB登録データの
記述にRDFを採用し、統合データの整備を推進。
・RDFは、関連データを検索するために共通化できるデータ形式で、W3Cによって国際標準化されている。
そのため、フォーマットの共通化やデータ統合に適している。
・PDBj等のファンディングしたDBやDDBJを含め100件を超えるDBのデータをRDF化。
・RDFによるデータ統合で個別データ(遺伝子、タンパク質、化合物等)と他のオミクスデータが下図のように
知識グラフ化されており、国内外のDBの効率的な構築や製薬企業における解析環境の構築に貢献。
RDFのデータ形式
知識グラフ化
(RDF)
各DBでバラバタのデータ
整理・関連付けがなされた
知識グラフ
知識グラフ(イメージ)
○TogoVar(日本人ゲノム情報解析など)等のアプリケーション開発
・プロジェクト横断的なヒトゲノムデータ活用のため、様々なゲノムデータからバリアントを集約した
「TogoVar」を開発。約8.6億のバリアントを収録。新規に22のバリアントを発見し、日本人PCD患者特徴的
にDRC1遺伝子のコピー数多型が多いことの解明に貢献した。
・統合データ活用インターフェースとして「TogoDX」を開発。統合された多種多様なデータを利用者の発想で
柔軟に組み合わせることができる。
3
・そのほか、統合データ利活用促進に向けたアプリケーションを3件開発。