2011年4月28日木曜日

色々な糖鎖関係のDBのIDを対応させる方法の試行錯誤1

古く、糖鎖のDBはCarbBankがつくっていたが、1995年に廃止され、リンクできなくなってしまった。
また、このDBは初期のDBだけあって、糖鎖の構造の書き方が不統一であったりして見にくかった。
そこで色々な糖鎖DBが開発されているのだが、まだフォーマットは統一まで至っていない。
今回は糖鎖の構造を調べたかったのでKCF(KEGGの提供するデータの構造を中心としたファイル方式)を利用することにした。


KCFは糖鎖の構造を見るのには便利なのだが
構造の情報しか無いので、例えばどの組織の糖鎖か
などという情報が欲しい場合にはアノテーションが不足している。











CarbBankのファイル方式CCSD(Complex Carbohydrate Structure Database)はその点アノテーションは豊富なのである。













また、CCSDは構造で固有のIDではなく、恐らく特徴も含めたIDなのでKCFファイル
と対応させようと思うと一(KCF)対多(CarbBank)になってしまっている。
KEGGから1つCCSDのIDを入れると一つKCFのIDを取り出してくれるのだが
一回一回やるのが面倒だったのでJava Scriptを書いてKEGGから取り出す必要があると思われた。

しかし、良く調べてみたら、バイオ系のミラーサイトから
http://biowebdb.org/
様々な糖鎖DBのIDを対応させてまとめてあるデータを入手できそうである。
レッツトライ。
http://www.biowebdb.org/pub/kegg/ligand/glycan/
これでやってみることにする。

0 件のコメント:

コメントを投稿