2011年4月28日木曜日

色々な糖鎖関係のDBのIDを対応させる方法の試行錯誤1

古く、糖鎖のDBはCarbBankがつくっていたが、1995年に廃止され、リンクできなくなってしまった。
また、このDBは初期のDBだけあって、糖鎖の構造の書き方が不統一であったりして見にくかった。
そこで色々な糖鎖DBが開発されているのだが、まだフォーマットは統一まで至っていない。
今回は糖鎖の構造を調べたかったのでKCF(KEGGの提供するデータの構造を中心としたファイル方式)を利用することにした。


KCFは糖鎖の構造を見るのには便利なのだが
構造の情報しか無いので、例えばどの組織の糖鎖か
などという情報が欲しい場合にはアノテーションが不足している。











CarbBankのファイル方式CCSD(Complex Carbohydrate Structure Database)はその点アノテーションは豊富なのである。













また、CCSDは構造で固有のIDではなく、恐らく特徴も含めたIDなのでKCFファイル
と対応させようと思うと一(KCF)対多(CarbBank)になってしまっている。
KEGGから1つCCSDのIDを入れると一つKCFのIDを取り出してくれるのだが
一回一回やるのが面倒だったのでJava Scriptを書いてKEGGから取り出す必要があると思われた。

しかし、良く調べてみたら、バイオ系のミラーサイトから
http://biowebdb.org/
様々な糖鎖DBのIDを対応させてまとめてあるデータを入手できそうである。
レッツトライ。
http://www.biowebdb.org/pub/kegg/ligand/glycan/
これでやってみることにする。

2011年4月22日金曜日

調べ事メモ

汎化能力 (generalization ability)

学習時に与えられた訓練データだけに対してだけでなく,未知の新たなデータに対するクラスラベルや関数値も正しく予測できる能力.

http://ibisforest.org/index.php?%E6%B1%8E%E5%8C%96%E8%83%BD%E5%8A%9B

イルミナ ChIP-Seq は、クロマチン免疫沈降(ChIP)と大量並列シーケンステクノロジーを併用して
DNA 結合タンパク質の結合部位を同定します。イルミナのクロマチン免疫沈降シーケンスアプリ
ケーションを用いることで、正確かつ効率的にタンパク質の結合部位全体をマッピングできます。

http://www.illuminakk.co.jp/pdf/ChIP-Seq_DS.pdf

ChIP-Sequencing, also known as ChIP-Seq, is used to analyze protein interactions with DNA. ChIP-Seq combines chromatin immunoprecipitation (ChIP) with massively parallel DNA sequencing to identify the cistrome of DNA-associated proteins. It can be used to precisely map global binding sites for any protein of interest. Previously, ChIP-on-chip was the most common technique utilized to study these protein-DNA relations.

(Wikipedia)






2011年4月18日月曜日

Ruby irb Windowsのエラー対処法

ほとんど http://royontechnology.blogspot.com/2011_02_01_archive.html
を訳しただけですが。

Windowsでirbをしようとして以下のようなエラーが出た場合には

C:/Ruby192/lib/ruby/site_ruby/1.9.1/rbreadline.rb:2095:in `expand_path': non-absolute home (ArgumentError)
       from C:/Ruby192/lib/ruby/site_ruby/1.9.1/rbreadline.rb:2095:in `_rl_read_init_file'
       from C:/Ruby192/lib/ruby/site_ruby/1.9.1/rbreadline.rb:2078:in `rl_read_init_file'
       from C:/Ruby192/lib/ruby/site_ruby/1.9.1/rbreadline.rb:2499:in `readline_initialize_everything'
       from C:/Ruby192/lib/ruby/site_ruby/1.9.1/rbreadline.rb:3730:in `rl_initialize'
       from C:/Ruby192/lib/ruby/site_ruby/1.9.1/rbreadline.rb:4737:in `readline'
       from C:/Ruby192/lib/ruby/site_ruby/1.9.1/readline.rb:40:in `readline'
       from C:/Ruby192/lib/ruby/1.9.1/irb/input-method.rb:115:in `gets'
       from C:/Ruby192/lib/ruby/1.9.1/irb.rb:139:in `block (2 levels) in eval_input'
       from C:/Ruby192/lib/ruby/1.9.1/irb.rb:273:in `signal_status'
       from C:/Ruby192/lib/ruby/1.9.1/irb.rb:138:in `block in eval_input'
       from C:/Ruby192/lib/ruby/1.9.1/irb/ruby-lex.rb:188:in `call'
       from C:/Ruby192/lib/ruby/1.9.1/irb/ruby-lex.rb:188:in `buf_input'
       from C:/Ruby192/lib/ruby/1.9.1/irb/ruby-lex.rb:103:in `getc'
       from C:/Ruby192/lib/ruby/1.9.1/irb/slex.rb:205:in `match_io'
       from C:/Ruby192/lib/ruby/1.9.1/irb/slex.rb:75:in `match'
       from C:/Ruby192/lib/ruby/1.9.1/irb/ruby-lex.rb:286:in `token'
       from C:/Ruby192/lib/ruby/1.9.1/irb/ruby-lex.rb:262:in `lex'
       from C:/Ruby192/lib/ruby/1.9.1/irb/ruby-lex.rb:233:in `block (2 levels) in each_top_level_statement'
       from C:/Ruby192/lib/ruby/1.9.1/irb/ruby-lex.rb:229:in `loop'
       from C:/Ruby192/lib/ruby/1.9.1/irb/ruby-lex.rb:229:in `block in each_top_level_statement'
       from C:/Ruby192/lib/ruby/1.9.1/irb/ruby-lex.rb:228:in `catch'
       from C:/Ruby192/lib/ruby/1.9.1/irb/ruby-lex.rb:228:in `each_top_level_statement'
       from C:/Ruby192/lib/ruby/1.9.1/irb.rb:155:in `eval_input'
       from C:/Ruby192/lib/ruby/1.9.1/irb.rb:70:in `block in start'
       from C:/Ruby192/lib/ruby/1.9.1/irb.rb:69:in `catch'
       from C:/Ruby192/lib/ruby/1.9.1/irb.rb:69:in `start'
       from C:/Ruby192/bin/irb:12:in `'



システム環境変数の以下の変数を削除すればとりあえず解決します。)
HOME
HOMEDRIVE
HOMEPATH
HOMESHARE

CygwinのHOMEの設定がどうやら絡んでいるらしいです。
Cygwinの不具合はまだみてません(汗