2011年6月15日水曜日

CBRC 統合DB情報基盤サイトの調査

上記タイトルの調査を行なっている。2~3回の調査で紹介できるものを見つけたい。
ここではCBRCで開発しているウェブツールの網羅的横断検索の手段という感じ?
そして並列・分散処理を行うことで計算機資源の有効活用で時間短縮が可能。

以下 CBRC 統合DB情報基盤サイトより(引用)

「ワークフロー」技術開発について
従来、ソフトウェアやデータベースごとにアクセスし手間と時間がかかっていた一連の処理をまとめ、自動的に分散し短時間に効率よく行うワークフローを開発します。CBRCでは、まずタンパク質の構造解析支援のワークフローを手始めに、利便性が高く、有用なものを目指して開発する予定です。

CBRCでは以下のタイプのワークフローを開発します

*WEBベースワークフロー                      
ブラウザー経由でWEBサーバにアクセス、入力し計算終了後結果をブラウザーで見ます。

*Activeワークフロー(ユーザ定義型ワークフロー)
ユーザのPC又はサーバにて、ワークフロープラットフォームを使用し、ユーザが望むワークフローを実行します。ユーザは様々な設定(実行部品の指定、パラメータ等)を指定することが可能です。
(引用終わり)

普段CBRCのセミナーを聞いている感じだと、既存のソフトウェア(配列相同性検索、構造予測検索など)
に対して、特定の領域に強かったり(ディスオーダー予測、同じ文字が続く場合の検索)
リガンド結合部位に着目した予測だったり、検索結果を早くしていたり、といった工夫を行った研究を
まとめてDBとして公開しているイメージである(あくまで私感)

それらを駆使して、通常の場合には一つのDB検索を行った結果はあくまで一つだが、その検索結果を利用してさらに検索をかける、もしくは検索を行なっている途中の段階の結果を利用して他のDB内の検索を行っているらしい。この結果を参照することでそれぞれのソフトウェアの強みがおそらく出て、他のソフトウェアの検索結果を参照できることと、思いがけない良い結果を他のソフトウェア経由で分かるのかもしれない。

Localでできるらしいワークフローknime_2.3.4を使用して実験中。
KNIME(ナイムとは 以下 http://d.hatena.ne.jp/makiyamakoji/20090714/p1 より引用)
KNIME(ナイムと発音する)は、モジュール型データ探索プラットホームです。これは、ユーザが視覚的にデータフロー(パイプラインともいう)を作成したり、解析ステップを選択的に実行したり、データとモデル上の対話的ビューを通して後から結果を調査することを可能にします。
(引用終わり)

0 件のコメント:

コメントを投稿