2011年6月29日水曜日

CBRC 統合DB情報基盤サイトの調査(2)

統合DB情報基盤サイトについて調べていたのだが、WEBワークフローとActiveワークフローについて調べてみて、それらのクエリーと結果の表示の仕方と見方は分かったのだが、計算を並列に実行できることやクエリーの流れを意識できること、相互のソフトウェアによる結果比較が出来ることについて、具体的に何が特に良いのか、そして誰を対象としているのか(操作は若干行いにくい)、明確にすることが出来なかった。
よって、個々のソフトウェアやDBを調べて、有用そうなものをピックアップして、各ソフトウェアの実行結果を比較することの良さ、並列に実行することによる高速化の良さを見つけていきたいと思う。
また製作された先生と相談して、焦点やメリットを絞れれば番組として作っていきたいと思う。

ただCBRCの個々のソフトウェアやDBはあまり今まで紹介されていないので、情報基盤サイトを先に紹介するより、
個々のコンテンツを紹介したほうがよいのではないかと感じている。
そして、私自身がCBRCの個々のソフトウェアを調査したい。

また統合TVのタンパク質関係、RNA関係のコンテンツも充実させていきたい。

[候補]

Centroid Fold

RNA二次構造予測ソフトウェア

LAST

大規模ゲノム配列比較ソフトウェア

FORTE

プロファイル比較によるタンパク質立体構造認識法

POODLE

タンパク質ディスオーダー予測

SGCAL

糖鎖断片化解析ツール

PAPIA

並列タンパク質情報解析システム

WoLF PSORT

タンパク質細胞内局在化予測ソフト

何を優先したらよいのかしらん?

2011年6月26日日曜日

ggplot2で美円グラフを簡単に書く方法。

統計解析ツールRにはggplot2というパッケージがあり、このパッケージを使うことで
美しいグラフが書ける。最初から引用で恐縮だが、(以下引用)
Rによるオープン・データの可視化(2) - @IT http://www.atmarkit.co.jp/fcoding/articles/stat/04/stat04a.html

ggplot2は、Rユーザーの間ではデファクトスタンダードのツールとなっているグラフィックパッケージです。
ggplot2の設計思想には、SYSTAT Software Incの計算機科学者 Leland Wilkinson氏が提唱する「グラフィック文法(The Grammar of Graphics)」というものがあります。この「グラフィック文法」は、見栄えの良いグラフを作るという非本質的な作業にユーザーに注力させるのではなく、データが本来持っている姿をグラフに反映させることを目指して提唱されているルールです。
(引用終わり)

とのことらしい。とはいえ、ggplot2のヘルプは体系化されているものの、とっつきにくいので、簡単に
円グラフを綺麗にかきたいわん、というときに参考になればと思い、筆を取った。
とはいえ、残念ながらこれもこの記事<http://www.r-bloggers.com/ggplot-and-concepts-%E2%80%94-what%E2%80%99s-right-and-what%E2%80%99s-wrong/>を大いに参考にしている(笑)
最初にggplot2のライブラリをインストールしていないかたは、ggplot2のパッケージのインストールをしておいてほしい。
さあ、無限のかなたへ一歩ずつ。

library(ggplot2)
pet <- data.frame(animals=c("dog", "cat","hamster","rabbit"), val=c(80,50,10,7))
pet
#円グラフ
ggplot(pet, aes(x="", y=val, fill=animals)) + geom_bar(width=1) + coord_polar("y")
#ちなみにデフォルトの円グラフで書くとこんな感じになる。
pie(pet[,2],labels=pet[,1],clockwise=TRUE)

+ geom_bar(width=1)までで止めると棒グラフが書けます。 もう少し詳しい解説は後で追加するかも。デフォルトだとアルファベット順に要素が並んでます。 これで取り急ぎ、きれいな円グラフを書くことは出来ます。
ggplot2を使用した場合
ggplot2を使用しない場合(pie)

ほら、全然イメージ違うでしょ?

2011年6月15日水曜日

CBRC 統合DB情報基盤サイトの調査

上記タイトルの調査を行なっている。2~3回の調査で紹介できるものを見つけたい。
ここではCBRCで開発しているウェブツールの網羅的横断検索の手段という感じ?
そして並列・分散処理を行うことで計算機資源の有効活用で時間短縮が可能。

以下 CBRC 統合DB情報基盤サイトより(引用)

「ワークフロー」技術開発について
従来、ソフトウェアやデータベースごとにアクセスし手間と時間がかかっていた一連の処理をまとめ、自動的に分散し短時間に効率よく行うワークフローを開発します。CBRCでは、まずタンパク質の構造解析支援のワークフローを手始めに、利便性が高く、有用なものを目指して開発する予定です。

CBRCでは以下のタイプのワークフローを開発します

*WEBベースワークフロー                      
ブラウザー経由でWEBサーバにアクセス、入力し計算終了後結果をブラウザーで見ます。

*Activeワークフロー(ユーザ定義型ワークフロー)
ユーザのPC又はサーバにて、ワークフロープラットフォームを使用し、ユーザが望むワークフローを実行します。ユーザは様々な設定(実行部品の指定、パラメータ等)を指定することが可能です。
(引用終わり)

普段CBRCのセミナーを聞いている感じだと、既存のソフトウェア(配列相同性検索、構造予測検索など)
に対して、特定の領域に強かったり(ディスオーダー予測、同じ文字が続く場合の検索)
リガンド結合部位に着目した予測だったり、検索結果を早くしていたり、といった工夫を行った研究を
まとめてDBとして公開しているイメージである(あくまで私感)

それらを駆使して、通常の場合には一つのDB検索を行った結果はあくまで一つだが、その検索結果を利用してさらに検索をかける、もしくは検索を行なっている途中の段階の結果を利用して他のDB内の検索を行っているらしい。この結果を参照することでそれぞれのソフトウェアの強みがおそらく出て、他のソフトウェアの検索結果を参照できることと、思いがけない良い結果を他のソフトウェア経由で分かるのかもしれない。

Localでできるらしいワークフローknime_2.3.4を使用して実験中。
KNIME(ナイムとは 以下 http://d.hatena.ne.jp/makiyamakoji/20090714/p1 より引用)
KNIME(ナイムと発音する)は、モジュール型データ探索プラットホームです。これは、ユーザが視覚的にデータフロー(パイプラインともいう)を作成したり、解析ステップを選択的に実行したり、データとモデル上の対話的ビューを通して後から結果を調査することを可能にします。
(引用終わり)

2011年6月1日水曜日

統合TV お役立ち小ネタ

☆忘れがちな編集作業をここにメモ的に書いておきます。(20110914改訂)


*ロゴ等は
C:\togotv\100225_title_templateから取得。
使用する画像は
101224opening.png
101126endtitle_01.png
101126endtitle_02.png
TogoTV_mini_logo.png
メディアからインポートでもいいし、ドラッグアンドドロップでもタイムライン上に貼れる。

*常に統合ロゴは存在するようにすることに注意。
TogoTV_mini_logo.png

*タイトルは
最初
101224opening.pngを4秒
フェードを1秒
塗りつぶし角丸四角形を2つ
タイトルと日付(版)を入れる

最後
フェード(ブラック)を1秒
101126endtitle_01.pngを3秒
フェードを1秒
101126endtitle_02.pngを3秒

*チェックを入れてもらう前の確認事項(一部)
togoTV_mini_logoは画面切り替え以外全てに入っていること。
文字は全てヒラギノ丸ゴ Pro W4 の28point になっていること。
改行がうまくいっていること。

*カムタジアスタジオが落ちたときの対処法。
半落ち(動作が怪しい)の場合は事前に保存して切ってしまう。
終了を選択しても終了しなくなってしまった場合はタスクマネージャーを使ってカムタジアスタジオ
だけを強制終了してしまうのも一つの案。
以下その様子をキャプチャで示しておきます。
スタートボタン→プログラムとファイルの検索に”タスク マネージャー”と入力→タスクマネージャーを選択、起動

もしくはCtrl + Shift + Esc キーで起動。(こちらのほうが簡単かも)

Camtasia Studio を選択し、タスクの終了をクリック
タスクから消えていたら終了できたはずです。

PCのご機嫌を伺いつつ、再起動します。
(他にもいい案がありましたら教えてください)


あと、なんだかんだ言っていますが、カムタジアはステキなソフトだと思っています><。!!








動画のアップ方法で引っかかりがちなこと。
詳しい動画のアップ方法は司令部(牧場内部からのみ)
GHQ/wiki/HowToMakeTogoTV にあるのでそれを参考にすべし。
日記で改行が無くなってしまったら、半角が抜けていないか気にすべし。
色々引っかかったら、前のうまくいっている人のものをテキストエディタ等でコピペして、内容を変更するのが早いかも。
紹介の本文中 " が半角だとDiaryのアップに支障が出るので ” (全角)にすべし。

他にも気になることがあったら追加してちょ~~