2012年6月26日火曜日

創薬・疾患研究のための横断検索 "Sagace" について


4月から大阪の医薬基盤研究所で,統合DBプロジェクトに携わっている。

端的に言うと,厚労省関係のデータベースを統合するプロジェクトだ。
こんな若造にそんな大事な業務を任せてしまっていいのか,と思うこともあるけど
色々な方の助けをいただきながら,やりがいを持ってやっている。

主なお仕事は以下の3つ。

1.疾患・創薬に関わるデータベースの横断検索システム "Sagace" の改良
2.医薬基盤研究所内のデータのRDF化
3.厚労省関係期間のデータベースのカタログ化

である。2,3についてはまたお話するとして,今日は1.についての
お話をしたいと思う。
去年度 keybotさんが中心となって開発して下さった Sagace の業務を引き継いでいる。
まずは,使ってみて欲しい。色々いじってみて欲しい。

http://sagace.nibio.go.jp

私は皆さんの使い方を見させていただいて,改善に活かすつもりだ。

ここしばらく,横断検索に大切な物は何か,ということを考えてきた。
横断検索において大事だと一般的に言われていることは,速さと正確さ,である。
そして,一般的な 改善 において大事なことは,今ある機能を磨き上げるか,
新しい機能を足すか,ではないかと思っている。

この一週間くらい,ずっと何を優先すべきかについても悩んでいた。
できる事もやるべきことも山のようにあって,ゴールをどう設定すべきか,
それに向けて今の自分には何が出来るか,考えていた。

色々考えたけど,今は,今ある機能を磨き上げることを優先することにした。
アタリマエのことかもしれないけど,飲食店において数少ないメニューを
すごく美味しくすることやプリンターにとって紙詰まりのないプリンターを
開発するのは非常に大事なことだと思ったからだ。
問題は,それを目に見える成果,に結びつけるのが,難しいということだけど
とにかく利益を出すことが今の目的ではないし,
相手に評価して貰う前に自分で納得の行くものをつくり上げることが
大事だと思うことにした。

そして,使ってもらえると分かると思うけれど,速さにおいては,まだまだで,
今週からしばらく速くするために考えられる手段を1つずつ試してみることにしている。
気になるのは,Hyper Estraierというちょっと古い(かもしれない)システムを
使っていることと連携先にアクセスすることがボトルネックになっている場合には,
解決が難しいということだ。

説明が遅くなったし,Sagaceには詳細に記述していないけれど,
この横断検索システムはNBDC(National Bioscience Database Center )が
中心となって進めている4省連携のデータベース統合プロジェクトの柱の一つでもある。
他の連携機関(NBDC<開発されたのはDBCLS←文科省担当>,
Medals←経産省担当,NIAS←農水省担当)のデータも使わせていただいている。
具体的には,検索の都度P2Pで直接連携機関にアクセスしてインデックス
(この場合のインデックスは索引と事前に集めてきたデータの概要)の
データを取得している。また,こちら(医薬基盤研究所)で提供している
インデックスも提供している。
また,その連携により,データベースのインデックスをそれぞれの
サーバーに分散させることになり,検索が早くなるというHyper Estraierの強みも
活かせることになるらしい。

データベースの統合においてそれぞれの省庁担当の研究所で横断検索システムを作る
意義はあるのかとか,作ったところでどうしたら使ってもらえるのかとか,
意義を高めるためにはもっと違う工夫がいるのではないかとか,
他の研究所ではもっとすごいことしているんじゃないかとか,
企業では,もっとゴリゴリ出来る人が集まっているなら,
一瞬で出来るんじゃないかとかそんなことを考えると止まらなくなるけど,
今はシンプルにできる事を考えて,今ある機能を磨き上げたいと思う。
そんなことをしているうちに見えてくることもあるかもしれないし。
他のプロジェクトとも関連付けられるかもしれないし。

また,速さに対して,正確さにおいてもまだまだだと思っている。
そもそも何をもって正確さとするかというと
また面倒で,一般的な検索を評価する指標を導入すればすぐかもしれないけど
ターゲットを絞った横断検索システムにも,それをそのまま使っていいのかとか
それがユーザーの求めていることに合致するのかとか,
ユーザーが求めていることに,どこまでとらわれるべきなのか,とか,
そんなことを考えだすと止まらない。

でも,結局最近至った結論としては,シンプルに考えて
皆さんが使った結果のログから,どういう経路をたどっているのか,
ということを見つめて,使われていないものは消すか,
ちょー後ろに追いやることにしようと思います。
当然の行為をまずは行います。
それだと,少数派にやさしくないじゃんってことになりますが,
少数派にも優しい検索と統合DBプロジェクトらしい工夫に関するアイデアはあります。
ただ,実装するのはもう少し後になりそうです。

まずは,足元を固めて,店のオーナーが自信を持ってお届け出来る
シンプルだけど美味しい横断検索を作って行きたいと思います。
それが出来たら,新メニューを掲げられればと思っています。

というわけで協力してもらえればと思います。
ただ,検索してもらえるだけでいいです。
ただ沢山の人に検索してもらいたい,と,今はそれだけです。

http://sagace.nibio.go.jp/

と,まあぁ長く書いた割にはまとまりのない文章ですが,
最近はこんなことをやっています。
他のお仕事も色々やっているけど長くなるのでまた後で。
一人で悶々としているのも大事だけど,
(このブログを書く前にも何人かの方に相談させていただいて,
大変感謝しています^^。)
遠くにいる人ともお話しつつ改善したいと思っているのでご意見幅広く募集しています☆

この日記へのコメントでもいいし,@maoringoでもいいし,メールでもsagaceの
お問い合わせでもOKです。
よろしくお願いします◎







0 件のコメント:

コメントを投稿