2011年2月18日金曜日

語のメモ seqintra meeting (TOM/SAM, sudry, pvalue,refseq,ガンマ分布 etc.

general translocase of the outer membrane (TOM complex) and the sorting and assembly machinery (SAM complex), which is dedicated to β-barrel proteins. The SAMcore complex consists of three subunits, Sam35, Sam37, and Sam50, that can associate with a fourth subunit, the morphology component Mdm10, to form the SAMholo complex.
by http://www.jbc.org/content/281/32/22819.full

sundry 【形】
    いろいろな、種々{しゅじゅ}の、種々{しゅじゅ}さまざまな、いくつかの、数人{すうにん} 
    by eijiro

p値

【仮名】pち
原文】p-value

統計用語。ある実験中に群間差が偶然生じる可能性を示す尺度例えば、p値が0.01(p=0.01)というのは、この結果を偶然生じることが100回に1回あることを意味する。p値が小さくなるほど、それだけ群間差は治療により生じている可能性が高くなる。

by PDQ®がん用語辞書

有意確率 p value

統計的仮説検定において,帰無仮説のもとで得られた検定統計量実現する確率例えば,正規分布において標準得点が 1.96 以上となる確率は 2.5%。有意確率がまえもって定め有意水準より小さ場合帰無仮説棄却し,大き場合帰無仮説採択する。

by 統計学用語辞典


NCBI Reference Sequences The Reference Sequence (RefSeq) collection aims to provide a comprehensive, integrated, non-redundant, well-annotated set of sequences, including genomic DNA, transcripts, and proteins. RefSeq is a foundation for medical, functional, and diversity studies; they provide a stable reference for genome annotation, gene identification and characterization, mutation and polymorphism analysis (especially RefSeqGene records), expression studies, and comparative analyses.
by http://www.ncbi.nlm.nih.gov/RefSeq/


by統計学用語辞典

統計学用語辞典統計学用語辞典

ガンマ分布


Excel にはgammadist,gammainvという関数用意されている。

ガンマ分布
Γ ( λ ) はガンマ関数である。
ガンマ分布
図 1.ガンマ分布の概形

この分布で,λ = 1 すなわち,Γ ( 1, α ) は,f ( x ) = α e - α x となり,これは指数分布である。
平均 E ( x ) ,分散 V ( x ) は
E ( x ) = λ / α, V ( x ) = λ / α2
である。

ガンマ分布

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2010/10/25 18:58 UTC 版)
確率論および統計学において、ガンマ分布 (gamma distribution) は連続確率分布の一種である。ガンマ分布の確率密度関数は、ガンマ関数を用いて次のように表される。
 f(x) = x^{k-1} \frac{e^{-x/\theta}}{\Gamma(k)\,\theta^k} 
 \ \ \ \ \mathrm{for\ } x > 0
ここで、ガンマ分布の形状母数 k > 0、尺度母数 θ > 0 である。
ガンマ分布の累積分布関数は、不完全ガンマ関数を用いて次のように表される。
 F(x) = \int_0^x f(u)\,du  
  = \frac{\gamma(k, x/\theta)}{\Gamma(k)}
ガンマ分布の確率変数X とするとき、平均 E(X) および分散 V(X) は次のように表される。
\begin{matrix}
  E(X) = k \theta \\
\\
  V(X) = k \theta^2
\end{matrix}
ガンマ分布は再生性を有する。すなわち、パラメータに k1θ を持つガンマ分布の確率変数を X1、パラメータに k2θ を持つガンマ分布の確率変数を X2 とするとき、確率変数が X1 + X2 であるガンマ分布のパラメータは k1 + k2θ である。
k整数である場合、このガンマ分布はアーラン分布となる。特にk = 1 である場合、このガンマ分布はパラメータに θ を持つ指数分布となる。また、パラメータに θ を持つ互いに独立な n 個の指数分布の和は、パラメータに nθ を持つガンマ分布(アーラン分布)となる。
k半整数であり、かつ θ = 2 である場合、ガンマ分布はカイ二乗分布となる。

2011年2月15日火曜日

ごのメモ

配列プロファイル法(モチーフ法,フィンガープリント法)

あるファミリー中のタンパク質に共通するアミノ酸配列パターン(配列プロファイル,モチーフ,フィンガープリント,などの名称でよばれる) をあらかじめ定義しておけば,与えられたタンパク質の配列がそのパターンをもつかどうかを調べることによって,そのタンパク質がそのファミリーに属するか どうかを判定することができる.そのような方法を,配列プロファイル法,モチーフ法,フィンガープリント法,などとよぶ.

PMF(ペプチドマスフィンガープリント)法

タンパク質を消化して得られるペプチドのプロファイルを元にデータベースとの照合によりタンパク質同定を行います。
純度の高いタンパク質が得られる場合にお勧めです。

高い純度のタンパク質をトリプシン等の消化酵素で処理すると、酵素の特異性に従ってタンパク質は消化され、個々のタンパク質のアミノ酸配列に応じたペプチ ドに分解されます。生ずるペプチドの種類は、個々のタンパク質に特有のものですので、得られる複数の消化ペプチドの質量を測定することにより同定が可能と なります。
http://theravalues.com/services/pro_pmf.html

フットプリント法
footprinting
タンパク質がDNAに結合する部位を調査する手法。DNaseがタンパク質の結合したDNAは分解しない性質を利用し、タンパク質の結合したDNAをDNaseで処理し、ゲル電気泳動することでタンパク質の結合した部位がバンド上では抜け落ちたようになる。
http://dict.xii.jp/bio/cgi-bin/view.cgi?1316&bio_dictionary

Ubiquitin is a small regulatory protein that has been found in almost all tissues (ubiquitously) of eukaryotic organisms. Among other functions, it directs proteins recycling.
(Wikipedia)

2011年2月10日木曜日

語のメモ(ハイスループットスクリーニング)

ハイスループットスクリーニング (High throughput screening)

ハイスループットスクリーニングとは、膨大な種類の化合物から構成される化合物ライブラリーの中から、自動化されたロボットなどを用いて、創薬ターゲットに対して活性を持つ化合物を選別する技術をいいます。
ハイスループットスクリーニングにより、保有している大量の化合物の中から、短時間で目的とするターゲット分子に親和性を有する化合物の探索を行えることが可能になりました。そのため、現在では、多くの製薬企業で採用されています。
し かしながら、一見効率的に見えるハイスループットスクリーニングではありますが、問題点がないわけでもありません。たとえば、運用開始時における化合物の 収集、装置の導入、化合物やアッセイ結果を生理するためのデータベースの構築や、運用時における化合物、装置、ソフトウェアの保守などに多大なコストかか ります。
(http://www.pharmadesign.co.jp/k/%E3%83%8F%E3%82%A4%E3%82%B9%E3%83%AB%E3%83%BC%E3%83%97%E3%83%83%E3%83%88%E3%82%B9%E3%82%AF%E3%83%AA%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0.html より引用)

2011年2月8日火曜日

劇団だるいの宣伝(新作っとな)

我がいとしの先輩と後輩が出られる劇、劇団だるいの宣伝です。
この劇団、は、裏切りません。あたたかくなることまちがいなしです。

・劇団だるい第5回公演「 流星キャッチャー 」
・日時:2011年2月25日(金)~27日(日)
・場所:しもきた空間リバティ
・料金:前売り1,500円/当日1,800円
・URL:http://darui.ehoh.net

皆さんもぜひ、だるいを!ミニ!
応援してます☆

2011年2月4日金曜日

語のメモ 配列解析

シグナルペプチド
シグナルペプチドは、タンパク質分子にある短い(3から60アミノ酸ほど)ペプチド配列で、シグナル配列、あるいは局在シグナル輸送移行シグナルなどとも呼ばれる。細胞質内で生合成されたタンパク質の、輸送および局在化を指示する構造である。
具体例

  • 小胞体移行:H2N-Met-Met-Ser-Phe-Val-Ser-Leu-Leu-Leu-Val-Gly-Ile-Leu-Phe-Trp-Ala-Thr-Glu-Ala-Glu-Gln-Leu-Thr-Lys-Cys-Glu-Val-Phe-Gln-
  • 小胞体保留:-Lys-Asp-Glu-Leu-COOH
  • 核移行(NLS):-Pro-Pro-Lys-Lys-Lys-Arg-Lys-Val-
  • ミトコンドリアマトリックス:H2N-Met-Leu-Ser-Leu-Arg-Gln-Ser-Ile-Arg-Phe-Phe-Lys-Pro-Ala-Thr-Arg-Thr-Leu-Cys-Ser-Ser-Arg-Tyr-Leu-Leu-
  • ペルオキシソーム(PTS1):-Ser-Lys-Leu-COOH
  • ペルオキシソーム(PTS2):H2N-----Arg-Leu-X5-His-Leu-
小胞体シグナルペプチド
小胞体シグナルペプチドは最も研究の進んでいるシグナルであり、タンパク質分子のアミノ末端(N-末端;H2N-)にある5-10個ほどの疎水性アミノ酸を中心とする配列

(以上wikipediaより)
presequence


(N末側アミノ酸配列) プレ配列, (特に分泌や膜結合のための場合) シグナルペプチド
(by Web LSD)
オルタナティブ スプライシング
図4 スプライシング
(上)転写された加工前のmRNAが三つのイントロン(細い線)を含むことを表す。(下)スプライシングによるイントロンの使い分けにより、例えばこのような完成品として2種類のmRNAをつくることができる(この作り分けをオルタナティブスプライシングとよぶ)。

isoform
 (機能が類似しているがアミノ酸配列の異なる蛋白質) アイソフォーム, イソ型
(Web LSDより)
inadequate
不適切な
expose
曝露 する, 露出 する, 露光 する, 被曝 する, 曝す
(Web LSDより) 
  • ~の過程で
    • in the course of
    • in the process of
    (英辞郎より)
 LAST
What distinguishes LAST from BLAST and similar tools (e.g. BLAT, LASTZ, YASS)?
  • The main difference is that it copes more efficiently with repeat-rich sequences (e.g. genomes). For example: it can align reads to genomes without repeat-masking, without becoming overwhelmed by repetitive hits.
(by http://last.cbrc.jp/)
 
  シーケンスロゴ
 
http://en.wikipedia.org/wiki/Sequence_logo
 
 

2011年2月2日水曜日

Local Blast めも2

低複雑性領域(low complexity region)

タンパク質のアミノ酸配列の中で、少数の種類のアミノ酸が繰り返し現れるような領域のことを、配列の複雑さが低いという意味で低複雑性領域と呼ぶ。このような領域を構成しやすいアミノ酸としては、プロリン(P)、グリシン(G)、グルタミン(Q)、セリン(S)、トレオニン(T)などが挙げられる。また、低複雑性領域を検出するプログラムとしてSEGが知られている。

低複雑性領域の生物学的意味はよく分かっていないが、2次構造を形成しないループ領域の中に低複雑性領域がよく見られる。このような領域は、タンパク質結晶中でも動きやすい構造をとっているためにX線結晶解析では立体構造を決定することができない。このような領域のことをDisorder region(無秩序領域)と呼び、タンパク質の相互作用や基質の認識に関与すると考えられていることから注目を浴びている。
(Rafysta より)

2011年2月1日火曜日

20110201 ラボミーティング

トポロジー
2つのタンパク質構造で、αヘリックス、βストランドの空間位置が同じで、その間の高分子鎖の
つながり具合も等しい。(引用 蛋白質の立体構造トポロジーとフォールディング 高田彰二)

brute

荒々しい、凶暴な
PHECOM/GHECOM
大小2種のプローブ球を用いて蛋白質表面からポケット形状部を発見するプログラム
http://bsw3.naist.jp/courses/courses501.html
SketchSort法
データー点の集合が与えられたら、集合中の任意の2点間の距離がある閾値以内のペアー(近傍ペアー)を全て求める問題(全点間類似度検索)を高速に解くための方法
http://d.hatena.ne.jp/tb_yasu/20100911/1284207891

Screening(by Wiki)
investigation of a great number of something (for instance, people) looking for those with a particular problem or feature.