修士論文予稿集の雛型

Similar documents
Microsoft PowerPoint _生物配列解析基礎_3回目.pptx

Hi-level 生物 II( 国公立二次私大対応 ) DNA 1.DNA の構造, 半保存的複製 1.DNA の構造, 半保存的複製 1.DNA の構造 ア.DNA の二重らせんモデル ( ワトソンとクリック,1953 年 ) 塩基 A: アデニン T: チミン G: グアニン C: シトシン U

PowerPoint プレゼンテーション

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

NEWS RELEASE 東京都港区芝 年 3 月 24 日 ハイカカオチョコレート共存下におけるビフィズス菌 BB536 の増殖促進作用が示されました ~ 日本農芸化学会 2017 年度大会 (3/17~

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

5_motif 公開版.ppt

C3 データ可視化とツール

Microsoft PowerPoint - DNA1.ppt [互換モード]

スライド 1

PowerPoint Presentation

物学的現象をはっきりと掌握することに成功した論文である との高い評価を得ています 2. 研究成果ブフネラゲノムの全塩基配列の決定に当たっては 全ゲノムショットガンシークエンス法 4 を用いました 今回ゲノム解析に成功したのは エンドウヒゲナガアブラムシ (Acyrthosiphon pisum) の

生命情報学

博士学位論文審査報告書

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - 10.pptx

Microsoft Word - 断面諸量

画像類似度測定の初歩的な手法の検証

連続講演会 東京で学ぶ京大の知 シリーズ 16 社会に浸透する情報技術第 2 回 ゲノム情報のコンピュータ解析 高校数学 +α による先端的解析手法 京都大学が東京 品川の 京都大学東京オフィス で開く連続講演会 東京で学ぶ京大の知 のシリーズ 16 社会に浸透する情報技術 9 月 22 日の第 2

Microsoft Word - K-ピタゴラス数.doc

問 題

カメラレディ原稿

東邦大学理学部情報科学科 2014 年度 卒業研究論文 コラッツ予想の変形について 提出日 2015 年 1 月 30 日 ( 金 ) 指導教員白柳潔 提出者 山中陽子

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

表紙.indd

2. 手法まず Cre 組換え酵素 ( ファージ 2 由来の遺伝子組換え酵素 ) を Emx1 という大脳皮質特異的な遺伝子のプロモーター 3 の制御下に発現させることのできる遺伝子操作マウス (Cre マウス ) を作製しました 詳細な解析により このマウスは 大脳皮質の興奮性神経特異的に 2 個

経営統計学

Microsoft PowerPoint - 基礎・経済統計6.ppt

PRESS RELEASE (2014/2/6) 北海道大学総務企画部広報課 札幌市北区北 8 条西 5 丁目 TEL FAX URL:

2

ムーアの法則に関するレポート

<8D828D5A838A817C A77425F91E6318FCD2E6D6364>

二次関数 1 二次関数とは ともなって変化する 2 つの数 ( 変数 ) x, y があります x y つの変数 x, y が, 表のように変化するとき y は x の二次関数 といいます また,2 つの変数を式に表すと, 2 y x となりま

Chap2.key

日心TWS

ボルツマンマシンの高速化

Microsoft Word - lec_student-chp3_1-representative

取扱説明書 [F-05E]

Taro-kariya.jtd

技術資料 JARI Research Journal OpenFOAM を用いた沿道大気質モデルの開発 Development of a Roadside Air Quality Model with OpenFOAM 木村真 *1 Shin KIMURA 伊藤晃佳 *2 Akiy

Gatlin(8) 図 1 ガトリン選手のランニングフォーム Gatlin(7) 解析の特殊な事情このビデオ画像からフレームごとの静止画像を取り出して保存してあるハードディスクから 今回解析するための小画像を切り出し ランニングフォーム解析ソフト runa.exe に取り込んで 座標を読み込み この

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

Acecide_ProductsInformation2010PDF.indd

Microsoft Word - 【広報課確認】 _プレス原稿(最終版)_東大医科研 河岡先生_miClear

NGSデータ解析入門Webセミナー

Microsoft Word - 博士論文概要.docx

数値計算で学ぶ物理学 4 放物運動と惑星運動 地上のように下向きに重力がはたらいているような場においては 物体を投げると放物運動をする 一方 中心星のまわりの重力場中では 惑星は 円 だ円 放物線または双曲線を描きながら運動する ここでは 放物運動と惑星運動を 運動方程式を導出したうえで 数値シミュ

する距離を一定に保ち温度を変化させた場合のセンサーのカウント ( センサーが計測した距離 ) の変化を調べた ( 図 4) 実験で得られたセンサーの温度変化とカウント変化の一例をグラフ 1 に載せる グラフにおいて赤いデータ点がセンサーのカウント値である 計測距離一定で実験を行ったので理想的にはカウ

2014年度 名古屋大・理系数学




Y Y Y w Y

Microsoft Word - 卒業論文.doc

福沢論文

情報量と符号化

報道発表資料 2007 年 8 月 1 日 独立行政法人理化学研究所 マイクロ RNA によるタンパク質合成阻害の仕組みを解明 - mrna の翻訳が抑制される過程を試験管内で再現することに成功 - ポイント マイクロ RNA が翻訳の開始段階を阻害 標的 mrna の尻尾 ポリ A テール を短縮

<4D F736F F D208DC58F498A6D92E88CB48D652D8B4C8ED289EF8CA992CA926D2E646F63>

<4D F736F F D E95F14E565F838C D955F907D90E096BE5F8F4390B394C5816A2E646F63>

学習指導要領

20~22.prt

Microsoft Word - PRESS_

PowerPoint プレゼンテーション

Microsoft PowerPoint - ce07-09b.ppt

表紙

2017年度 千葉大・理系数学

相対性理論入門 1 Lorentz 変換 光がどのような座標系に対しても同一の速さ c で進むことから導かれる座標の一次変換である. (x, y, z, t ) の座標系が (x, y, z, t) の座標系に対して x 軸方向に w の速度で進んでいる場合, 座標系が一次変換で関係づけられるとする

3章 度数分布とヒストグラム

. 角の二等分線と調和平均 平面上に点 を端点とする線分 と を重ならないようにとる, とし とする の二等分線が線分 と交わる点を とし 点 から に垂直に引いた直線が線分 と交わる点 とする 線分 の長さを求めてみよう 点 から に垂直な直線と および との交点をそれぞれ, Dとする つの直角三

< F2D30365F8EF68BC68CA48B E6A7464>

Microsoft Word - 201hyouka-tangen-1.doc

Microsoft Word - 簡単な計算と作図.doc

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

2011 年度第 41 回天文 天体物理若手夏の学校 2011/8/1( 月 )-4( 木 ) 星間現象 18b 初代星形成における水素分子冷却モデルの影響 平野信吾 ( 東京大学 M2) 1. Introduction 初代星と水素分子冷却ファーストスター ( 初代星, PopIII) は重元素を

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

医用工学概論  Medical Engineering (ME)   3年前期の医用工学概論実習と 合わせ、 医療の現場で使用されている 医用機器を正しく安全に使用するために必要な医用工学(ME)の 基礎知識を習得する。

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

3章 度数分布とヒストグラム

A Constructive Approach to Gene Expression Dynamics

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

その人工知能は本当に信頼できるのか? 人工知能の性能を正確に評価する方法を開発 概要人工知能 (AI) によるビッグデータ解析は 医療現場や市場分析など社会のさまざまな分野での活用が進み 今後さらなる普及が予想されています また 創薬研究などで分子モデルの有効性を予測する場合にも AI は主要な検証

学習指導要領

学習指導要領


2017年度 金沢大・理系数学

(Microsoft Word - \207U\202P.doc)

学力スタンダード(様式1)

平成 年 月 7 日 ( 土 第 75 回数学教育実践研究会アスティ 45 ビル F セミナールーム A 札幌医科大学 年 P ab, を正の定数とする 平面上において ( a, を中心とする円 Q 4 C と (, b を中心とする円 C が 原点 O で外接している また P を円 C 上の点と

データ解析

Microsoft Word - 卒論レジュメ_最終_.doc

Untitled

p tn tn したがって, 点 の 座標は p p tn tn tn また, 直線 l と直線 p の交点 の 座標は p p tn p tn よって, 点 の座標 (, ) は p p, tn tn と表され p 4p p 4p 4p tn tn tn より, 点 は放物線 4 p 上を動くこと

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Microsoft Word - 町田・全 H30学力スタ 別紙1 1年 数学Ⅰ.doc

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

因子分析

< 染色体地図 : 細胞学的地図 > 組換え価を用いることで連鎖地図を書くことができる しかし この連鎖地図はあくまで仮想的なものであって 実際の染色体と比較すると遺伝子座の順序は一致するが 距離は一致しない そこで実際の染色体上での遺伝子の位置を示す細胞学的地図が作られた 図 : 連鎖地図と細胞学

学習指導要領

線形代数とは

Transcription:

2010 年度第 6 回情報処理学会東北支部研究会 ( 山形大学 ) 資料番号 10-6-A5-1 バクテリアの塩基配列における文字の含量を用いた解析山形大学大学院理工学研究科応用生命システム工学専攻小池公洋 木ノ内誠 1. はじめに近年多くの生物の全ゲノム配列が決定されている 2010 年 3 月現在 バクテリアでは 1400 種以上の全ゲノム配列が決定されている 決定された配列から生命現象を解明するために 情報学 ( インフォマティクス ) の手法や技術が用いられるようになってきている そのため 情報解析手法の研究と開発が盛んに行われている [1] 解析手法の 1 つとして GC skew 解析がある GC skew は 1 本鎖 DNA 分子における G 含量と C 含量の偏りを表わす指標で (C の個数 -G の個数 )/(C の個数 +G の個数 ) の式で表わされる 生物のゲノム配列は A(Adenine) T(Thymine) G(Guanine) C(Cytosine) の 4 種類の塩基からできている ゲノム全体では A と T G と C の量はほぼ等しいが 局所的な領域ではその量比に偏りが見られる 原核生物のうち真正細菌の多くの種ではゲノム中で明確にその傾向が逆転する個所が見られ その個所が複製開始点 複製終結点と一致することが多いことが知られている [2] 図 1 に 真正細菌の一種であり原核生物の代表的な生物である大腸菌の GC skew 解析を行った結果を示す G が多い領域 C が多い領域があり 複製開始点 複製終結点と一致している GC skew という現象が発生する原因には様々な説が考えられており リーディング鎖とラギング鎖の異なる突然変異確率 コドン使用による変異のバイアスなどによるといわれている しかし 現象が発生する根本的な理由は未だにわかっていない また 図 2 に示すパイロコッカス菌のように GC skew を用いた解析では 複製開始点 複製終結点を予測できないバクテリアも多く存在する [2] GC skew では G と C の組み合わせで解析を行うことに特徴がある 本研究ではこの組み合わせを敢えて使わず 文字の含量を用いることによって解析を行い 全ゲノム配列から生物学的な情報の抽出を試みる 図 2 Pyrococcus abyssi GE5 ( パイロコッカス菌 ) の GC skew 解析 ( 文献 [2]85 ページから引用 ) 2. 方法全塩基配列の中に A T G C の文字の量がどれだけあるか調べる 文字の実際の累積値と平均的な増加率との差を取ることでグラフを描く グラフは横軸に塩基数 縦軸に文字の累積数をとる 実際の累積値と平均的な増加率との差をとることで 塩基配列を 1 次元グラフで表現し そのグラフから生物学的な情報を読み取る 全ゲノム配列データは NCBI [3] からコンプリートゲノムファイルを使用した 3. 結果と考察 3.1 1 文字の含量を用いた解析大腸菌に対して解析を行った結果を図 3 に示す グラフを見ると G と C の値が対称的であり GC skew と同じ特徴がはっきりと表れている 図 3 E.coli( 大腸菌 ) の 1 文字の含量を用いた解析 図 1 Escherichia coli str. K-12 substr. W3110 ( 大腸菌 ) の GC skew 解析 ( 文献 [2]85 ページを改編 ) 1

(a) E.coli( 大腸菌 ) (b) Bacillus subtilis subsp. subtilis str 168 ( 枯草菌 ) (c) Synechococcus sp. WH 8102 ( シアノバクテリア ) (d) Helicobacter pylori 26695( ピロリ菌 ) (e) P.abyssi ( パイロコッカス菌 ) (f) Metallosphaera sedula DSM 5348 図 4 1 文字の含量を用いた解析 図 3 では 登録配列の開始点を変えずにそのまま読み込み グラフ化を行っている しかし ほとんどのバクテリアではゲノムが環状であり 登録配列の開始点は定められておらず その基準は生物種によって異なる そこで本研究では G の値が最小となる位置を読み込みの開始点とし グラフを描く際には各文字で開始点がグラフの原点となるようにした 図 4(a) に G を基準として図 3 を書き換えた例を示す このように開始点を統一することで 各バクテリアのグラフがより比較しやすいものとなる 1 文字の含量を用いた解析をバクテリア 895 種に対して行った これらをグラフの形から いくつかのパターンに分類した 図 4(a)~(f) にそれぞれのパターンの代表的なバクテリアを示す 図 4(a) において A と T は同期し さらに G と C は対称 的な値をとっている このような形のグラフを本研究では 大腸菌型 とする 大腸菌型となるバクテリアは 895 種中 101 種であり 解析を行ったバクテリアの約 12% であった 図 4(b) において A と G は同期し また T と C が同期している さらに A と T(G と C) は対称的な値をとっている このような形のグラフを 枯草菌型 とする 枯草菌型となるバクテリアは 895 種中 144 種あり 解析を行ったバクテリアの約 16% であった 図 4(c) において A と C は同期し また T と G が同期している さらに A と T(G と C) は対称的な値をとっている このような形のグラフを シアノバクテリア型 とする シアノバクテリア型となるバクテリアは 895 種中 234 種であり 解析を行ったバクテリアの約 26% であった 2

図 5 DNA Walk の模式図 ([3] から引用 ) 図 6 E.coli( 大腸菌 ) の DNA Walk 図 7 P.abyssi ( パイロコッカス菌 ) の DNA Walk 図 4(d) において G と C が対称的な値をとっているが A や T は他の文字との同期がみられない このような形のグラフを ピロリ菌型 とする ピロリ菌型となるバクテリアは 895 種中 174 種であり 解析を行ったバクテリアの約 19% であった 図 4(e) または (f) のように 図 4(a)~(d) のどのグラフのパターンにも分類出来ないものを その他 とする その他のバクテリアは 895 種中 242 種であり 解析を行ったバクテリアの約 27% であった 3.2 塩基配列の 2 次元の可視化ここまでの解析ではバクテリアに対して 1 文字の含量を用いた解析という今までにない解析方法で 全ゲノム配列からの有用な生物学情報の抽出を試みた その結果全ゲノム配列をグラフで表すことによって グラフの形で分類できるというバクテリアの特徴を発見した しかしこれらの解析から より文字と文字の関係性を明らかにすることが重要であると考え 新たな解析方法を提案する ここまで解析に用いた特定文字の累積値と平均的な増加率の差を取る方法は 塩基配列の傾向を強く表わすので継続して用いる さらに より文字と文字の関係を明らかにする方法として 塩基配列を 2 次元で可視化する表現方法を提案する 塩基配列を 2 次元で可視化において 先行する解析方法として DNA Walk がある [4] DNA Walk は図 5 に示すように 平面の (0,0) の座標を始点とし 塩基配列に応じて A で右 T で左 G で上 C で下に 1 目盛りずつ進み軌跡を描くことによって 塩基配列を 2 次元で表現する 図 6 および図 7 に 実際に全塩基配列に対して DNA Walk を行った結果を示す 図 6 に示す大腸菌は GC skew に強く傾向が見られる生物種なので 軌跡は複製開始点から上に進み 複製終結点から下に戻ってくる 図 7 のパイロコッカス菌は図 2 からもわかるように GC skew に傾向が見られない生物種なので 軌跡ははっきりとした形にはならない 3

(a) AT グラフ (b) GC グラフ (c) GA グラフ (d) CA グラフ (a) GT グラフ (b) CT グラフ (a) 図 7 E.coli( 大腸菌 ) における 2 次元の可視化 4

本研究で提案する 2 次元の可視化では GC および AT を対にせず 特定文字の累積値と平均的な増加率の差を利用する この値は 4 つの文字 (A, T, G, C) のそれぞれに対してあるので その中から 2 つを選びグラフの軸にする事によって 塩基配列を 2 次元で表現することができる この方法で描いたグラフを図 7 に示す 2 つの文字の組み合わせで 6 通りのグラフ (AT, GC, GA, CA, GT, CT) が描ける この解析方法の利点は平均的な文字の増加率を求める事によって 文字を対にして考える必要がなくなり 様々な文字の組み合わせに対して 2 次元で塩基配列を表現 出来るところである 図 8 に 4 種のバクテリアの GA グラフを示す 図の (a) ~(d) をみるとわかるように生物種によってグラフの形に違いが大きく表れる GA グラフにおいて それぞれの生物種について原点から一番遠い点をプロットし分布図を作ることによって 特徴の発見を試みた 図 9 に結果を示す グラフに示す赤い点は Firmicutes 門に属するバクテリアである 他の生物種と比べて分布がグラフの第 1 象限に偏っている事がわかる 2 次元の GA グラフから分布図を作成する事によって Firmicutes の特徴的な分布を発見できた (a) E.coli( 大腸菌 ) (b) B. subtilis ( 枯草菌 ) (c) H.pylori ( ピロリ菌 ) (d) Synechococcu sp. WH 8102 ( シアノバクテリア ) 図 8 GA グラフの例 5

図 9 Firmicutes とその他の生物種との GA グラフを用いた分布図 4. むすび本研究ではバクテリアに対して 特定の文字の累積数と平均的な増加率の差を取る解析方法により 1 次元で塩基配列を表現し 全ゲノム配列からの有用な生物学情報の抽出を試みた 全ゲノム配列をグラフで表すことによって グラフの形で分類できるというバクテリアの特徴を発見した さらに 塩基配列を 2 次元で表現する事によって Firmicutes の他のバクテリアにはない特徴を発見した 1 次元の解析でも Firmicutes は図 4 の (b) に示す 枯草菌型 として特徴を表わしていた ただし 1 次元の解析ではグラフの形を判断することにより分類を行っていた 一方 2 次元の可視化では図 9 に示す分布図のように より客観的に解析結果を見ることが出来る 参考文献 [1] http://www.chart.co.jp/subject/joho/inet/inet09/inet09-1. pdf. [2] 片山敏明他, オープンソースで学ぶバイオインフォマティクス, 東京電機大学出版局, 2009. [3] NCBI, http://www.ncbi.nlm.nih.gov/. [4] Poptsova MS, Larionov SA, Ryadchenko EV, Rybalko SD, Zakharov IA, Loskutov A, Hidden chromosome symmetry: In silico transformation reveals symmetry in 2D DNA walk trajectories of 671 chromosomes, PLoS One, 4(7): e6396, 2009. 6