Microsoft PowerPoint - lecture a.pptx

Size: px
Start display at page:

Download "Microsoft PowerPoint - lecture a.pptx"

Transcription

1 応用生命科学 情報生命学第 3 回配列解析入門 7 月 14 日 ( 木 ) 3 時限目加藤有己大阪大学大学院医学系研究科講義資料 授業目的 情報科学と生命科学の融合領域である情報生命科学の基本的な手法を理解することを目的とする 日程 3 時限目 4 時限目 6 月 30 日 ( 木 ) ゲノム配列決定とトランスクリプトーム ( 大島 ) 7 月 14 日 ( 木 ) 配列解析入門 ( 加藤 ) 7 月 21 日 ( 木 ) システムバイオロジー基礎 I ( 佐藤 ) 7 月 28 日 ( 木 ) 全ゲノム解析概説 ( 金谷 ) 新型シーケンサーを利用した転写制御機構の解析 ( 大島 ) RN 配列情報解析 ( 加藤 ) システムバイオロジー基礎 II ( 佐藤 ) 代謝シミュレーション概説 ( 金谷 ) 成績評価 レポートおよび講義中に適宜行う小テストにより評価する 2 3 バイオインフォマティクス ( 生命情報学 ) Bonformatcan の仕事 分子生物学のセントラルドグマ ( 現代版 ) 生物学と情報学の学際領域の学問分野 目的 生物データに対する情報解析技術の開発 情報解析技術を利用した新たな生物学的知識の発見 生物学の実験技術の革新 ( 例 : 次世代シークエンサー ) 大量のデータ ウェット ( 実験 ) とドライ ( 解析 ) の協力が不可欠 データベース構築 実験解析により得られた大量のデータを整備 アルゴリズム開発 数理的 情報科学的手法を駆使して 生物データを解析するアルゴリズムを開発 データ解析 既存のソフトウェアを使ってデータを網羅的に解析し 生物学的知識を発見 遺伝情報伝達の基本原理 ゲノム エピゲノム トランスクリプトーム プロテオーム DN 塩基配列 DN のメチル化 ヒストンの修飾クロマチン構造 mrn, non codng RN タンパク質 メタボローム フェノーム 代謝物 表現型 生物配列 (bologcal sequence) 分子生物学データベース DN 配列 4 種類の塩基,,, からなる文字列 例 : RN 配列 4 種類の塩基,,, U からなる文字列 例 : UUUUUUUUU アミノ酸配列 ( タンパク質配列 ) 20 種類のアミノ酸,, D, E, F,, H, I, K, L, M, N, P, Q, R, S,, V, W, Y からなる文字列 例 : PDVKVEYKYNDDDFVKVDKELFNRWN ( 注 ) 各文字はそれぞれ化学構造を持つ 種類 名称 URL 核酸配列 NBI 核酸配列 EN 核酸配列 DDBJ 配列リード SR RNファミリー Rfam 代謝ネットワーク KE

2 配列アラインメント 配列が似ていれば機能も似ている 配列アラインメント 与えられた複数の配列において文字間の対応付けをとること ( またはその計算結果 ) 並べて比較する アラインメント 本の配列 ペアワイズアラインメント 3 本以上の配列 マルチプルアラインメント ペアワイズアラインメント 配列 s, r に対するグローバルアラインメント 各配列にギャップ記号 - を挿入して同じ長さにそろえた配列の組 (s, r ) 入力 s: r: 文字同士の対応関係の明確化 ( 注 ) ギャップ記号は同じ位置に並ばない アラインメント s : - - r : - 最適アラインメント アラインメントをスコアで定量化 DN 塩基に対するスコア関数 ( 一致 不一致スコア ) アラインメント s - - r - アラインメントスコア S(s, r ) = w(, -) + w(, ) + w(, ) + w(-, ) + w(, ) + w(, ) + w(-, ) = = - 1 可能なアラインメントの中でスコア最大のものを求める 単純な列挙法によるアプローチ 動的計画法 (DP) による最適アラインメント DP の表とアラインメントグラフ 仮定 : s = r = n (s も r も長さが同じ ) アラインメントにおいて各配列の文字をギャップを無視し先頭から1 個ずつ交互に取り出して得られる列 ( 挿入列 ) は 元のアラインメントと1 対 1 対応 例 s 1 s 2 s 3 - s r 1 - r 2 r 1 r 1 s 2 s 3 r 2 r 3 ( 長さ2n) 3 挿入列の総数 (= 可能なアラインメントの総数 )!! Strlng の公式! 2 指数個 単純な列挙法では指数時間かかる! 効率良く最適解を探索する必要がある s = s 1 s 2 s n, r = r 1 r 2 r m : 入力配列 Needleman Wunschのアルゴリズム (1970) F(, ): s[1..] と r[1..] に対する最適アラインメントスコア 初期化 反復 ( 漸化式 ) DP は部分問題の解からより大きな問題の解を効率よく計算する手法 DP (dynamc programmng) table (4, 0) (0, 5) 文字は と の間に書く F(, ) の値に対応 lgnment graph (4, 0) 1 (0, 5) w(s, r ) が基本単位となるように矢印と重みを書き込む ここでは一致 1 不一致 ギャップ 初期化 (4, 0) 1 0, 0 0, 0 0,, 0, 0,, 反復 ( 漸化式 ) 1 1, 1, max, 1 1,1, (4, 0)

3 トレースバック コラム : アルゴリズムと計算量 最終結果 (4, 0) 頂点 から頂点 (n, m) への最大重みパス 最適アラインメント - 最終結果 F(n, m) の値は最適アラインメントのスコア 最適スコアを実現するアラインメントそのものは? F(n, m) から逆にたどりながらアラインメントを後ろから前へと計算 ( トレースバック ) 漸化式の計算過程で最大値を与える頂点 ( 位置 ) を記憶すればよい (n, m) 計算量を入力サイズ n の関数で表現 計算機環境や実装プログラムに依存しないアルゴリズムの効率を計る尺度 漸近的増加率が大きい項で代表 例 : 4n 3 +3n 2 +2n+1 O(n 3 ) O(n 2 ) 時間のアルゴリズムは O(n 3 ) 時間のアルゴリズムより優れている Needleman Wunsch のアルゴリズムの計算量 アフィンギャップスコア 線形ギャップとアフィンギャップの比較 漸化式において 添え字の動く範囲を考える 時間計算量 ( どれだけの計算時間が必要か?) O(nm) n mのとき O(n 2 ) 領域計算量 ( どれだけのメモリが必要か?) O(nm) n mのとき O(n 2 ) 1 n 1 m ギャップはバラバラよりも固まって出現する傾向が大きい 線形ギャップスコア vs. アフィンギャップスコア 線形ギャップスコアアフィンギャップスコア ギャップ開始 ギャップ伸長 e -e -e ただし d > e > 0 アフィンギャップスコアはより現実に即したスコア ギャップスコア関数をグラフ化すると理解しやすい 線形ギャップスコア : アフィンギャップスコア : 0 1 k アフィンギャップスコアを用いたアラインメントアルゴリズム 3 種類のテーブル M, I x, I y を用いた動的計画法 いずれも s 1 s と r 1 r のアラインメントスコアを表す s と r がマッチ グローバル vs. ローカル 全体でのアラインメント 長い配列の比較では必ずしも全体としては類似していない ローカルアラインメントの単純な計算法 各配列の全ての部分文字列の組に対してグローバルアラインメントを計算 その中で最も高いスコアとなるアラインメントを出力 s 時間計算量 領域計算量はともに O(nm) s とギャップがマッチ r とギャップがマッチ 連続した部分領域間のアラインメント ( ローカルアラインメント ) r O(nm) O(n 2 ) O(m 2 ) = O(n 3 m 3 ) 時間! グローバル sの部分列アラインメントの個数 r の部分列の個数

4 ローカルアラインメントアルゴリズム Smth Warterman のアルゴリズム (1981) DP の漸化式 最適スコアは F(, ) の中での最大値 トレースバックは最大値から始めて 0 になる時点で終了 時間計算量 領域計算量はともに O(nm) ローカルアラインメントの例 DPテーブル スコア関数, 1 1 ローカルアラインメント -,, 1 スコア行列 w(x, y) DN 塩基 一致 不一致スコア タンパク質アミノ酸 類似度を反映したスコア 多数のアラインメントからスコアを算出 M: ある確率分布に従ってギャップなしアラインメントを生成するモデル p ab : アミノ酸 (a, b) が同じ列に出現する確率 各列は独立に生成される R: 2 本の配列をランダムに生成するモデル q a : アミノ酸 a が出現する確率 s, r: ともに長さ n のアミノ酸配列 スコア行列の導出 ホモロジー検索 オッズ比 ( アラインメント (s, r) がランダムな場合と比較してどの程度出現しやすいかを表す ):,, データベースに対する類似配列の検索 問い合わせ配列 配列データベース 類似配列 対数オッズ比 スコア関数 対数オッズ比 = アラインメントスコア p ab, q a は実際のアラインメントから出現頻度を計算 ( にわとりと卵 ) 応用例 : PM 行列 [Dayhoff et al. 1978], BLOSUM 行列 [Henkoff & Henkoff 1992] 局所的に類似する配列検索 データベース中の配列と数百万回のアラインメント O(nm) 時間アルゴリズムでは時間がかかりすぎる! 最適性を犠牲にして高速に類似配列を検索 ( ヒューリスティクス ) FS [Lpman & Pearson 1985] BLS [ltschul et al. 1990] BLS: Basc Local lgnment Search ool BLS におけるシード 2 段階伸長法 BLS サーバーを使ってみよう 両配列のドットマトリックス上で完全一致 ( または非常に類似したギャップなしの ) 領域 ( シード ) で 同じ対角線上にある近接ペアを検出 Query arget 第 1 段階 : シードのペアを対角線方向に沿ってギャップを含めず前後に伸長 統計的に有意なアラインメントのみを考慮 HSP (Hgh scorng Segment Par) 第 2 段階 : HSP を連結させて DP によるギャップありローカルアラインメント 統計的有意度を計算 Query arget シードだけに着目して HSP を構成するため 探索空間の大幅な削減が可能 [ltschul et al. 1997] 塩基配列なら Nucleotde BLS を選択 アミノ酸配列なら Proten BLS を選択

5 Standard Nucleotde BLS の入力画面 Nucleotde BLS サーバーの出力画面 まとめ 問い合わせ配列入力 データベース選択 アラインメントスコアの分布 配列アラインメントはバイオインフォマティクスで古くから使われ 今なお有用である手法 グローバルアラインメント ローカルアラインメント 動的計画法 (DP) は配列解析を支える根幹技術の 1 つ 大量の配列検索のためのヒューリスティクス アラインメント結果 実行 参考文献 阿久津達也 バイオインフォマティクスの数理とアルゴリズム 共立出版 2007 年 吉川寛 伊藤隆司 上野直人 佐々木裕之 中井謙太 ゲノム科学の基礎 岩波書店 2009 年 日本バイオインフォマティクス学会 バイオインフォマティクス事典 共立出版 2006 年 Durbn, R., Eddy, S., Krogh,. and Mtchson,., Bologcal Sequence nalyss, ambrdge Unversty Press,

Microsoft PowerPoint - lecture a.pptx

Microsoft PowerPoint - lecture a.pptx 本日 (3 時限目 ) の内容 バイオインフォマティクス ( 生命情報学 ) 応用生命科学 情報生命学第 3 回配列解析入門 生物学と情報学の学際領域の学問分野 目的 生物データに対する情報解析技術の開発 情報解析技術を利用した新たな生物学的知識の発見 生物学の実験技術の革新 ( 例 : 次世代シークエンサー ) 大量のデータ ウェット ( 実験 ) とドライ ( 解析 ) の協力が不可欠 2 3

More information

A Constructive Approach to Gene Expression Dynamics

A Constructive Approach to Gene Expression Dynamics 配列アラインメント (I): 大域アラインメント http://www.lab.tohou.ac.jp/sci/is/nacher/eaching/bioinformatics/ week.pdf 08/4/0 08/4/0 基本的な考え方 バイオインフォマティクスにはさまざまなアルゴリズムがありますが その多くにおいて基本的な考え方は 配列が類似していれば 機能も類似している というものである 例えば

More information

生命情報学

生命情報学 生命情報学 5 隠れマルコフモデル 阿久津達也 京都大学化学研究所 バイオインフォマティクスセンター 内容 配列モチーフ 最尤推定 ベイズ推定 M 推定 隠れマルコフモデル HMM Verアルゴリズム EMアルゴリズム Baum-Welchアルゴリズム 前向きアルゴリズム 後向きアルゴリズム プロファイル HMM 配列モチーフ モチーフ発見 配列モチーフ : 同じ機能を持つ遺伝子配列などに見られる共通の文字列パターン

More information

生命情報学

生命情報学 生命情報学 (2) 配列解析基礎 阿久津達也 京都大学化学研究所 バイオインフォマティクスセンター 配列アラインメントとは? 配列検索 バイオインフォマティクスにおける基本原理 配列が似ていれば機能も似ている ただし 例外はある 配列検索の利用法 実験を行い機能未知の配列が見つかったデータベース中で類似の配列を検索機能既知の類似の配列が見つかれば その配列と似た機能を持つと推定 機能未知の配列 VLPIKSKLP...

More information

Microsoft PowerPoint - lecture b.pptx

Microsoft PowerPoint - lecture b.pptx non codng RN (ncrn) による遺伝子発現制御 応用生命科学 情報生命学第 4 回 RN 配列情報解析 non codng RN バイオインフォマテクス解析概論 RN seq 情報解析 RN2 次構造予測 RN 配列情報解析統合サーバー ene ene ene Transcrpton enomc DN sequence mrn small ncrn Translaton Interacton

More information

PowerPoint Presentation

PowerPoint Presentation パターン認識入門 パターン認識 音や画像に中に隠れたパターンを認識する 音素 音節 単語 文 基本図形 文字 指紋 物体 人物 顔 パターン は唯一のデータではなく 似通ったデータの集まりを表している 多様性 ノイズ 等しい から 似ている へ ~ だ から ~ らしい へ 等しい から 似ている へ 完全に等しいかどうかではなく 似ているか どうかを判定する パターンを代表する模範的データとどのくらい似ているか

More information

第4回バイオインフォマティクスアルゴリズム実習

第4回バイオインフォマティクスアルゴリズム実習 第 5 回バイオインフォマティクスアルゴリズム アラインメントアルゴリズム (3) 慶應義塾大学先端生命科学研究所 アラインメント 置換 挿入 欠損を考慮して塩基配列あるいは アミノ酸配列の似た部分をそろえることギャップ - を挿入する CAAGACATTTTAC CATACACTTTAC CA-AGACATTTTAC CATACAC--TTTAC ** * ** ***** アラインメントはグラフで表現できる

More information

5_motif 公開版.ppt

5_motif 公開版.ppt 配列モチーフ 機能ドメイン 機能部位 機能的 構造的に重要な部位 は進化の過程で保存 される傾向がある 進化的に保存された ドメイン 配列モチーフ 機能ドメイン中の特徴的な 保存配列パターン マルチプルアライメント から抽出 配列モチーフの表現方法 パターン プロファイル 2 n n n n n n n n ENCODE n PROSITE パターンの例 n C-x(2,4)-C-x(3)-[LIVMFYWC]-x(8)-H-x(3,5)-H.

More information

PowerPoint Presentation

PowerPoint Presentation パターン認識入門 今回の話題 : パターン認識 長大な列 ( 例えば文章 ) から興味深い部分 ( 例えばある文字列を含む部分 ) を取り出したい ある文字列を含む web ページを抽出 プログラム中の特定の関数の呼び出しを DNA から面白そうな塩基配列を 例えば特定の塩基をたくさん含む場所を スパムメールの識別 B-CAS だけでなく B-C@S なども検出したい 2 簡単なパターン認識 : 文字列検索

More information

バイオインフォマティクスⅠ

バイオインフォマティクスⅠ バイオインフォマティクス ( 第 3 回 ) 慶應義塾大学生命情報学科 榊原康文 アセンブリの演習問題 ( 解 ) CGTCCGT CATCG 5 3 4 ATCCAT TCCGTAT 5 3 3 4 GTATC CGTCCGT-------- --TCCGTAT------ -----GTATC----- -------ATCCAT-- ----------CATCG ===============

More information

Microsoft PowerPoint SIGAL.ppt

Microsoft PowerPoint SIGAL.ppt アメリカン アジアンオプションの 価格の近似に対する 計算幾何的アプローチ 渋谷彰信, 塩浦昭義, 徳山豪 ( 東北大学大学院情報科学研究科 ) 発表の概要 アメリカン アジアンオプション金融派生商品の一つ価格付け ( 価格の計算 ) は重要な問題 二項モデルにおける価格付けは計算困難な問題 目的 : 近似精度保証をもつ近似アルゴリズムの提案 アイディア : 区分線形関数を計算幾何手法により近似 問題の説明

More information

進捗状況の確認 1. gj も gjp も動いた 2. gj は動いた 3. gj も動かない 2

進捗状況の確認 1. gj も gjp も動いた 2. gj は動いた 3. gj も動かない 2 連立 1 次方程式の数値解法 小規模な連立 1 次方程式の解法 消去法 Gauss 消去法 Gauss-Jordan 法 ( 大規模な連立 1 次方程式の解法 ) ( 反復法 ) (Jacobi 法 ) 講義では扱わない 1 進捗状況の確認 1. gj も gjp も動いた 2. gj は動いた 3. gj も動かない 2 パターン認識入門 パターン認識 音や画像に中に隠れたパターンを認識する 音素

More information

アルゴリズム入門

アルゴリズム入門 アルゴリズム入門 第 11 回 ~ パターン認識 (1)~ 情報理工学系研究科 創造情報学専攻 中山英樹 1 今日の内容 パターン認識問題の 1 つ : アラインメント アルゴリズム 再帰 動的計画法 2 パターン認識 音や画像の中に隠れたパターンを認識する 音素 音節 単語 文 基本図形 文字 指紋 物体 人物 顔 パターン は唯一のデータではなく 似通ったデータの集まりを表している 多様性 ノイズ

More information

Microsoft PowerPoint - ad11-09.pptx

Microsoft PowerPoint - ad11-09.pptx 無向グラフと有向グラフ 無向グラフ G=(V, E) 頂点集合 V 頂点の対を表す枝の集合 E e=(u,v) 頂点 u, v は枝 e の端点 f c 0 a 1 e b d 有向グラフ G=(V, E) 頂点集合 V 頂点の順序対を表す枝の集合 E e=(u,v) 頂点 uは枝 eの始点頂点 vは枝 eの終点 f c 0 a 1 e b d グラフのデータ構造 グラフ G=(V, E) を表現するデータ構造

More information

Microsoft PowerPoint - pr_12_template-bs.pptx

Microsoft PowerPoint - pr_12_template-bs.pptx 12 回パターン検出と画像特徴 テンプレートマッチング 領域分割 画像特徴 テンプレート マッチング 1 テンプレートマッチング ( 図形 画像などの ) 型照合 Template Matching テンプレートと呼ばれる小さな一部の画像領域と同じパターンが画像全体の中に存在するかどうかを調べる方法 画像内にある対象物体の位置検出 物体数のカウント 物体移動の検出などに使われる テンプレートマッチングの計算

More information

11yama

11yama 連立 1 次方程式の数値解法 小規模な連立 1 次方程式の解法 消去法 Gauss 消去法 Gauss-Jordan 法 ( 大規模な連立 1 次方程式の解法 ) ( 反復法 ) (Jacobi 法 ) 講義では扱わない 1 進捗状況の確認 1. gj も gjp も動いた 2. gj は動いた 3. gj も動かない 2 パターン認識入門 パターン認識 音や画像に中に隠れたパターンを認識する 音素

More information

Microsoft PowerPoint - mp11-06.pptx

Microsoft PowerPoint - mp11-06.pptx 数理計画法第 6 回 塩浦昭義情報科学研究科准教授 shioura@dais.is.tohoku.ac.jp http://www.dais.is.tohoku.ac.jp/~shioura/teaching 第 5 章組合せ計画 5.2 分枝限定法 組合せ計画問題 組合せ計画問題とは : 有限個の もの の組合せの中から, 目的関数を最小または最大にする組合せを見つける問題 例 1: 整数計画問題全般

More information

人工知能補足_池村

人工知能補足_池村 私くしにとって 生涯の指針となっている木村先生の教え 1. 想定外の発見の重要性 à unsupervised data mining for big data 2. 技術への信頼と技術開発の重要性 2D gel à BLSOM trna の二次元分離 : Methods in Enzymology 長さに依存する分離 想定外の 米国での Post Doc の時代 高分離能 長さに依存しない分離 29

More information

Bioinformatics2

Bioinformatics2 バイオインフォマティクス配列データ解析 2 藤 博幸 データベース検索 (1) ブラウザで NCBI を検索 (2)NCBI で配列データの取得 (3)NCBI で BLAST 検索 ブラウザで NCBI を検索 ブラウザで NCBI を検索 クリック ブラウザで NCBI を検索 NCBI トップページ National Center for Biotechnology Information 分

More information

Microsoft PowerPoint - BI_okuno_

Microsoft PowerPoint - BI_okuno_ バイオインフォマティクス ( 配列検索 ) & ケモインフォマティクス ( 構造検索 ) 統合薬学教育開発分野 奥野恭史 創薬におけるインフォマティクス ゲノム情報 ゲノム基盤ターゲット研究探索 ターゲット バリデーション 創薬リード探索 創薬リード最適化 前臨床研究臨床研究 創薬 ゲノム情報 (~2 万 2 千遺伝子 ) 化合物ライブラリー (10^60 化合物 ) バイオインフォマティクス ケモインフォマティクス

More information

連続講演会 東京で学ぶ京大の知 シリーズ 16 社会に浸透する情報技術第 2 回 ゲノム情報のコンピュータ解析 高校数学 +α による先端的解析手法 京都大学が東京 品川の 京都大学東京オフィス で開く連続講演会 東京で学ぶ京大の知 のシリーズ 16 社会に浸透する情報技術 9 月 22 日の第 2

連続講演会 東京で学ぶ京大の知 シリーズ 16 社会に浸透する情報技術第 2 回 ゲノム情報のコンピュータ解析 高校数学 +α による先端的解析手法 京都大学が東京 品川の 京都大学東京オフィス で開く連続講演会 東京で学ぶ京大の知 のシリーズ 16 社会に浸透する情報技術 9 月 22 日の第 2 連続講演会 東京で学ぶ京大の知 シリーズ 16 社会に浸透する情報技術第 2 回 ゲノム情報のコンピュータ解析 高校数学 +α による先端的解析手法 京都大学が東京 品川の 京都大学東京オフィス で開く連続講演会 東京で学ぶ京大の知 のシリーズ 16 社会に浸透する情報技術 9 月 22 日の第 2 回講演では 化学研究所バイオインフォマティクスセンター長の阿久津達也教授が ゲノム情報のコンピュータ解析

More information

Microsoft PowerPoint - ca ppt [互換モード]

Microsoft PowerPoint - ca ppt [互換モード] 大阪電気通信大学情報通信工学部光システム工学科 2 年次配当科目 コンピュータアルゴリズム 良いアルゴリズムとは 第 2 講 : 平成 20 年 10 月 10 日 ( 金 ) 4 限 E252 教室 中村嘉隆 ( なかむらよしたか ) 奈良先端科学技術大学院大学助教 y-nakamr@is.naist.jp http://narayama.naist.jp/~y-nakamr/ 第 1 講の復習

More information

memo

memo 計数工学プログラミング演習 ( 第 4 回 ) 2016/05/10 DEPARTMENT OF MATHEMATICA INFORMATICS 1 内容 リスト 疎行列 2 連結リスト (inked ists) オブジェクトをある線形順序に並べて格納するデータ構造 単方向連結リスト (signly linked list) の要素 x キーフィールド key ポインタフィールド next x->next:

More information

生命情報学

生命情報学 生命情報学 34 進化系統樹推定 阿久津達也 京都大学化学研究所 バイオインフォマティクスセンター 進化系統樹 進化系統樹 種間 もしくは遺伝子間 の進化の関係を表す木 以前は形態的特徴をもとに構成 現在は配列情報をもとに構成 有根系統樹と無根系統樹 有根系統樹 : 根 共通の祖先に対応 がある系統樹 無根系統樹 : 根のない系統樹 いずれも葉にのみラベル 種に対応 がつく 有根系統樹 無根系統樹

More information

Taro-再帰関数Ⅱ(公開版).jtd

Taro-再帰関数Ⅱ(公開版).jtd 0. 目次 6. 2 項係数 7. 二分探索 8. 最大値探索 9. 集合 {1,2,,n} 上の部分集合生成 - 1 - 6. 2 項係数 再帰的定義 2 項係数 c(n,r) は つぎのように 定義される c(n,r) = c(n-1,r) + c(n-1,r-1) (n 2,1 r n-1) = 1 (n 0, r=0 ) = 1 (n 1, r=n ) c(n,r) 0 1 2 3 4 5

More information

 

  早稲田大学大学院理工学研究科 博士論文概要 論文題目 An algorithm for alignment of multiple biological sequences with generalized gap penalty functions 一般化ギャップペナルティ関数を用いた生物配列のマルチプルアラインメントアルゴリズム 申請者 山田 Shinsuke 真介 Yamada 情報 ネットワーク専攻並列

More information

2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3.

2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3. 2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3. プロジェクト管理組織 株式会社オープンテクノロジーズ 4. 委託金支払額 3,000,000 円 5.

More information

nagasaki_GMT2015_key09

nagasaki_GMT2015_key09 Workflow Variant Calling 03 長崎は遺伝研 大量遺伝情報研究室の所属です 国立遺伝学研究所 生命情報研究センター 3F 2F 欧州EBIと米国NCBIと密接に協力しながら DDBJ/EMBL/GenBank国際塩基配列データ ベースを構築しています 私たちは 塩基配列登録を支援するシステムづくり 登録データを活用するシステムづくり 高速シーケンス配列の情報解析 を行なっています

More information

次元圧縮法を導入したクエリに基づくバイクラスタリング 情報推薦への応用 武内充三浦功輝岡田吉史 ( 室蘭工業大学 ) 概要以前, 我々はクエリに基づくバイクラスタリングを用いた情報推薦手法を提案した. 本研究では, 新たに推薦スコアが非常に良く似たユーザまたはアイテムを融合する次元圧縮法を導入した. 実験として, 縮減前と縮減後のデータセットのサイズとバイクラスタ計算時間の比較を行う. キーワード

More information

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ モンテカルロ法による分子進化の分岐図作成 のための最適化法 石井一夫 1 松田朋子 2 古崎利紀 1 後藤哲雄 2 1 東京農工大学 2 茨城大学 2013 9 9 2013 1 我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標

More information

ボルツマンマシンの高速化

ボルツマンマシンの高速化 1. はじめに ボルツマン学習と平均場近似 山梨大学工学部宗久研究室 G04MK016 鳥居圭太 ボルツマンマシンは学習可能な相互結合型ネットワー クの代表的なものである. ボルツマンマシンには, 学習のための統計平均を取る必要があり, 結果を求めるまでに長い時間がかかってしまうという欠点がある. そこで, 学習の高速化のために, 統計を取る2つのステップについて, 以下のことを行う. まず1つ目のステップでは,

More information

毎回変動し, 必ずしも良い結果を出力するとは限らない. 理由の一つとして,GS 法は配列データごとに, ランダムに与えた初期値に基づいて類似部分配列の位置を確率的に更新している為, 計算途中でそれらの位置が常に変動し, 結果が安定しないという問題が発生する. 本稿では, この問題を解決する為に, 配

毎回変動し, 必ずしも良い結果を出力するとは限らない. 理由の一つとして,GS 法は配列データごとに, ランダムに与えた初期値に基づいて類似部分配列の位置を確率的に更新している為, 計算途中でそれらの位置が常に変動し, 結果が安定しないという問題が発生する. 本稿では, この問題を解決する為に, 配 E5-2 アラインメントされた配列集合からモチーフを 福本翔平 抽出する方法 北上始 森康真 広島市立大学情報科学部知能工学科 広島市立大学大学院情報科学研究科知能工学専攻 731-3194 広島市安佐南大塚東 3 丁目 4 番 1 号 E-mail: s20160@edu.ipc.hiroshima-cu.ac.jp {kitakami, mori}@hiroshima-cu.ac.jp あらまし配列データベースから類似部分の多い部分配列,

More information

Microsoft PowerPoint - mp13-07.pptx

Microsoft PowerPoint - mp13-07.pptx 数理計画法 ( 数理最適化 ) 第 7 回 ネットワーク最適化 最大流問題と増加路アルゴリズム 担当 : 塩浦昭義 ( 情報科学研究科准教授 ) hiour@di.i.ohoku.c.jp ネットワーク最適化問題 ( 無向, 有向 ) グラフ 頂点 (verex, 接点, 点 ) が枝 (edge, 辺, 線 ) で結ばれたもの ネットワーク 頂点や枝に数値データ ( 距離, コストなど ) が付加されたもの

More information

分子系統解析における様々な問題について 田辺晶史

分子系統解析における様々な問題について 田辺晶史 分子系統解析における様々な問題について 田辺晶史 そもそもどこの配列を使うべき? そもそもどこの配列を使うべき? 置換が早すぎず遅すぎない (= 多すぎず少なすぎない ) そもそもどこの配列を使うべき? 置換が早すぎず遅すぎない (= 多すぎず少なすぎない ) 連続長は長い方が良い そもそもどこの配列を使うべき? 置換が早すぎず遅すぎない (= 多すぎず少なすぎない ) 連続長は長い方が良い 遺伝子重複が起きていない

More information

分子進化モデルと最尤系統推定法 東北大 院 生命科学田邉晶史

分子進化モデルと最尤系統推定法 東北大 院 生命科学田邉晶史 分子進化モデルと最尤系統推定法 東北大 院 生命科学田邉晶史 まずはじめに, 最尤系統推定とは 多重モデル選択 である. 最尤系統推定の手順 1. 樹形を固定しての 2. 分子進化モデルの選択 1. 分子進化モデルを固定しての 2. 系統モデル ( 樹形 ) の選択 = 多重モデル選択 分子進化モデル超入門 とりあえず塩基置換モデルで 塩基置換モデルの 3 大要素 塩基置換確率行列 (nucleotide

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション エージェントベースドシミュレーションによる店舗内回遊モデル構築に関する研究 大阪府立大学 現代システム科学域 知識情報システム学類石丸悠太郎 指導教員 森田裕之 背景 顧客の店舗内回遊シミュレーションは 店舗内でのプロモーションや商品配置の影響を実施する前に結果を予測することが可能となるため 実施前に効果を確認することでコストや時間を削減することができる 従来は 購買履歴やアンケート結果を用いたモデルを行わざるを得なかったため

More information

次に示す数値の並びを昇順にソートするものとする このソートでは配列の末尾側から操作を行っていく まず 末尾の数値 9 と 8 に着目する 昇順にソートするので この値を交換すると以下の数値の並びになる 次に末尾側から 2 番目と 3 番目の 1

次に示す数値の並びを昇順にソートするものとする このソートでは配列の末尾側から操作を行っていく まず 末尾の数値 9 と 8 に着目する 昇順にソートするので この値を交換すると以下の数値の並びになる 次に末尾側から 2 番目と 3 番目の 1 4. ソート ( 教科書 p.205-p.273) 整列すなわちソートは アプリケーションを作成する際には良く使われる基本的な操作であり 今までに数多くのソートのアルゴリズムが考えられてきた 今回はこれらソートのアルゴリズムについて学習していく ソートとはソートとは与えられたデータの集合をキーとなる項目の値の大小関係に基づき 一定の順序で並べ替える操作である ソートには図 1 に示すように キーの値の小さいデータを先頭に並べる

More information

簡単な検索と整列(ソート)

簡単な検索と整列(ソート) フローチャート (2) アルゴリズム論第 2 回講義 2011 年 10 月 7 日 ( 金 ) 反復構造 ( 一定回数のループ処理 ) START 100 回同じ処理を繰り返す お風呂で子供が指をおって数を数える感じ 繰り返し数を記憶する変数をカウンター ( 変数名 I をよく使う ) と呼ぶ カウンターを初期化して, 100 回繰り返したかどうか判定してそうならば終了そうでなければ処理を実行して

More information

NGSデータ解析入門Webセミナー

NGSデータ解析入門Webセミナー NGS データ解析入門 Web セミナー : RNA-Seq 解析編 1 RNA-Seq データ解析の手順 遺伝子発現量測定 シークエンス マッピング サンプル間比較 機能解析など 2 CLC Genomics Workbench 使用ツール シークエンスデータ メタデータのインポート NGS data import Import Metadata クオリティチェック Create Sequencing

More information

OpRisk VaR3.2 Presentation

OpRisk VaR3.2 Presentation オペレーショナル リスク VaR 計量の実施例 2009 年 5 月 SAS Institute Japan 株式会社 RI ビジネス開発部羽柴利明 オペレーショナル リスク計量の枠組み SAS OpRisk VaR の例 損失情報スケーリング計量単位の設定分布推定各種調整 VaR 計量 内部損失データ スケーリング 頻度分布 規模分布 分布の補正相関調整外部データによる分布の補正 損失シナリオ 分布の統合モンテカルロシミュレーション

More information

GWB

GWB NGS データ解析入門 Web セミナー : 変異解析編 1 NGS 変異データ解析の手順 シークエンス 変異検出 マッピング データの精査 解釈 2 CLC Genomics Workbench 使用ツール シークエンスデータのインポート NGS data import クオリティチェック QC for Sequencing Reads Trim Reads 参照ゲノム配列へのマッピング 再アライメント

More information

7-1(DNA配列から遺伝子を探す).ppt

7-1(DNA配列から遺伝子を探す).ppt DNA 配列の中から遺伝子を探す Blast 解析.6 Query DNA 塩基配列アミノ酸配列 DNA 塩基配列をアミノ酸配列に変換アミノ酸配列 DNA 塩基配列をアミノ酸配列に変換 データベース DNA 塩基配列アミノ酸配列アミノ酸配列 DNA 塩基配列をアミノ酸配列に変換 DNA 塩基配列をアミノ酸配列に変換 1. 2. 3. TATGGCTTA---- T G L TATGGCTTA----

More information

ヒトゲノム情報を用いた創薬標的としての新規ペプチドリガンドライブラリー PharmaGPEP TM Ver2S のご紹介 株式会社ファルマデザイン

ヒトゲノム情報を用いた創薬標的としての新規ペプチドリガンドライブラリー PharmaGPEP TM Ver2S のご紹介 株式会社ファルマデザイン ヒトゲノム情報を用いた創薬標的としての新規ペプチドリガンドライブラリー PharmaGPEP TM Ver2S のご紹介 株式会社ファルマデザイン 薬剤の標的分子別構成 核内受容体 2% DNA 2% ホルモン 成長因子 11% 酵素 28% イオンチャンネル 5% その他 7% 受容体 45% Drews J,Science 287,1960-1964(2000) G 蛋白質共役受容体 (GPCR)

More information

Information Theory

Information Theory 前回の復習 情報をコンパクトに表現するための符号化方式を考える 情報源符号化における基礎的な性質 一意復号可能性 瞬時復号可能性 クラフトの不等式 2 l 1 + + 2 l M 1 ハフマン符号の構成法 (2 元符号の場合 ) D. Huffman 1 前回の練習問題 : ハフマン符号 符号木を再帰的に構成し, 符号を作る A B C D E F 確率 0.3 0.2 0.2 0.1 0.1 0.1

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

コンピュータ応用・演習 情報処理システム

コンピュータ応用・演習 情報処理システム 2010 年 12 月 15 日 データエンジニアリング 演習 情報処理システム データマイニング ~ データからの自動知識獲得手法 ~ 1. 演習の目的 (1) 多種多様な膨大な量のデータを解析し, 企業の経営活動などに活用することが望まれている. 大規模データベースを有効に活用する, データマイニング技術の研究が脚光を浴びている 1 1. 演習の目的 (2) POS データを用いて顧客の購買パターンを分析する.

More information

配列検索 よくあるご質問

配列検索 よくあるご質問 質問 Q ホモロジー検索におけるスコア値 (Score) と同一性 (Identities) の関係は? Q2 アライメント情報に表示されるハイフン (-), プラス (+), コロン (:) などの意味を知りたい. Q3 BLAST ホモロジー検索の結果で, 自分が作成した配列質問式に含めていない XXX や NNN が表示されることがあります. なぜですか? ( 低分子領域とは?) Q4 tblastn,

More information

Microsoft PowerPoint - mp11-02.pptx

Microsoft PowerPoint - mp11-02.pptx 数理計画法第 2 回 塩浦昭義情報科学研究科准教授 shioura@dais.is.tohoku.ac.jp http://www.dais.is.tohoku.ac.jp/~shioura/teaching 前回の復習 数理計画とは? 数理計画 ( 復習 ) 数理計画問題とは? 狭義には : 数理 ( 数学 ) を使って計画を立てるための問題 広義には : 与えられた評価尺度に関して最も良い解を求める問題

More information

GWB

GWB NGS データ解析入門 Web セミナー : De Novo シークエンス解析編 1 NGS 新規ゲノム配列解析の手順 シークエンス 遺伝子領域の検出 アセンブル データベース検索 2 解析ワークフローと使用ソフトウェア シークエンスデータのインポート クオリティチェック 前処理 コンティグ配列の作成 CLC Genomics Workbench 遺伝子領域の検出 Blast2GO PRO データベース検索

More information

計画研究 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシン

計画研究 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシン 計画研究 2005 2009 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシング時代のゲノム科学研究では 多因子性 遺伝性疾患の関連解析による原因遺伝子探索が最重要課題であ 1.

More information

生物物理 Vol. 45 No. 1 (2005) だけ正確なアラインメントが必要な方 (4) 立体構造とアミノ酸配列の関係, あるいは立体構造と機能との関係に興味がある方 2. おもなサービス 2.1 ペアワイズ3Dアラインメントこれは2つの構造をアラインメントする基本的な機能であり,MATRAS

生物物理 Vol. 45 No. 1 (2005) だけ正確なアラインメントが必要な方 (4) 立体構造とアミノ酸配列の関係, あるいは立体構造と機能との関係に興味がある方 2. おもなサービス 2.1 ペアワイズ3Dアラインメントこれは2つの構造をアラインメントする基本的な機能であり,MATRAS 生物物理 45(1),41-44(2005) 立体構造比較サーバ MATRAS の使い方 1. はじめに 奈良先端科学技術大学院大学情報科学研究科川端猛 あるタンパク質と似ている他のタンパク質を探したいとき, まず最初に試みるべきはアミノ酸配列の相同性検索であろう. しかし, 同じファミリーのタンパク質の中でも, アミノ酸配列の一致度が低くなってくると, 配列の類似性だけで議論するのには限界が出てくる.

More information

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について ( 別添 ) 最終的に宿主に導入された DNA が 当該宿主と分類学上同一の種に属する微生物の DNA のみである場合又は組換え体が自然界に存在する微生物と同等の遺伝子構成である場合のいずれかに該当することが明らかであると判断する基準に係る留意事項 最終的に宿主に導入されたDNAが 当該宿主と分類学上同一の種に属する微生物のDNAのみである場合又は組換え体が自然界に存在する微生物と同等の遺伝子構成である場合のいずれかに該当することが明らかであると判断する基準

More information

SAP11_03

SAP11_03 第 3 回 音声音響信号処理 ( 線形予測分析と自己回帰モデル ) 亀岡弘和 東京大学大学院情報理工学系研究科日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 講義内容 ( キーワード ) 信号処理 符号化 標準化の実用システム例の紹介情報通信の基本 ( 誤り検出 訂正符号 変調 IP) 符号化技術の基本 ( 量子化 予測 変換 圧縮 ) 音声分析 合成 認識 強調 音楽信号処理統計的信号処理の基礎

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 復習 ) 時系列のモデリング ~a. 離散時間モデル ~ y k + a 1 z 1 y k + + a na z n ay k = b 0 u k + b 1 z 1 u k + + b nb z n bu k y k = G z 1 u k = B(z 1 ) A(z 1 u k ) ARMA モデル A z 1 B z 1 = 1 + a 1 z 1 + + a na z n a = b 0

More information

umeda_1118web(2).pptx

umeda_1118web(2).pptx 選択的ノード破壊による ネットワーク分断に耐性のある 最適ネットワーク設計 関西学院大学理工学部情報科学科 松井知美 巳波弘佳 選択的ノード破壊によるネットワーク分断に耐性のある最適ネットワーク設計 0 / 20 現実のネットワーク 現実世界のネットワークの分析技術の進展! ネットワークのデータ収集の効率化 高速化! 膨大な量のデータを解析できる コンピュータ能力の向上! インターネット! WWWハイパーリンク構造

More information

gengo1-8

gengo1-8 問題提起その 1 一文字ずつ文字 ( 数字 ) を読み込み それぞれの文字が何回入力されたかを数えて出力するプログラム int code, count_0=0, count_1=0, count_2=0, count_3=0,..., count_9=0; while( (code=getchar())!= EOF ){ } switch(code){ case 0 : count_0++; break;

More information

C3 データ可視化とツール

C3 データ可視化とツール < 第 3 回 > データ可視化とツール 統計数理研究所 中野純司 nakanoj@ism.ac.jp データ可視化とツール 概要 データサイエンティスト育成クラッシュコース データサイエンティストとしてデータ分析を行う際に必要な可視化の考え方と それを実行するためのフリーソフトウェアを紹介する 1. はじめに 2. 静的なグラフィックス 3. 動的なグラフィックス 4. 対話的なグラフィックス 1.

More information

4 月 東京都立蔵前工業高等学校平成 30 年度教科 ( 工業 ) 科目 ( プログラミング技術 ) 年間授業計画 教科 :( 工業 ) 科目 :( プログラミング技術 ) 単位数 : 2 単位 対象学年組 :( 第 3 学年電気科 ) 教科担当者 :( 高橋寛 三枝明夫 ) 使用教科書 :( プロ

4 月 東京都立蔵前工業高等学校平成 30 年度教科 ( 工業 ) 科目 ( プログラミング技術 ) 年間授業計画 教科 :( 工業 ) 科目 :( プログラミング技術 ) 単位数 : 2 単位 対象学年組 :( 第 3 学年電気科 ) 教科担当者 :( 高橋寛 三枝明夫 ) 使用教科書 :( プロ 4 東京都立蔵前工業高等学校平成 30 年度教科 ( 工業 ) 科目 ( プログラミング技術 ) 年間授業計画 教科 :( 工業 ) 科目 :( プログラミング技術 ) 単位数 : 2 単位 対象学年組 :( 第 3 学年電気科 ) 教科担当者 :( 高橋寛 三枝明夫 ) 使用教科書 :( プログラミング技術 工業 333 実教出版 ) 共通 : 科目 プログラミング技術 のオリエンテーション プログラミング技術は

More information

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について 食安基発 0627 第 3 号 平成 26 年 6 月 27 日 各検疫所長殿 医薬食品局食品安全部基準審査課長 ( 公印省略 ) 最終的に宿主に導入されたDNAが 当該宿主と分類学上同一の種に属する微生物のDNAのみである場合又は組換え体が自然界に存在する微生物と同等の遺伝子構成である場合のいずれかに該当することが明らかであると判断する基準に係る留意事項について 食品 添加物等の規格基準 ( 昭和

More information

統合失調症発症に強い影響を及ぼす遺伝子変異を,神経発達関連遺伝子のNDE1内に同定した

統合失調症発症に強い影響を及ぼす遺伝子変異を,神経発達関連遺伝子のNDE1内に同定した 平成 26 年 10 月 27 日 統合失調症発症に強い影響を及ぼす遺伝子変異を 神経発達関連遺伝子の NDE1 内に同定した 名古屋大学大学院医学系研究科 ( 研究科長 髙橋雅英 ) 精神医学の尾崎紀夫 ( おざきのりお ) 教授らの研究グループは 同研究科神経情報薬理学の貝淵弘三 ( かいぶちこうぞう ) 教授らの研究グループとの共同研究により 統合失調症発症に関連していると考えられている染色体上

More information

Microsoft PowerPoint - アルデIII 10回目12月09日

Microsoft PowerPoint - アルデIII 10回目12月09日 アルゴリズムとデータ構造 III 9 回目 : 月 9 日 全文検索アルゴリズム (Simple Serh, KMP) 授業資料 http://ir.s.ymnshi..jp/~ysuzuki/puli/lgorithm/index.html 授業の予定 ( 中間試験まで ) / スタック ( 後置記法で書かれた式の計算 ) / チューリング機械, 文脈自由文法 / 構文解析 CYK 法 / 構文解析

More information

Microsoft PowerPoint - OS12.pptx

Microsoft PowerPoint - OS12.pptx # # この資料は 情報工学レクチャーシリーズ松尾啓志著 ( 森北出版株式会社 ) を用いて授業を行うために 名古屋工業大学松尾啓志 津邑公暁が作成しました パワーポイント 7 で最終版として保存しているため 変更はできませんが 授業でお使いなる場合は松尾 (matsuo@nitech.ac.jp) まで連絡いただければ 編集可能なバージョンをお渡しする事も可能です # 主記憶管理 : ページ置き換え方式

More information

各学科 課程 専攻別開設授業科目 ( 教職関係 ) 総合情報学科 ( 昼間コース ) 中学校教諭 1 種免許状 ( 数学 ) 高等学校教諭 1 種免許状 ( 数学 ) 代数学 線形代数学第一 2 線形代数学第二 2 離散数学 2 応用代数学 2 オペレーションズ リサーチ基礎 2 数論アルゴリズム

各学科 課程 専攻別開設授業科目 ( 教職関係 ) 総合情報学科 ( 昼間コース ) 中学校教諭 1 種免許状 ( 数学 ) 高等学校教諭 1 種免許状 ( 数学 ) 代数学 線形代数学第一 2 線形代数学第二 2 離散数学 2 応用代数学 2 オペレーションズ リサーチ基礎 2 数論アルゴリズム 免許状取得に必要な履修科目 教育職員免許法施行規則に 左に該当する本学の 履修 高等学校教諭 高等学校教諭 中学校教諭 定める修得を要する科目 開設科目及び単位数 年次 専修免許状 1 種免許状 1 種免許状 教職の意義等に関する科目教職論 2 1 年 2 単位 2 単位 2 単位 教 教育原理 2 1 年 職 に教育の基礎理論に関する科教育心理学 2 1 年 6 単位 6 単位 6 単位 関目 す

More information

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを 報道発表資料 2002 年 12 月 5 日 独立行政法人理化学研究所 遺伝子の機能解析を飛躍的に進める世界最大規模の遺伝子情報を公開 - 遺伝子として認知されていなかった部分が転写されていることを実証 - 理化学研究所 ( 小林俊一理事長 ) は マウスの完全長 cdna 160,770 クローンの塩基配列および機能アノテーション ( 機能注釈 ) 情報を公開します これは 現在までに人類が収得している遺伝子の約

More information

[ 演習 3-6AA] ウェブページの検索結果の表示順序 ( 重要 ) 10D H 坂田侑亮 10D F 岩附彰人 10D D 財津宏明 1.1 ページランクとは ページランクとは グーグルが開発した検索エンジンのウェブページの重要度を判定する技術である サーチエ

[ 演習 3-6AA] ウェブページの検索結果の表示順序 ( 重要 ) 10D H 坂田侑亮 10D F 岩附彰人 10D D 財津宏明 1.1 ページランクとは ページランクとは グーグルが開発した検索エンジンのウェブページの重要度を判定する技術である サーチエ 1.1 ページランクとは ページランクとは グーグルが開発した検索エンジンのウェブページの重要度を判定する技術である サーチエンジンは質の高いウェブページをどれだけ上位に並べられるかということが重要です 従来の検索エンジンでは検索された単語とそのページの関連性を元に評価をしていましたが ここに どれだけ注目されているか という指標を盛り込んだことが特筆すべきポイントです 具体的には 質の良い ( ページランクの高い

More information

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc color 実験の Normalization color 実験で得られた複数のアレイデータを相互比較するためには Normalization( 正規化 ) が必要です 2 つのサンプルを異なる色素でラベル化し 競合ハイブリダイゼーションさせる 2color 実験では 基本的に Dye Normalization( 色素補正 ) が適用されますが color 実験では データの特徴と実験の目的 (

More information

Microsoft PowerPoint - 3rd-jikken-vscreen [互換モード]

Microsoft PowerPoint - 3rd-jikken-vscreen [互換モード] 生命情報実験第一 ( 情報系 ) バイオインフォマティクスの道具箱 タンパク質化合物相互作用解析: バーチャルスクリーニング 慶應義塾大学生命情報学科榊原康文, 佐藤健吾 リード化合物探索とインフォマティクス High Throughput Screening 実験的検証 リード化合物 = 薬剤候補 薬剤標的タンパク質 初期候補 実験的検証 + インフォマティクス 1. 大量化合物の探索 2. 成功率向上

More information

6 文字列処理 ( 教科書 p.301p.332) 今回は 言語の文字列処理について復習し, 文字列の探索手法について学びます. 文字列とはプログラム上での文字の並びを表すのが文字列です. これは中身が空であっても同様に呼ばれます. 言語では "STRING" のように文字の並びを二重引用符 " で囲んだものを文字列リテラルと呼びます. SII コードの場合, 割り当てられる数値は図 1 のようになっています.

More information

NCBI BLAST チュートリアル このチュートリアルでは NCBI サイトでの BLAST による相同性検索の方法について 一般的な使い方を紹介しています はじめに. BLAST とは まずはじめに 簡単に BLAST について紹介することにしましょう BLAST は Basic Local Alignment Search Tool の略で ペアワイズの局所的なアライメント / 相同性検索 (

More information

修士論文予稿集の雛型

修士論文予稿集の雛型 2010 年度第 6 回情報処理学会東北支部研究会 ( 山形大学 ) 資料番号 10-6-A5-1 バクテリアの塩基配列における文字の含量を用いた解析山形大学大学院理工学研究科応用生命システム工学専攻小池公洋 木ノ内誠 1. はじめに近年多くの生物の全ゲノム配列が決定されている 2010 年 3 月現在 バクテリアでは 1400 種以上の全ゲノム配列が決定されている 決定された配列から生命現象を解明するために

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています

More information

論理と計算(2)

論理と計算(2) 情報科学概論 Ⅰ アルゴリズムと計算量 亀山幸義 http://logic.cs.tsukuba.ac.jp/~kam 亀山担当分の話題 アルゴリズムと計算量 Fibonacci 数列の計算を例にとり アルゴリズムと計算量とは何か 具体的に学ぶ 良いアルゴリズムの設計例として 整列 ( ソーティング ) のアルゴリズムを学ぶ 2 Fibonacci 数 () Fibonacci 数 (2) = if

More information

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日 生物情報工学 BioInforma*cs 3 遺伝子データベース 16/06/09 1 国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日本 DNA データバンクが運営

More information

次世代シークエンサーを用いたがんクリニカルシークエンス解析

次世代シークエンサーを用いたがんクリニカルシークエンス解析 次世代シークエンサーを用いた がんクリニカルシークエンス解析 フィルジェン株式会社バイオサイエンス部 (biosupport@filgen.jp) 1 がん遺伝子パネル がん関連遺伝子のターゲットシークエンス用のアッセイキット コストの低減や 研究プログラムの簡素化に有用 網羅的シークエンス解析の場合に比べて 1 遺伝子あたりのシークエンス量が増えるため より高感度な変異の検出が可能 2 変異データ解析パイプライン

More information

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X ( 第 週ラプラス変換 教科書 p.34~ 目標ラプラス変換の定義と意味を理解する フーリエ変換や Z 変換と並ぶ 信号解析やシステム設計における重要なツール ラプラス変換は波動現象や電気回路など様々な分野で 微分方程式を解くために利用されてきた ラプラス変換を用いることで微分方程式は代数方程式に変換される また 工学上使われる主要な関数のラプラス変換は簡単な形の関数で表されるので これを ラプラス変換表

More information

OpenFOAM(R) ソースコード入門 pt1 熱伝導方程式の解法から有限体積法の実装について考える 前編 : 有限体積法の基礎確認 2013/11/17 オープンCAE 富山富山県立大学中川慎二

OpenFOAM(R) ソースコード入門 pt1 熱伝導方程式の解法から有限体積法の実装について考える 前編 : 有限体積法の基礎確認 2013/11/17 オープンCAE 富山富山県立大学中川慎二 OpenFOAM(R) ソースコード入門 pt1 熱伝導方程式の解法から有限体積法の実装について考える 前編 : 有限体積法の基礎確認 2013/11/17 オープンCAE 勉強会 @ 富山富山県立大学中川慎二 * OpenFOAM のソースコードでは, 基礎式を偏微分方程式の形で記述する.OpenFOAM 内部では, 有限体積法を使ってこの微分方程式を解いている. どのようにして, 有限体積法に基づく離散化が実現されているのか,

More information

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - H17-5時限(パターン認識).ppt パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を

More information

< F55542D303996E291E894AD8CA9365F834E E95AA90CD836D815B>

< F55542D303996E291E894AD8CA9365F834E E95AA90CD836D815B> クラスター分析に関するノート 情報学部堀田敬介 2004/7/32008/7/ 改訂, 2009/0/3 改訂 ) 類似度の測定 まずはじめに, 各データ間の距離を測るが, 尺度毎に様々な方法が提案されている. 尺度に対応した類似度測定の距離を示す.. 間隔尺度による類似度の測定 n 個の対象があり, 各対象は間隔尺度で m 個の属性 変量 ) が測定されているとする. このとき対象 と q を x

More information

00 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.... 0........ 0 0 0 0 0 0 0 0 0 0..0..........0 0 0 0 0 0 0 0 0 0 0.... 0........ 0 0 0 0 0 0 0 0 0 0... 0...... 0... 0 0 0 0 0 0..0 0... 0 0 0 0 0.0.....0.

More information

KEGG.ppt

KEGG.ppt 1 2 3 4 KEGG: Kyoto Encyclopedia of Genes and Genomes http://www.genome.jp/kegg/kegg2.html http://www.genome.jp/kegg/kegg_ja.html 5 KEGG PATHWAY 生体内(外)の分子間ネットワーク図 代謝系 12カテゴリ 中間代謝 二次代謝 薬の 代謝 全体像 制御系 20カテゴリ

More information

Prog1_10th

Prog1_10th 2012 年 6 月 20 日 ( 木 ) 実施ポインタ変数と文字列前回は, ポインタ演算が用いられる典型的な例として, ポインタ変数が 1 次元配列を指す場合を挙げたが, 特に,char 型の配列に格納された文字列に対し, ポインタ変数に配列の 0 番の要素の先頭アドレスを代入して文字列を指すことで, 配列そのものを操作するよりも便利な利用法が存在する なお, 文字列リテラルは, その文字列が格納されている領域の先頭アドレスを表すので,

More information

-2-

-2- -2- -3- 会場へのアクセス -4- -5- 11 月 21 日 ( 水 ) 9:25 9:30 細胞を創る 研究会 5.0 開会挨拶木賀大介 ( 東京工業大学 ) 9:30 10:30 基調講演 Chair: 木賀大介 ( 東工大 ) 大島泰郎先生 ( 共和化工 環境微生物学研究所 東京工業大学名誉教授 ) 生命の起源と Magic20 10:30 11:30 ポスター発表 ( 奇数番号 )

More information

正誤表(FPT1004)

正誤表(FPT1004) 1 Introduction 本書で学習を進める前に ご一読ください 1 第 1 章関数の利用 第 章表作成の活用 第 3 章グラフの活用 第 章グラフィックの利用 SmartArt 第 5 章複数ブックの操作 第 章データベースの活用 第 7 章ピボットテーブルとピボットグラフの作成 第 章マクロの作成 第 9 章便利な機能 総合問題 Excel 付録 1 ショートカットキー一覧 Excel 付録

More information

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので,

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので, If(A) Vx(V) 1 最小 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M) y = f ( x ) の関係から, 任意の x のときの y が求まるので, 未測定点の予測ができること. また (M3) 現象が比較的単純であれば, 現象を支配 する原理の式が分かることである.

More information

Microsoft PowerPoint - 13.ppt [互換モード]

Microsoft PowerPoint - 13.ppt [互換モード] 13. 近似アルゴリズム 1 13.1 近似アルゴリズムの種類 NP 困難な問題に対しては多項式時間で最適解を求めることは困難であるので 最適解に近い近似解を求めるアルゴリズムが用いられることがある このように 必ずしも厳密解を求めないアルゴリズムは 大きく分けて 2 つの範疇に分けられる 2 ヒューリスティックと近似アルゴリズム ヒュ- リスティクス ( 発見的解法 経験的解法 ) 遺伝的アルゴリズム

More information

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110,

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦   形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110, オートマトン 形式言語及び演習 1 有限オートマトンとは 酒井正彦 wwwtrscssinagoya-uacjp/~sakai/lecture/automata/ 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110, } 形式言語 : 数学モデルに基づいて定義された言語 認識機械 : 文字列が該当言語に属するか? 文字列 機械 受理

More information

Microsoft PowerPoint - 三次元座標測定 ppt

Microsoft PowerPoint - 三次元座標測定 ppt 冗長座標測定機 ()( 三次元座標計測 ( 第 9 回 ) 5 年度大学院講義 6 年 月 7 日 冗長性を持つ 次元座標測定機 次元 辺測量 : 冗長性を出すために つのレーザトラッカを配置し, キャッツアイまでの距離から座標を測定する つのカメラ ( 次元的なカメラ ) とレーザスキャナ : つの角度測定システムによる座標測定 つの回転関節による 次元 自由度多関節機構 高増潔東京大学工学系研究科精密機械工学専攻

More information

Microsoft PowerPoint - no1_17

Microsoft PowerPoint - no1_17 数理計画法 田地宏一 Inrodcion o Mahemaical rogramming 教科書 : 新版数理計画入門 福島雅夫 朝倉書店 参考書 : 最適化法 田村 村松著 共立出版 工学基礎最適化とその応用 矢部著 数理工学社 6Linear and Nonlinear Opimizaion: second ediion I.Griba.G. Nash and A. ofer IAM 9 など多数

More information

PowerPoint Presentation

PowerPoint Presentation 工学部 6 7 8 9 10 組 ( 奇数学籍番号 ) 担当 : 長谷川英之 情報処理演習 第 7 回 2010 年 11 月 18 日 1 今回のテーマ 1: ポインタ 変数に値を代入 = 記憶プログラムの記憶領域として使用されるものがメモリ ( パソコンの仕様書における 512 MB RAM などの記述はこのメモリの量 ) RAM は多数のコンデンサの集合体 : 電荷がたまっている (1)/ いない

More information

2015年度 京都大・理系数学

2015年度 京都大・理系数学 05 京都大学 ( 理系 ) 前期日程問題 解答解説のページへ つの関数 y= si( x+ ) と y = six のグラフの 0 x の部分で囲まれる領域 を, x 軸のまわりに 回転させてできる立体の体積を求めよ ただし, x = 0 と x = は領域を囲む線とは考えない -- 05 京都大学 ( 理系 ) 前期日程問題 解答解説のページへ次の つの条件を同時に満たす四角形のうち面積が最小のものの面積を求めよ

More information

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�)

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�) Cellulr uo nd heir eigenlues 東洋大学総合情報学部 佐藤忠一 Tdzu So Depren o Inorion Siene nd rs Toyo Uniersiy. まえがき 一次元セルオ-トマトンは数学的には記号列上の行列の固有値問題である 固有値問題の行列はふつう複素数体上の行列である 量子力学における固有値問題も無限次元ではあるが関数環上の行列でその成分は可換環である

More information

PowerPoint Presentation

PowerPoint Presentation . カーネル法への招待 正定値カーネルによるデータ解析 - カーネル法の基礎と展開 - 福水健次統計数理研究所 / 総合研究大学院大学 統計数理研究所公開講座 0 年 月 34 日 概要 カーネル法の基本 線形データ解析と非線形データ解析 カーネル法の原理 カーネル法の つの例 カーネル主成分分析 : PCA の非線形拡張 リッジ回帰とそのカーネル化 概要 カーネル法の基本 線形データ解析と非線形データ解析

More information

コンピュータグラフィックス第6回

コンピュータグラフィックス第6回 コンピュータグラフィックス 第 6 回 モデリング技法 1 ~3 次元形状表現 ~ 理工学部 兼任講師藤堂英樹 本日の講義内容 モデリング技法 1 様々な形状モデル 曲線 曲面 2014/11/10 コンピュータグラフィックス 2 CG 制作の主なワークフロー 3DCG ソフトウェアの場合 モデリング カメラ シーン アニメーション テクスチャ 質感 ライティング 画像生成 2014/11/10 コンピュータグラフィックス

More information

タイトル

タイトル 第 3 回バイオインフォマティクスアルゴリズム アラインメントアルゴリズム 慶應義塾大学先端生命科学研究所 基本的なアルゴリズム設計技法 再帰法 分割統治法 動的計画法 分割統治法とは? (1) 例 :(18, 37, 21, 14, 7, 12, 19, 6) を小さいものから順に並べ替えることを考える 最小値 2 番目に小さい値 3 番目に小さい値 を求めていくやり方では数列の長さを n とすると

More information

バイオインフォマティクスⅠ

バイオインフォマティクスⅠ バイオインフォマティクス ( 第 5 回 ) 慶應義塾大学生命情報学科 榊原康文 多重アライメントの解 0 2 3 4 5 6 7 j Q T S Y T R Y Q T - Y T R K 0 0-9 -20-44 -52-63 -72-90 Q -6 2 0-6 -4-25 -34-52 2 S -32 5 30 4 6-5 -4-32 3 Y -48-4 2 38 27 8 0 4 P -64-27

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 反応工学 Raction Enginring 講義時間 ( 場所 : 火曜 限 (8-A 木曜 限 (S-A 担当 : 山村 火 限 8-A 期末試験中間試験以降 /7( 木 まで持ち込みなし要電卓 /4( 木 質問受付日講義なし 授業アンケート (li campus の入力をお願いします 晶析 (crystallization ( 教科書 p. 濃度 溶解度曲線 C C s A 安定 液 ( 気

More information

第2回

第2回 第 4 回基本データ構造 1 明星大学情報学科 2 3 年前期 アルゴリズムとデータ構造 Ⅰ 第 4 回 Page 1 配列 スタック キューとその操作 4-1. 配列とその操作 配列型 同じ型の変数を並べたもの 配列にする型は 基本型 配列型 構造体 ポインタいずれでもよい 要素の並べ方を 次元 という 1 次元配列 ( 直線状 ) 2 次元配列 ( 平面状 ) 3 次元配列 ( 立体状 ) a[5]

More information

相同性配列検索ツール:GHOST-MPと ヒト口腔内メタゲノム解析

相同性配列検索ツール:GHOST-MPと ヒト口腔内メタゲノム解析 並列配列相同性検索プログラム GHOST-MP 講習会 ( 講義編 ) 2015 年 3 月 20 日 東京工業大学大学院情報理工学研究科 角田将典 石田貴士 秋山泰 1 講師紹介 角田将典かくたまさのり 石田貴士いしだたかし 秋山泰あきやまゆたか 東京工業大学大学院情報理工学研究科計算工学専攻 2 本日の予定 13:00-13:05 ごあいさつ 13:05-13:50 GHOST-MP 講習 13:50-14:00

More information

スライド 1

スライド 1 NTT Information Sharing Platform Laboratories NTT 情報流通プラットフォーム研究所 セマンティック Web 技術を用いた社内情報の連携 森田大翼 飯塚京士 ( 日本電信電話株式会社 NTT 情報流通プラットフォーム研究所 ) セマンティック Web コンファレンス 2012 2012 年 3 月 8 日 ( 木 ) 2012 NTT Information

More information

PowerPoint Presentation

PowerPoint Presentation 最適化手法 第 回 工学部計数工学科 定兼邦彦 http://researchmap.jp/sada/resources/ 前回の補足 グラフのある点の隣接点をリストで表現すると説明したが, 単に隣接点の集合を持っていると思ってよい. 互いに素な集合のデータ構造でも, 単なる集合と思ってよい. 8 3 4 3 3 4 3 4 E v 重み 3 8 3 4 4 3 {{,},{3,8}} {{3,},{4,}}

More information