毎回変動し, 必ずしも良い結果を出力するとは限らない. 理由の一つとして,GS 法は配列データごとに, ランダムに与えた初期値に基づいて類似部分配列の位置を確率的に更新している為, 計算途中でそれらの位置が常に変動し, 結果が安定しないという問題が発生する. 本稿では, この問題を解決する為に, 配

Size: px
Start display at page:

Download "毎回変動し, 必ずしも良い結果を出力するとは限らない. 理由の一つとして,GS 法は配列データごとに, ランダムに与えた初期値に基づいて類似部分配列の位置を確率的に更新している為, 計算途中でそれらの位置が常に変動し, 結果が安定しないという問題が発生する. 本稿では, この問題を解決する為に, 配"

Transcription

1 E5-2 アラインメントされた配列集合からモチーフを 福本翔平 抽出する方法 北上始 森康真 広島市立大学情報科学部知能工学科 広島市立大学大学院情報科学研究科知能工学専攻 広島市安佐南大塚東 3 丁目 4 番 1 号 s20160@edu.ipc.hiroshima-cu.ac.jp {kitakami, mori}@hiroshima-cu.ac.jp あらまし配列データベースから類似部分の多い部分配列, すなわち, モチーフを抽出す る方法は, 数多く提案されている. その中でも, 文字の出現頻度を考慮した GS( ギブスサ ンプリング ) 法は, 最も有名な抽出方法として知られている. しかし, その方法は必ずし も正しいとは限らない. その理由の一つとして,GS 法は, 配列データごとに, 類似部分配 列の位置を確率的に計算している為, それらの位置が常に変動するという問題がある. 本 稿では, その問題を解決する為に, 配列データベースを予めアラインメントした上で, ギ ャップを考慮した新しいプロファイル計算法を用いて高い出現頻度を持つ類似部分配列を 抽出する方法を提案する. また, 提案手法と従来手法 (GS 法 ) の比較実験を行ったので, その実験結果について報告する. キーワードデータマイニング, テキストマイニング, バイオインフォマティクス, 科学 データ管理 科学データベース 1. はじめに 配列データベースから類似部分が存在するパターンを抽出する方法は, テキストデータの規則的な共通部分を取り出すだけでなく, アミノ酸などの分子配列データからモチーフを抽出する方法として幅広く使用されている. アミノ酸は 20 種類存在し, それぞれにはアルファベット1 文字を対応させて表現している. モチーフとは, アミノ酸配列で生物学的に重要な機能を果たす特徴的な類似パターンのことである. 自然界には, さまざまなモチーフが存在するため, それらは,PROSITE [2] や Pfam などのデータベースで管理されている. 同じ機能を持つモチーフを集めてみると, それらのアミノ酸配列は, お互いに類似しており, 完全に一致しない場合が多い. すなわち, モチーフ の表現には曖昧性が含まれている. このためモチーフの曖昧性は正規表現を用いて表現されている. 正規表現により, モチーフに含まれるアミノ酸配列の類似性を簡単に把握することが出来る. 正規表現されたモチーフを導出するためには, 類似する部分配列を配列データベースから抽出する方法が大変重要になるが, 様々な抽出方法が存在する. その中でも最も有名な抽出方法として知られているのが,GS( ギブスサンプリング ) 法である. GS 法は文字の出現頻度を考慮した確率的最適化アルゴリズムであり, 抽出する配列の長さ k をユーザが指定する事で, その長さ k を持つ類似部分配列 ( 以後,k- 類似部分配列と呼ぶ ) を出力する事が出来る. しかし,GS 法は, 計算結果の精度が

2 毎回変動し, 必ずしも良い結果を出力するとは限らない. 理由の一つとして,GS 法は配列データごとに, ランダムに与えた初期値に基づいて類似部分配列の位置を確率的に更新している為, 計算途中でそれらの位置が常に変動し, 結果が安定しないという問題が発生する. 本稿では, この問題を解決する為に, 配列データベースを予めアラインメントした上で, 高い出現頻度を持つ類似部分配列を抽出する GS-Align 法を提案する. 具体的には, 先ず, マルチプルアラインメント [1] により各配列の最適な位置にギャップを挿入する. これにより, 各配列の長さを整え, 配列間の類似部分を同じ位置に配置したデータベースを作成できる. 次に, ギャップ文字ができるだけ類似部分配列に含まれないようにするために, ギャップを考慮した新しいプロファイル計算法を導入し, プロファイルを計算する. 最後に,GS 法で用いられている評価方法を取扱い, 類似部分がより多く存在するパターンを抽出する. これにより GS 法を使用する際に常に変動していた結果を可能な限り抑え, ある程度まとまった結果を抽出可能にする. 以下, 本稿の構成を示す.2 章では類似部分配列抽出に関する関連研究について述べる.3 章は従来の手法である GS 法の詳細について,4 章では提案手法である GS-Align 法の詳細について述べる.5 章では GS 法と GS-Align 法の結果を比較して評価を行い,6 章では本稿のまとめと今後の課題について述べる. の多い文字列に変更するという基本操作がある. この基本操作を繰り返し実行することで, モチーフの構成要素となる k- 類似部分配列を探索する. この一連の動作は統計値を推定するアルゴリズムではなく, 解を繰り返し求め直す事で近似の解を求めていく焼きなまし法と言う手法である. 正確には焼きなまし法の一種である確率的最適化アルゴリズムと見做すことができる. GS 法は k- 類似部分配列を抽出するにあたって非常に有効な手段となっている. しかしながら, 出力されたデータは, 必ずしも正確なモチーフを抽出しているとは限らない. 配列データベース内の k- 部分文字列を取り出す際は, 配列ごとに確率的に k- 類似部分配列を見つけ出すという計算を行っているので,k- 類似部分配列の存在位置の探索が不安定であり, 結果が本来抽出すべきモチーフから外れる可能性があるという問題を抱えている. この問題を解決するために, 本稿では, 以下の処理手順から成る GS-align 法を提案している. (1) 予め収集した配列データベースをマルチプルアラインメントする. その結果をマルチプルアラインメント済み配列集合と呼ぶ. (2) マルチプルアラインメント済み配列集合に対して新しいプロファイル計算法を適用し, プロファイルから相対エントロピーが最大となるクラスタを1つだけ選択する. ただし, クラスタとは, マルチプルアラインメント済み配列集合の同じ列から選択される k- 部分文字列の集合をさす. 2. 関連研究配列データベースから k- 類似部分配列を抽出する方法で, 最も有効な手法は,Lawrence らが提案した GS( ギブスサンプリング ) 法 [3][4] である. GS 法では, 配列データベース内からランダムに取り出した複数の文字列の出現頻度を計算して頻度 3. 従来の抽出手法本章では, 従来の手法である GS 法を用いた類似部分配列の抽出方法と, 抽出した類似部分配列 (k- 部分配列集合 ) の評価方法について説明する. k- 部分配列集合とは,GS 処理において, 配列データベースの各配列からランダムに取り出される長

3 さ k の部分文字列集合の事である.k の値はユーザー側が任意で与え, それにより k の値分の部分文字列を取り出す仕組みとなっている. 以下に配列データベースと k - 部分配列集合の詳細を示す. 3.1 ギブスサンプリング配列データベース DB は n 種類の文字からなる文字集合 = {a 1, a 2,, a n } で定義されているとする. また, 全配列数はDB = {s 1, s 2,, s N } の式から N 本として見なす. る生起確率を計算する. それにより n k 個の結果が算出され, それらを n k 行列で表現したものをプロファイル (p n,k ) と呼ぶ. プロファイルは出現頻度を求める際に必要となる. (2) 出現頻度候補となる k- 部分文字列集合に存在する1 つの文字列 x = a 1, a 2,, a k の出現頻度 P x を計算する. 計算方法は P x = p 11 p 22 p nk と定められている. ちなみに x の部 位に存在する文字 a i が行列の i 行目に対応するならば,p ij は j 列目における文字 a i の生起確率と見なす. これにより, 文字列 x の確率が高ければ k- 部分配列集合の総意に類似し, 低ければ類似しない事が意味される. 図 1 配列データベースと k- 部分配列集合 GS 法の主な目的は図 1 のように, 文字列集合 である DB = {s 1, s 2,, s N } から, ユーザが定めた k 値分の k - 部分配列を取り出し, お互いにできるだ 図 2 k- 部分配列集合とプロファイル け類似した部分配列集合となるように様々な計算 方法を行って変更していくものである. その計算を行うためには, プロファイル, 出現頻度, 背景頻度の三種類の方法が挙げられる.GS 法を実行した際に存在する k - 部分配列集合に対して, これら三種類の計算方法は以下のように定められている. (1) プロファイルプロファイルの初期値は, 各配列データからランダムに選択された k- 部分配列の集合を用いて計算される. その後は, 新しく計 (3) 背景頻度解候補である k - 部分配列集合以外の部位 BS に存在する各文字 = {a 1, a 2,, a n } の出現確率を背景頻度としている. 文字 a i の背景頻度 b ai は BS に存在する文字 a i の生起確率と見なす. これにより k- 部分文字列集合に存在する一つの文字列 x = a 1, a 2,, a k の背景頻度 Q x は,b a1 b a2 b ak と計算する事で求められる. 算された出現頻度や背景頻度を用いて, 再 計算される. 取り出した k- 部分配列集合に おいて,k 個の列ごとに n 個の各文字に対す

4 ばれる評価関数を用いている. その計算を行うた めには先ず, ベイズ統計解析を考慮したプロファ イル E ij を式 (1) のように定義する. E ij = (C ij + b i ) ((n 1) + B) (1) C ij とは, プロファイル p nk の i 行目に該当する 図 3 k- 部分文字列群に対する BS 法 GS 法は,DB = {s 1, s 2,, s N } からランダムに選択された行列 Z を用いる事で, 出現頻度が高くかつ背景頻度の低い k- 部分文字列集合を抽出する処理を行っており, そのアルゴリズムを図 4に示す. 文字が j 列目に現れる数である.n は配列総数,B は (n) 1 2と定め, プロファイルの i 行目に該当する文字の全配列に対する相対出現頻度をf i とする. また, プロファイルの i 行目に該当する文字の疑似度数 b i はf i Bとしており, 分子のゼロ除算を回避するた めに扱われている. 1 DB の各配列に対して,k- 部分配列の開始点 st i をランダムに選び, それらを行列順に並べた k- 部分文字配列 S = {st 1, st 2,, st N } を初期値とする. 2 DB からランダムに一つの配列 Z を選択する. 3 Z 以外である N-1 個の配列データベース DB -Z から図 2 のようなプロファイル (p n,k ) を算出する. 4 配列 Z の長さを L と見なす.Z 内に存在する l i k + 1 (i = 1,, L) 個の k- 部分配列 x について, 出現頻度 P x および背景頻度 Q x を計算し, この計算によって算出されたプロファイル E ij による相対エントロピー F は以下の式 (2) となる. また,DB 内に存在する文字の種類は, 扱う DB の 種類によって変動するので, ここでは 20 種類と仮 定する. k 20 F = C ij log i=1 j=1 ( E ij b i ) (2) この式を k- 部分文字配列に当てはめる事によ って, 得られた値が 0 に近ければ類似部分配列と して近似しており,0 よりもマイナス側に遠ざかれ ば類似していないものとして判断する事が出来る. 双方の比である R x = P x /Q x を算出する. 5 {R 1, R 2,, R li k+1} (i = 1,, L) となった各値から, 比例した確率でランダムにE r を選択し, E r に対応する k- 部分配列を新たな開始点 st Z として更新する. 6 結果が収束するまで2~6を繰り返す. 繰り返し回数は多いほど良い結果が出力されるが, その分実行時間が大幅に伸びる. 図 4 GS 法のアルゴリズム 4. 提案する類似部分配列抽出法本章では, 配列データベース DB から比較的安定した類似部分配列を抽出させる GS-Align 法を提案する. そのために, 先ず,DB に含まれる配列データの長さを統一するために利用されるマルチプルアラインメント操作について説明する. 次に, マルチプルアラインメントが行われた DB から同じ長さ k の類似部分配列の集合を抽出する GS-Align 法について述べる. GS-Align 法と GS 法 3.2 k- 部分配列集合の評価法 配列データベース DB から抽出する類似部分配 列を評価する方法として, 相対エントロピーと呼 を利用するに当たって, どちらも, ユーザ側が k- 部分文字配列の k 値を予め設定しなければならな い.

5 4.1 マルチプルアラインメントマルチプルアラインメントとは生物学などで扱われる手法の一つであり,DNA やアミノ酸等といった配列を類似した部分で特定できるように並べ替えたものである. 以下では, これを単にアラインメントと呼ぶ. 図 5にアラインメントの例を示す. この手法によって, 配列データの各文字が他の配列データのどの文字に対応するのかを決めることができる. このため, 類似部分配列を一目で見つけやすくなる. アラインメント結果には, ギャップと呼ばれる記号 (-) が存在しているが, これは類似部分を整列化させる為に組み込まれた記号である. アラインメントする為に用いられる表現方法であり,1 行目はシーケンスデータの詳細,2 行目以降は実際のデータの文字列で構成されている. 本稿でもその形式を採用する必要があるが, PROSITE 内のアミノ酸データは FASTA 形式で既に記述されている為, 抽出を行うのみで良く, 余計な変換をする必要はない. これによってアラインメントされたデータを文字列集合 DB として扱い, 提案手法であるプログラム GS-Align 法に与え, 類似部分を抽出していく. ただし, 問題となる部分もあり,ClustalX によるアラインメントはノイズも少なからず関与しているので, 完全にアラインメントされた結果が出 力される訳ではない. 4.2 提案手法 GS-Align 法は,GS 法の問題点である出力結果の変動や精度を改善することを意図して提案された手法である.GS-Align 法で入力するデータはアラインメントした DB 以外に, 抽出する配列の長さ 図 5 アラインメントの例 k を設定する必要がある.k の値は抽出するモチー フの長さから決定し,DB はギャップも含まれて 配列データベース DB に含まれる各配列データの長さは不統一であるが, ギャップを組み込むことで同じ長さに統一している.GS 法は DB の長さが不統一であっても動作は可能であるが, 解を安定的に取得できない. 我々が提案する手法は, アラインメントを予め実施するので, 類似部分の整列化と長さの統一化が図られ, 解の安定的な取得が期待できる. そのアラインメントを行うプログラムとして, 本稿では ClustalX [1] と呼ばれている系統解析用のプログラムを使用した. 扱うデータに関しては PROSITE [2] から抽出した特定のアミノ酸データを用いる. 動作を行うためには先ず,ClustalX に読み いる為その分の長さも考慮して決定する. GS-Align 法ではギャップを考慮した新しいプロファイル計算法により算出されるプロファイル G nk と,GS 法で行った k- 部分配列集合の評価関数である相対エントロピーの式 (1)(2) を用いる. プロファイルG nk の計算方法として, 先ず GS 法で用いたプロファイルp nk をG nk とする. その後 k 列ごとの生起確率の合計値 SUM を求め, 列ごとに存在するギャップの生起確率を計算する 最後にそれらを n 個の各文字に割り当てるように1 文字ごとの確率 R を加算する. プロファイルG nk を算出するための, 新しいプロファイル計算方法は以下の式 (3)(4) の通りである. 込ませるデータを FASTA 形式に変換する必要があ る.FASTA 形式とは, 塩基配列やアミノ酸配列を R = 1 SUM n (3)

6 G nk = G nk + R (4) 評価する部分は GS 法と同じく予測される k- 部分 タを抽出し, 類似部分配列として表現する. 図 7 に提案するアルゴリズムを示す. 配列集合である t k だが, 参照する範囲は異なる. 先ずアラインメントによって統一された DB 全体の長さを L とすると,1つの k- 部分配列集合の長さが k である事から,L k + 1 個の k- 部分配列集合が作られる. 以下では,DB を矩形の N L 行列とみなし, 各集合 (k L 行列 ) を特にクラスタと呼ぶ ( 図 6).L k + 1 個のクラスタを GS 法の評価法に基づいて計算し, 相対エントロピーの値が最も高いクラスタを類似部分配列集合と見なして抽出する. 1 ClustalX にてアラインメントされた DB から, 長さ k の値分の部分配列集合 (t k) を1 クラスタと見なす. 2 プロファイルp nk から1クラスタ分のプロファイルG nk を算出する. 3 プロファイルG nk を基に相対エントロピーの評価関数を算出する. 4 L-k+1 個分のクラスタが終了するまで,3~ 4を繰り返す. L 文字 (L-k+1) 番目 5 L-k+1 個分の相対エントロピーから最も値の 大きい k- 部分配列集合を呼び出し,k- 類似部分 N 個 1 番目のクラスタ i 番目のクラスタ クラスタ 配列集合として出力する. 図 7. 提案するアルゴリズム k 文字 k 文字 k 文字図 6 DB 内に存在するクラスタ 5. 評価実験 本章では, 閾値を 0.1 として, 提案手法の評価 実験を行う. 性能評価のために使用した配列デー また, あるクラスタにおける文字列集合の始点と終点にギャップが存在している場合は, その数をカウントし,{ 一クラスタにおけるカウント数 t 閾値 } を満たす場合に限り, 解の候補とするため評価関数を計算する. 理由の1つとして, モチーフを表現する正規表現において, 始点や終点にギャップは存在しないことが挙げられる. よって, そのような k- 部分配列集合を解の候補から除外するための処置として行っている. しかし, このような操作を行っても, 始点と終点にギャップが含まれている文字列は完全には除去できないので, そのようなギャップ入りの部分文字列が存在する場合はその k- 部分文字列だけを削除する操作を行っている. GS-Align はアラインメントされた DB を用いて タベースは,PROSITE 内に登録されているアミノ 酸データセットを5つ用いた. 扱う5つのデータ は, タンパク質の中でも有効な働きをする有名な アミノ酸配列データベースである. 詳細は以下に 示す. モチーフの長さに関しては, ギャップ込み で表 1 および表 2 に示している. 表 1 PROSITE のデータセット 番号 モチーフ名 登録番号 長さ 件数 1 Kringle PS Homeobox PS PTS_EIIA PS HTH_ASNC PS HTH_DEOR PS 複数のクラスタから評価関数が最も大きいクラス

7 表 3 提案手法と GS 法との精度結果比較 番号 モチーフ名 提案手法 (%) 従来手法 (%) 1 Kringle Homeobox PTS_EIIA HTH_ASNC HTH_DEOR [DENQ]-x(6)-[LIVMF]-[GA]-x(7)-[LIVM]-A 表 2 各モチーフの正規表現番号正規表現 ( ギャップ有 ) 1 [FY]-C-[RH]-[NS]-x(18)-[WY]-C 2 [LIVMFYG]-[ASLVR]-x(2)-[LIVMSTACN]- x-[livm]-{y}-x(32)-{l}-[liv]-[rknqest AIY]-[LIVFSTNKH]-W-[FYVC]-x-[NDQTA H]-x(80)-[RKNAIMW] -[LIVM]-P-H-[GAC] 4 [GSTAP]-x(2)-[DNEQA]-[LIVM]-[GSA]-x(2 )-[LIVMFYT]-[GAN]-[LIVMST]-[ST]-x(6)- R-[LIVT]-x(2)-[LIVM]-x(13)-G 5 R-{G}-x(2)-[LIVM]-x(3)-[LIVM]-x(17)-[ST A]-x(2)-T-[LIVMA]-[RH]-[KRNAQ]-D-[LIV MF] 比較結果を見る限りでは, 提案方式が従来手法よりも確実に優れている訳ではない. そのため, 提案手法に対する改良の余地が未だに残されている. 改良する部分としては, ギャップの少ない DB に対する計算方法の変更にある.4 章で述べたように, アラインメントされた DB には少なからずノイズが発生する. そのノイズの割合や挿入され るギャップの頻度によって, 提案手法で抽出され 従来手法 (GS 法 ) の実行において, 処理の繰 る類似部分配列集合の結果が変わることがある. り返し回数は, データセットごとの DB 内の文字数 とした. 繰り返し回数をそれ以上に増加させたが, 相対エントロピーが既に収束しているので, 計算 結果が変化することがなかった. 表 4 データセットにおけるモチーフ内のノイズ 番号モチーフ名ノイズの割合 1 Kringle Homeobox 従来手法と提案手法との性能を比較するために, 以下で定義される精度の式 (5) を利用する. 精度 (%)= B 100 (5) B + C ただし, そして検索で合致した範囲を B として, 検索されたノイズの部分を C とする. この式は本来抽出すべき範囲と抽出した範囲がどの程度合致しているかを数値化したものであり, 百分率 (%) で表され, 数値が高い程一致している部分が多いと見なされる. 3 PTS_EIIA HTH_ASNC HTH_DEOR 表 3 および表 4 より, ノイズが少なくギャップ の割合も少ない HTH_DEOR は, モチーフを抽出し にくい傾向となっている. すなわち, 元の DB をア ラインメントする際に, モチーフ ( 正解 ) ではな い他の部分も類似した文字集合として整列されて しまう可能性があるので, そういった部分を類似 部分配列として探索してしまう事が問題となって 表 3 は, 従来手法と提案手法の精度を比較した いる. 表である.

8 相対エントロピー値 文字列の先頭からの位置 図 8 提案手法を HTH_DEOR で実行した結果 配列パターンを含むクラスタは, 正解になるかどうかの検討が重要である. (2) 従来手法の図 3 にて行われている背景頻度の取り扱いや DB 内の文字 = {a 1, a 2 a n } の関係性を数値化した Blosum62 など, クラスタ内のプロファイル以外から類似部分を探索する新たな操作が必要である. 完全な解を探すことは難しいが, 今後, 新たな手 法を導入することにより, 高精度な近似解を見つ 図 8 において, 縦線が引かれている x 軸のパターンが抽出すべきモチーフ ( 正解 ) であり, 点で示されている部分は, 提案手法で抽出されたクラスタである. ただし, クラスタの位置とは, クラスタの 1 列目が DB 上に存在する位置をさす. この図からもわかるように, モチーフパターン ( 正解 ) 以外のクラスタにも相対エントロピーの最大値に近いピークがいくつか存在する. すなわち, モチーフ ( 正解 ) 以外に,k- 類似部分配列集合と見なされる可能性のあるクラスタが複数存在するという新たな問題がある. 6. まとめ本稿では,DB をアラインメントする事によって k- 類似部分配列であるモチーフの抽出を行った. 5 件のデータセットを用いた評価実験では,1 件のデータセット (Homeobox) 除いて, 提案手法は従来手法よりも精度が向上し, 安定した結果を出力した.Homeobox のデータセットについては, 精度が向上しなかった原因を調査し, 改良を加える必要がある. 今後の課題は, 以下のとおりである. (1) 相対エントロピーに関して, 複数のピークから正しいピークを選択する方法として, 最小汎化集合の要素を支持数でランキングする方法も考えられる. 支持数が最大となる汎化 けることができるのではないかと考えられる. 謝辞本研究の一部は, 日本学術振興会 科学研究費補助金 ( 基盤研究 (C), 課題番号 : ) の支援により行われた. 参考文献 [1] M.A.Larkin, G.Blackshields, N.P.Brown, R.Chenna, P.A.McGettigan, H.McWilliam, F.Valentin, I.M.Wallace, A.Wilm, R.Lopez, J.D.Thompson, T.J.Gibson and D.G.Higgins : Clustal W and Clustal X version 2.0, Bioinformatics, Applications Note, Vol.23 No.21, pp , (ClustalX: [2] PROSITE: [3] Lawrence C. E., ALtschul, S. F., Bogushi, M. S., Liu, J. S., Neuwald, A. N. and Wotton, J.: Detecting subtle sequence signals: A Gibbs Sampling Strategy for Multiple Alignment, Science, 263, pp , [4] Liu,J.S., Neuwald,A.N. and Lawrence,C.E.: Bayesian Model for Multiple Local Sequence Alignment and Gibbs Sampling Strategies, JASA, 90, pp , 1995.

生命情報学

生命情報学 生命情報学 5 隠れマルコフモデル 阿久津達也 京都大学化学研究所 バイオインフォマティクスセンター 内容 配列モチーフ 最尤推定 ベイズ推定 M 推定 隠れマルコフモデル HMM Verアルゴリズム EMアルゴリズム Baum-Welchアルゴリズム 前向きアルゴリズム 後向きアルゴリズム プロファイル HMM 配列モチーフ モチーフ発見 配列モチーフ : 同じ機能を持つ遺伝子配列などに見られる共通の文字列パターン

More information

A Constructive Approach to Gene Expression Dynamics

A Constructive Approach to Gene Expression Dynamics 配列アラインメント (I): 大域アラインメント http://www.lab.tohou.ac.jp/sci/is/nacher/eaching/bioinformatics/ week.pdf 08/4/0 08/4/0 基本的な考え方 バイオインフォマティクスにはさまざまなアルゴリズムがありますが その多くにおいて基本的な考え方は 配列が類似していれば 機能も類似している というものである 例えば

More information

5_motif 公開版.ppt

5_motif 公開版.ppt 配列モチーフ 機能ドメイン 機能部位 機能的 構造的に重要な部位 は進化の過程で保存 される傾向がある 進化的に保存された ドメイン 配列モチーフ 機能ドメイン中の特徴的な 保存配列パターン マルチプルアライメント から抽出 配列モチーフの表現方法 パターン プロファイル 2 n n n n n n n n ENCODE n PROSITE パターンの例 n C-x(2,4)-C-x(3)-[LIVMFYWC]-x(8)-H-x(3,5)-H.

More information

以下, 本稿の構成を示す.2 章では類似部分配列抽出に関する関連研究について述べる.3 章は従来手法であるギブスサンプリング法について,4 章では提案手法 Gibbs-DMGG について述べる.5 章では実験の処理手順について説明し,6 章では提案手法の評価を行い,7 章ではまとめと今後の課題を述べ

以下, 本稿の構成を示す.2 章では類似部分配列抽出に関する関連研究について述べる.3 章は従来手法であるギブスサンプリング法について,4 章では提案手法 Gibbs-DMGG について述べる.5 章では実験の処理手順について説明し,6 章では提案手法の評価を行い,7 章ではまとめと今後の課題を述べ ギブスサンプリングとアラインメント処理に基づく類似部分配列の抽出方式 河野修久 田村慶一 森康真 北上始 配列データマイニング処理では, 配列データベースから非常に多くの頻出配列パターンが抽出される. この頻出配列パターンを大幅に削減するために, 本論文では, 遺伝的アルゴリズムの世代交代モデルの 1 つである Minimal Generation Gap (MGG) と分散遺伝的アルゴリズム (

More information

次元圧縮法を導入したクエリに基づくバイクラスタリング 情報推薦への応用 武内充三浦功輝岡田吉史 ( 室蘭工業大学 ) 概要以前, 我々はクエリに基づくバイクラスタリングを用いた情報推薦手法を提案した. 本研究では, 新たに推薦スコアが非常に良く似たユーザまたはアイテムを融合する次元圧縮法を導入した. 実験として, 縮減前と縮減後のデータセットのサイズとバイクラスタ計算時間の比較を行う. キーワード

More information

Microsoft PowerPoint - ad11-09.pptx

Microsoft PowerPoint - ad11-09.pptx 無向グラフと有向グラフ 無向グラフ G=(V, E) 頂点集合 V 頂点の対を表す枝の集合 E e=(u,v) 頂点 u, v は枝 e の端点 f c 0 a 1 e b d 有向グラフ G=(V, E) 頂点集合 V 頂点の順序対を表す枝の集合 E e=(u,v) 頂点 uは枝 eの始点頂点 vは枝 eの終点 f c 0 a 1 e b d グラフのデータ構造 グラフ G=(V, E) を表現するデータ構造

More information

Microsoft PowerPoint - lecture a.pptx

Microsoft PowerPoint - lecture a.pptx 本日 (3 時限目 ) の内容 バイオインフォマティクス ( 生命情報学 ) 応用生命科学 情報生命学第 3 回配列解析入門 生物学と情報学の学際領域の学問分野 目的 生物データに対する情報解析技術の開発 情報解析技術を利用した新たな生物学的知識の発見 生物学の実験技術の革新 ( 例 : 次世代シークエンサー ) 大量のデータ ウェット ( 実験 ) とドライ ( 解析 ) の協力が不可欠 2 3

More information

コンピュータ応用・演習 情報処理システム

コンピュータ応用・演習 情報処理システム 2010 年 12 月 15 日 データエンジニアリング 演習 情報処理システム データマイニング ~ データからの自動知識獲得手法 ~ 1. 演習の目的 (1) 多種多様な膨大な量のデータを解析し, 企業の経営活動などに活用することが望まれている. 大規模データベースを有効に活用する, データマイニング技術の研究が脚光を浴びている 1 1. 演習の目的 (2) POS データを用いて顧客の購買パターンを分析する.

More information

Microsoft Word - 操作マニュアル-Excel-2.doc

Microsoft Word - 操作マニュアル-Excel-2.doc Excel プログラム開発の練習マニュアルー 1 ( 関数の学習 ) 作成 2015.01.31 修正 2015.02.04 本マニュアルでは Excel のプログラム開発を行なうに当たって まずは Excel の関数に関する学習 について記述する Ⅰ.Excel の関数に関する学習 1. 初めに Excel は単なる表計算のソフトと思っている方も多いと思います しかし Excel には 一般的に使用する

More information

次に示す数値の並びを昇順にソートするものとする このソートでは配列の末尾側から操作を行っていく まず 末尾の数値 9 と 8 に着目する 昇順にソートするので この値を交換すると以下の数値の並びになる 次に末尾側から 2 番目と 3 番目の 1

次に示す数値の並びを昇順にソートするものとする このソートでは配列の末尾側から操作を行っていく まず 末尾の数値 9 と 8 に着目する 昇順にソートするので この値を交換すると以下の数値の並びになる 次に末尾側から 2 番目と 3 番目の 1 4. ソート ( 教科書 p.205-p.273) 整列すなわちソートは アプリケーションを作成する際には良く使われる基本的な操作であり 今までに数多くのソートのアルゴリズムが考えられてきた 今回はこれらソートのアルゴリズムについて学習していく ソートとはソートとは与えられたデータの集合をキーとなる項目の値の大小関係に基づき 一定の順序で並べ替える操作である ソートには図 1 に示すように キーの値の小さいデータを先頭に並べる

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

したがって このモデルではの長さをもつ潜在履歴 latent history が存在し 同様に と指標化して扱うことができる 以下では 潜在的に起こりうる履歴を潜在履歴 latent history 実際にデ ータとして記録された履歴を記録履歴 recorded history ということにする M

したがって このモデルではの長さをもつ潜在履歴 latent history が存在し 同様に と指標化して扱うことができる 以下では 潜在的に起こりうる履歴を潜在履歴 latent history 実際にデ ータとして記録された履歴を記録履歴 recorded history ということにする M Bayesian Inference with ecological applications Chapter 10 Bayesian Inference with ecological applications 輪読会 潜在的な事象を扱うための多項分布モデル Latent Multinomial Models 本章では 記録した頻度データが多項分布に従う潜在的な変数を集約したものと考えられるときの

More information

生命情報学

生命情報学 生命情報学 (2) 配列解析基礎 阿久津達也 京都大学化学研究所 バイオインフォマティクスセンター 配列アラインメントとは? 配列検索 バイオインフォマティクスにおける基本原理 配列が似ていれば機能も似ている ただし 例外はある 配列検索の利用法 実験を行い機能未知の配列が見つかったデータベース中で類似の配列を検索機能既知の類似の配列が見つかれば その配列と似た機能を持つと推定 機能未知の配列 VLPIKSKLP...

More information

_unix_text_command.pptx

_unix_text_command.pptx Unix によるテキストファイル処理 2015/07/30 作業場所 以降の作業は 以下のディレクトリで行います ~/unix15/text/ cd コマンドを用いてディレクトリを移動し pwd コマンドを利用して カレントディレクトリが上記になっていることを確認してください 実習で使用するデータ 講習で使用するデータは以下のフォルダ内 ファイルがあることを確認してください ~/unix15/text/

More information

情報処理Ⅰ

情報処理Ⅰ Java フローチャート -1- フローチャート ( 流れ図 ) プログラムの処理手順 ( アルゴリズム ) を図示したもの 記号の種類は下記のとおり 端子記号 ( 開始 終了 ) 処理記号計算, 代入等 条件の判定 条件 No ループ処理 LOOP start Yes データの入力 出力 print など 定義済み処理処理名 end サンプルグログラム ( 大文字 小文字変換 ) 大文字を入力して下さい

More information

Microsoft Word - NumericalComputation.docx

Microsoft Word - NumericalComputation.docx 数値計算入門 武尾英哉. 離散数学と数値計算 数学的解法の中には理論計算では求められないものもある. 例えば, 定積分は, まずは積分 ( 被積分関数の原始関数をみつけること できなければ値を得ることはできない. また, ある関数の所定の値における微分値を得るには, まずその関数の微分ができなければならない. さらに代数方程式の解を得るためには, 解析的に代数方程式を解く必要がある. ところが, これらは必ずしも解析的に導けるとは限らない.

More information

Microsoft PowerPoint - lecture a.pptx

Microsoft PowerPoint - lecture a.pptx 応用生命科学 情報生命学第 3 回配列解析入門 7 月 14 日 ( 木 ) 3 時限目加藤有己大阪大学大学院医学系研究科講義資料 http://www.med.osakau.ac.p/pub/rna/ykato/lecture/bonfo16/ 授業目的 情報科学と生命科学の融合領域である情報生命科学の基本的な手法を理解することを目的とする 日程 3 時限目 4 時限目 6 月 30 日 ( 木

More information

ボルツマンマシンの高速化

ボルツマンマシンの高速化 1. はじめに ボルツマン学習と平均場近似 山梨大学工学部宗久研究室 G04MK016 鳥居圭太 ボルツマンマシンは学習可能な相互結合型ネットワー クの代表的なものである. ボルツマンマシンには, 学習のための統計平均を取る必要があり, 結果を求めるまでに長い時間がかかってしまうという欠点がある. そこで, 学習の高速化のために, 統計を取る2つのステップについて, 以下のことを行う. まず1つ目のステップでは,

More information

アルゴリズム入門

アルゴリズム入門 アルゴリズム入門 第 11 回 ~ パターン認識 (1)~ 情報理工学系研究科 創造情報学専攻 中山英樹 1 今日の内容 パターン認識問題の 1 つ : アラインメント アルゴリズム 再帰 動的計画法 2 パターン認識 音や画像の中に隠れたパターンを認識する 音素 音節 単語 文 基本図形 文字 指紋 物体 人物 顔 パターン は唯一のデータではなく 似通ったデータの集まりを表している 多様性 ノイズ

More information

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

PowerPoint Presentation

PowerPoint Presentation パターン認識入門 パターン認識 音や画像に中に隠れたパターンを認識する 音素 音節 単語 文 基本図形 文字 指紋 物体 人物 顔 パターン は唯一のデータではなく 似通ったデータの集まりを表している 多様性 ノイズ 等しい から 似ている へ ~ だ から ~ らしい へ 等しい から 似ている へ 完全に等しいかどうかではなく 似ているか どうかを判定する パターンを代表する模範的データとどのくらい似ているか

More information

IPSJ SIG Technical Report 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version C

IPSJ SIG Technical Report 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version C 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version Control System: VCS)?? 1 NNCT, 22 Yatatyou,Yamatokoriyamashi, Nara 639 1080, Japan

More information

スライド 1

スライド 1 Keal H. Sahn A R. Crc: A dual teperature sulated annealng approach for solvng blevel prograng probles Coputers and Checal Engneerng Vol. 23 pp. 11-251998. 第 12 回論文ゼミ 2013/07/12( 金 ) #4 M1 今泉孝章 2 段階計画問題とは

More information

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110,

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦   形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110, オートマトン 形式言語及び演習 1 有限オートマトンとは 酒井正彦 wwwtrscssinagoya-uacjp/~sakai/lecture/automata/ 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110, } 形式言語 : 数学モデルに基づいて定義された言語 認識機械 : 文字列が該当言語に属するか? 文字列 機械 受理

More information

Microsoft PowerPoint - 3.ppt [互換モード]

Microsoft PowerPoint - 3.ppt [互換モード] 3. プッシュダウンオートマトンと文脈自由文法 1 3-1. プッシュダウンオートマトン オートマトンはメモリがほとんど無かった この制限を除いた機械を考える 理想的なスタックを利用できるようなオートマトンをプッシュダウンオートマトン (Push Down Automaton,PDA) という 0 1 入力テープ 1 a 1 1 0 1 スタッb 入力テープを一度走査したあと ク2 入力テプを度走査したあと

More information

Taro-再帰関数Ⅲ(公開版).jtd

Taro-再帰関数Ⅲ(公開版).jtd 0. 目次 1 1. ソート 1 1. 1 挿入ソート 1 1. 2 クイックソート 1 1. 3 マージソート - 1 - 1 1. ソート 1 1. 1 挿入ソート 挿入ソートを再帰関数 isort を用いて書く 整列しているデータ (a[1] から a[n-1] まで ) に a[n] を挿入する操作を繰り返す 再帰的定義 isort(a[1],,a[n]) = insert(isort(a[1],,a[n-1]),a[n])

More information

Microsoft PowerPoint - 05.pptx

Microsoft PowerPoint - 05.pptx アルゴリズムとデータ構造第 5 回 : データ構造 (1) 探索問題に対応するデータ構造 担当 : 上原隆平 (uehara) 2015/04/17 アルゴリズムとデータ構造 アルゴリズム : 問題を解く手順を記述 データ構造 : データや計算の途中結果を蓄える形式 計算の効率に大きく影響を与える 例 : 配列 連結リスト スタック キュー 優先順位付きキュー 木構造 今回と次回で探索問題を例に説明

More information

情報量と符号化

情報量と符号化 I. ここでの目的情報量の単位はビットで 2 種の文字を持つ記号の情報量が 1 ビットです ここでは 一般に n 種の文字を持つ記号の情報量を定義します 次に 出現する文字に偏りがある場合の平均情報量を定義します この平均情報量は 記号を適当に 0,1 で符号化する場合の平均符号長にほぼ等しくなることがわかります II. 情報量とは A. bit 情報量の単位としてbitが利用されます 1bitは0か1の情報を運びます

More information

6 文字列処理 ( 教科書 p.301p.332) 今回は 言語の文字列処理について復習し, 文字列の探索手法について学びます. 文字列とはプログラム上での文字の並びを表すのが文字列です. これは中身が空であっても同様に呼ばれます. 言語では "STRING" のように文字の並びを二重引用符 " で囲んだものを文字列リテラルと呼びます. SII コードの場合, 割り当てられる数値は図 1 のようになっています.

More information

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - H17-5時限(パターン認識).ppt パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を

More information

nlp1-12.key

nlp1-12.key 自然言語処理論 I 12. テキスト処理 ( 文字列照合と検索 ) 情報検索 information retrieval (IR) 広義の情報検索 情報源からユーザの持つ問題 ( 情報要求 ) を解決できる情報を見つけ出すこと 狭義の情報検索 文書集合の中から ユーザの検索質問に適合する文書を見つけ出すこと 適合文書 : 検索質問の答えが書いてある文書 テキスト検索 (text retrieval)

More information

memo

memo 計数工学プログラミング演習 ( 第 4 回 ) 2016/05/10 DEPARTMENT OF MATHEMATICA INFORMATICS 1 内容 リスト 疎行列 2 連結リスト (inked ists) オブジェクトをある線形順序に並べて格納するデータ構造 単方向連結リスト (signly linked list) の要素 x キーフィールド key ポインタフィールド next x->next:

More information

第4回バイオインフォマティクスアルゴリズム実習

第4回バイオインフォマティクスアルゴリズム実習 第 5 回バイオインフォマティクスアルゴリズム アラインメントアルゴリズム (3) 慶應義塾大学先端生命科学研究所 アラインメント 置換 挿入 欠損を考慮して塩基配列あるいは アミノ酸配列の似た部分をそろえることギャップ - を挿入する CAAGACATTTTAC CATACACTTTAC CA-AGACATTTTAC CATACAC--TTTAC ** * ** ***** アラインメントはグラフで表現できる

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション コンパイラとプログラミング言語 第 3 4 週 プログラミング言語の形式的な記述 2014 年 4 月 23 日 金岡晃 授業計画 第 1 週 (4/9) コンパイラの概要 第 8 週 (5/28) 下向き構文解析 / 構文解析プログラム 第 2 週 (4/16) コンパイラの構成 第 9 週 (6/4) 中間表現と意味解析 第 3 週 (4/23) プログラミング言語の形式的な記述 第 10 週

More information

4 月 東京都立蔵前工業高等学校平成 30 年度教科 ( 工業 ) 科目 ( プログラミング技術 ) 年間授業計画 教科 :( 工業 ) 科目 :( プログラミング技術 ) 単位数 : 2 単位 対象学年組 :( 第 3 学年電気科 ) 教科担当者 :( 高橋寛 三枝明夫 ) 使用教科書 :( プロ

4 月 東京都立蔵前工業高等学校平成 30 年度教科 ( 工業 ) 科目 ( プログラミング技術 ) 年間授業計画 教科 :( 工業 ) 科目 :( プログラミング技術 ) 単位数 : 2 単位 対象学年組 :( 第 3 学年電気科 ) 教科担当者 :( 高橋寛 三枝明夫 ) 使用教科書 :( プロ 4 東京都立蔵前工業高等学校平成 30 年度教科 ( 工業 ) 科目 ( プログラミング技術 ) 年間授業計画 教科 :( 工業 ) 科目 :( プログラミング技術 ) 単位数 : 2 単位 対象学年組 :( 第 3 学年電気科 ) 教科担当者 :( 高橋寛 三枝明夫 ) 使用教科書 :( プログラミング技術 工業 333 実教出版 ) 共通 : 科目 プログラミング技術 のオリエンテーション プログラミング技術は

More information

PYTHON 資料 電脳梁山泊烏賊塾 PYTHON 入門 文字列 文字列リテラル プログラムの中で文字列を表す方法は幾つか有るが 基本的な方法は下記の 2 種で有る 対象と成る文字の集まりをダブルクオーテーション ( " ) で囲うか シングルクオーテーション ( ' ) で囲う PYTHON3 "

PYTHON 資料 電脳梁山泊烏賊塾 PYTHON 入門 文字列 文字列リテラル プログラムの中で文字列を表す方法は幾つか有るが 基本的な方法は下記の 2 種で有る 対象と成る文字の集まりをダブルクオーテーション (  ) で囲うか シングルクオーテーション ( ' ) で囲う PYTHON3 PYTHON 入門 文字列 文字列リテラル プログラムの中で文字列を表す方法は幾つか有るが 基本的な方法は下記の 2 種で有る 対象と成る文字の集まりをダブルクオーテーション ( " ) で囲うか シングルクオーテーション ( ' ) で囲う " 文字列 " ' 文字列 ' 他のプログラミング言語ではダブルクオーテーションとシングルクオーテーションで囲う場合では エスケープ処理等の扱いが異なる物が多いが

More information

数値計算法

数値計算法 数値計算法 008 4/3 林田清 ( 大阪大学大学院理学研究科 ) 実験データの統計処理その 誤差について 母集団と標本 平均値と標準偏差 誤差伝播 最尤法 平均値につく誤差 誤差 (Error): 真の値からのずれ 測定誤差 物差しが曲がっていた 測定する対象が室温が低いため縮んでいた g の単位までしかデジタル表示されない計りで g 以下 計りの目盛りを読み取る角度によって値が異なる 統計誤差

More information

Microsoft Word - thesis.doc

Microsoft Word - thesis.doc 剛体の基礎理論 -. 剛体の基礎理論初めに本論文で大域的に使用する記号を定義する. 使用する記号トルク撃力力角運動量角速度姿勢対角化された慣性テンソル慣性テンソル運動量速度位置質量時間 J W f F P p .. 質点の並進運動 質点は位置 と速度 P を用いる. ニュートンの運動方程式 という状態を持つ. 但し ここでは速度ではなく運動量 F P F.... より質点の運動は既に明らかであり 質点の状態ベクトル

More information

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074> RD_301 構成要素一覧と検索 から構成要素の編集辞書 ( 削除 ) を作る 作成 ( 編集 ) する削除辞書を開きます 構成要素を検索します ドラック & ドロップでも OK 範囲を選択して右クリック 右クリック 削除辞書に登録 ( 追加 ) したい構成要素を選択しコピーします 削除辞書に追加 ( 貼りつけ ) ます Step5. 削除辞書に構成要素が登録 ( 追加 ) されます 構成要素一覧と検索

More information

Excel2013 データベース1(テーブル機能と並べ替え)

Excel2013 データベース1(テーブル機能と並べ替え) OA スキルアップ EXCEL2013 データベース 1( テーブル機能と並べ替え ) 1 / 8 Excel2013 データベース 1( テーブル機能と並べ替え ) データベース機能概要 データベース機能とは データベース とは売上台帳 顧客名簿 社員名簿など 特定のルールに基づいて集められたデータを指します Excel のデータベース機能には 並べ替え 抽出 集計 分析 といった機能があります

More information

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, AstraZeneca KK 要旨 : NLMIXEDプロシジャの最尤推定の機能を用いて 指数分布 Weibull

More information

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc color 実験の Normalization color 実験で得られた複数のアレイデータを相互比較するためには Normalization( 正規化 ) が必要です 2 つのサンプルを異なる色素でラベル化し 競合ハイブリダイゼーションさせる 2color 実験では 基本的に Dye Normalization( 色素補正 ) が適用されますが color 実験では データの特徴と実験の目的 (

More information

改訂履歴

改訂履歴 EXCEL 関数の利用 2015.01.16 改訂履歴 目次 使用可能な EXCEL 関数 論理関数統計関数数学 三角関数検索 行列関数文字列操作関数 入れ子の計算式 年月日 / 時刻の計算 年月日 / 時刻の計算結果表示 計算結果データ型 旧形式と新形式の計算式クラスター 旧形式から新形式への計算式クラスターの変更 EXCEL 計算式におけるConMas i-reporterの仕様制限 EXCEL

More information

日心TWS

日心TWS 2017.09.22 (15:40~17:10) 日本心理学会第 81 回大会 TWS ベイジアンデータ解析入門 回帰分析を例に ベイジアンデータ解析 を体験してみる 広島大学大学院教育学研究科平川真 ベイジアン分析のステップ (p.24) 1) データの特定 2) モデルの定義 ( 解釈可能な ) モデルの作成 3) パラメタの事前分布の設定 4) ベイズ推論を用いて パラメタの値に確信度を再配分ベイズ推定

More information

進捗状況の確認 1. gj も gjp も動いた 2. gj は動いた 3. gj も動かない 2

進捗状況の確認 1. gj も gjp も動いた 2. gj は動いた 3. gj も動かない 2 連立 1 次方程式の数値解法 小規模な連立 1 次方程式の解法 消去法 Gauss 消去法 Gauss-Jordan 法 ( 大規模な連立 1 次方程式の解法 ) ( 反復法 ) (Jacobi 法 ) 講義では扱わない 1 進捗状況の確認 1. gj も gjp も動いた 2. gj は動いた 3. gj も動かない 2 パターン認識入門 パターン認識 音や画像に中に隠れたパターンを認識する 音素

More information

Microsoft PowerPoint SIGAL.ppt

Microsoft PowerPoint SIGAL.ppt アメリカン アジアンオプションの 価格の近似に対する 計算幾何的アプローチ 渋谷彰信, 塩浦昭義, 徳山豪 ( 東北大学大学院情報科学研究科 ) 発表の概要 アメリカン アジアンオプション金融派生商品の一つ価格付け ( 価格の計算 ) は重要な問題 二項モデルにおける価格付けは計算困難な問題 目的 : 近似精度保証をもつ近似アルゴリズムの提案 アイディア : 区分線形関数を計算幾何手法により近似 問題の説明

More information

11yama

11yama 連立 1 次方程式の数値解法 小規模な連立 1 次方程式の解法 消去法 Gauss 消去法 Gauss-Jordan 法 ( 大規模な連立 1 次方程式の解法 ) ( 反復法 ) (Jacobi 法 ) 講義では扱わない 1 進捗状況の確認 1. gj も gjp も動いた 2. gj は動いた 3. gj も動かない 2 パターン認識入門 パターン認識 音や画像に中に隠れたパターンを認識する 音素

More information

Taro-再帰関数Ⅱ(公開版).jtd

Taro-再帰関数Ⅱ(公開版).jtd 0. 目次 6. 2 項係数 7. 二分探索 8. 最大値探索 9. 集合 {1,2,,n} 上の部分集合生成 - 1 - 6. 2 項係数 再帰的定義 2 項係数 c(n,r) は つぎのように 定義される c(n,r) = c(n-1,r) + c(n-1,r-1) (n 2,1 r n-1) = 1 (n 0, r=0 ) = 1 (n 1, r=n ) c(n,r) 0 1 2 3 4 5

More information

Microsoft PowerPoint - pr_12_template-bs.pptx

Microsoft PowerPoint - pr_12_template-bs.pptx 12 回パターン検出と画像特徴 テンプレートマッチング 領域分割 画像特徴 テンプレート マッチング 1 テンプレートマッチング ( 図形 画像などの ) 型照合 Template Matching テンプレートと呼ばれる小さな一部の画像領域と同じパターンが画像全体の中に存在するかどうかを調べる方法 画像内にある対象物体の位置検出 物体数のカウント 物体移動の検出などに使われる テンプレートマッチングの計算

More information

データ構造

データ構造 アルゴリズム及び実習 3 馬青 1 バブルソート 考え方 : 隣接する二つのデータを比較し データの大小関係が逆のとき 二つのデータの入れ替えを行って整列を行う方法である 2 バブルソートの手順 配列 a[0],a[1],,a[n-1] をソートする場合 ステップ 1: 配列 a[0] と a[1],a[1] と a[2],,a[n-2] と a[n-1] と となり同士を比較 ( 大小が逆であれば

More information

Java Scriptプログラミング入門 3.6~ 茨城大学工学部情報工学科 08T4018Y 小幡智裕

Java Scriptプログラミング入門 3.6~ 茨城大学工学部情報工学科 08T4018Y  小幡智裕 Java Script プログラミング入門 3-6~3-7 茨城大学工学部情報工学科 08T4018Y 小幡智裕 3-6 組み込み関数 組み込み関数とは JavaScript の内部にあらかじめ用意されている関数のこと ユーザ定義の関数と同様に 関数名のみで呼び出すことができる 3-6-1 文字列を式として評価する関数 eval() 関数 引数 : string 式として評価する文字列 戻り値 :

More information

Bioinformatics2

Bioinformatics2 バイオインフォマティクス配列データ解析 2 藤 博幸 データベース検索 (1) ブラウザで NCBI を検索 (2)NCBI で配列データの取得 (3)NCBI で BLAST 検索 ブラウザで NCBI を検索 ブラウザで NCBI を検索 クリック ブラウザで NCBI を検索 NCBI トップページ National Center for Biotechnology Information 分

More information

行列、ベクトル

行列、ベクトル 行列 (Mtri) と行列式 (Determinnt). 行列 (Mtri) の演算. 和 差 積.. 行列とは.. 行列の和差 ( 加減算 ).. 行列の積 ( 乗算 ). 転置行列 対称行列 正方行列. 単位行列. 行列式 (Determinnt) と逆行列. 行列式. 逆行列. 多元一次連立方程式のコンピュータによる解法. コンピュータによる逆行列の計算.. 定数項の異なる複数の方程式.. 逆行列の計算

More information

生命情報学

生命情報学 生命情報学 34 進化系統樹推定 阿久津達也 京都大学化学研究所 バイオインフォマティクスセンター 進化系統樹 進化系統樹 種間 もしくは遺伝子間 の進化の関係を表す木 以前は形態的特徴をもとに構成 現在は配列情報をもとに構成 有根系統樹と無根系統樹 有根系統樹 : 根 共通の祖先に対応 がある系統樹 無根系統樹 : 根のない系統樹 いずれも葉にのみラベル 種に対応 がつく 有根系統樹 無根系統樹

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 多倍長計算手法 平成 年度第 四半期 今回はパラメータ の設定と精度に関してまとめて記述しました ループ積分と呼ばれる数値積分計算では 質量 の光子や質量が非常に小さい事はわかっているが その値は不明なニュートリノに対して赤外発散を防ぐため微小量を与えて計算しています この設定する微少量の値により 結果の精度及び反復に要する時間が大きく作用したり 誤った値を得る事があります ここでは典型的な つのケースで説明します

More information

Microsoft Office Excel2007(NO4中級後編 エクセルを実務で活用)

Microsoft Office Excel2007(NO4中級後編 エクセルを実務で活用) Chapter1Excel2007 中級 ( 後編 ) の目的 1-1 Excel2007 中級 ( 後編 ) について Excel 中級の後編では 主に データベース 機能について学習します Excel では大量のデータを管理することが多く Excel を実務で利用する方には必須の内容です 多くのデータから必要なものを取り出したり それらを集計 分析する機能も充実しています その中でも ピボットテーブル

More information

分子系統解析における様々な問題について 田辺晶史

分子系統解析における様々な問題について 田辺晶史 分子系統解析における様々な問題について 田辺晶史 そもそもどこの配列を使うべき? そもそもどこの配列を使うべき? 置換が早すぎず遅すぎない (= 多すぎず少なすぎない ) そもそもどこの配列を使うべき? 置換が早すぎず遅すぎない (= 多すぎず少なすぎない ) 連続長は長い方が良い そもそもどこの配列を使うべき? 置換が早すぎず遅すぎない (= 多すぎず少なすぎない ) 連続長は長い方が良い 遺伝子重複が起きていない

More information

Section1_入力用テンプレートの作成

Section1_入力用テンプレートの作成 入力用テンプレートの作成 1 Excel には 効率よく かつ正確にデータを入力するための機能が用意されています このセクションでは ユーザー設定リストや入力規則 関数を利用した入力用テンプレートの作成やワークシート操作について学習します STEP 1 ユーザー設定リスト 支店名や商品名など 頻繁に利用するユーザー独自の連続データがある場合には ユーザー設定リスト に登録しておけば オートフィル機能で入力することができ便利です

More information

データ構造

データ構造 アルゴリズム及び実習 7 馬青 1 表探索 定義表探索とは 表の形で格納されているデータの中から条件に合ったデータを取り出してくる操作である 但し 表は配列 ( 連結 ) リストなどで実現できるので 以降 表 の代わりに直接 配列 や リスト などの表現を用いる場合が多い 表探索をただ 探索 と呼ぶ場合が多い 用語レコード : 表の中にある個々のデータをレコード (record) と呼ぶ フィールド

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

第4回

第4回 Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

Microsoft PowerPoint - ca ppt [互換モード]

Microsoft PowerPoint - ca ppt [互換モード] 大阪電気通信大学情報通信工学部光システム工学科 2 年次配当科目 コンピュータアルゴリズム 良いアルゴリズムとは 第 2 講 : 平成 20 年 10 月 10 日 ( 金 ) 4 限 E252 教室 中村嘉隆 ( なかむらよしたか ) 奈良先端科学技術大学院大学助教 y-nakamr@is.naist.jp http://narayama.naist.jp/~y-nakamr/ 第 1 講の復習

More information

Prog1_6th

Prog1_6th 2019 年 10 月 31 日 ( 木 ) 実施配列同種のデータ型を有する複数のデータ ( 要素 ) を番号付けして, ひとまとまりの対象として扱うものを配列と呼ぶ 要素 point[0] point[1] point[2] point[3] point[4] 配列 配列の取り扱いに関して, 次のような特徴がある 1. プログラム中で用いる配列変数 ( 配列の本体を参照する参照型の変数 ) は必ず宣言しておく

More information

ポインタ変数

ポインタ変数 プログラミング及び実習 5 馬青 1 文字処理 数値処理 : 整数 浮動小数点数 単一の文字は と ( シングルクォーテーション ) で囲んで表現される 文字のデータ型は char または int である int を用いたほうが ライブラリの関数の引数の型と一致する 以下は全部 int の使用に統一する 従って int ch; で文字変数を宣言しておくと ch= A ; のように ch に文字 A

More information

ワープロソフトウェア

ワープロソフトウェア 表計算ソフト (Excel) 表計算ソフト (Excel) とは 表計算ソフト数値データの集計 分析に用いられるアプリケーション表 グラフの作成 統計関数によるデータ解析 データベースなどを行うことができる メリットとして計算が自動 また簡単なシミュレーションができる Excel Microsoftによって提供されている表計算ソフトの名称関数の入力やマクロ機能,GUIの操作に優れており様々な用途に使用されている

More information

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生 0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生まれ, コンピューテーショナルフォトグラフィ ( 計算フォトグラフィ ) と呼ばれている.3 次元画像認識技術の計算フォトグラフィへの応用として,

More information

Microsoft Word - Time Series Basic - Modeling.doc

Microsoft Word - Time Series Basic - Modeling.doc 時系列解析入門 モデリング. 確率分布と統計的モデル が確率変数 (radom varable のとき すべての実数 R に対して となる確 率 Prob( が定められる これを の関数とみなして G( Prob ( とあらわすとき G( を確率変数 の分布関数 (probablt dstrbuto ucto と呼 ぶ 時系列解析で用いられる確率変数は通常連続型と呼ばれるもので その分布関数は (

More information

nlp1-04a.key

nlp1-04a.key 自然言語処理論 I. 文法 ( 構文解析 ) その 構文解析 sytctic lysis, prsig 文の構文的な構造を決定すること句構造文法が使われることが多い文法による構文木は一般に複数ある 構文木の違い = 解釈の違い 構文解析の目的 句構造文法の規則を使って, 文を生成できる構文木を全て見つけだすこと 文法が入力文を生成できるかどうかを調べるだけではない pro I 構文解析とは 構文木の違い

More information

ソフトウェア基礎 Ⅰ Report#2 提出日 : 2009 年 8 月 11 日 所属 : 工学部情報工学科 学籍番号 : K 氏名 : 當銘孔太

ソフトウェア基礎 Ⅰ Report#2 提出日 : 2009 年 8 月 11 日 所属 : 工学部情報工学科 学籍番号 : K 氏名 : 當銘孔太 ソフトウェア基礎 Ⅰ Report#2 提出日 : 2009 年 8 月 11 日 所属 : 工学部情報工学科 学籍番号 : 095739 K 氏名 : 當銘孔太 1. UNIX における正規表現とは何か, 使い方の例を挙げて説明しなさい. 1.1 正規表現とは? 正規表現 ( 正則表現ともいう ) とは ある規則に基づいて文字列 ( 記号列 ) の集合を表す方法の 1 つです ファイル名表示で使うワイルドカードも正規表現の兄弟みたいなもの

More information

Microsoft Word - Word1.doc

Microsoft Word - Word1.doc Word 2007 について ( その 1) 新しくなった Word 2007 の操作法について 従来の Word との相違点を教科書に沿って説明する ただし 私自身 まだ Word 2007 を使い込んではおらず 間違いなどもあるかも知れない そうした点についてはご指摘いただければ幸いである なお 以下において [ ] で囲った部分は教科書のページを意味する Word の起動 [p.47] Word

More information

関数とは 関数とは 結果を得るために 処理を行う仕組み です Excel2010 には あらかじめ関数が数式として組み込まれています たとえば SUM 関数 は 指定した値をすべて合計する 仕組みです 長い計算式や複雑な計算式を作成せずに 簡単に結果を求めることができます 例合計 =A1+A2+A3

関数とは 関数とは 結果を得るために 処理を行う仕組み です Excel2010 には あらかじめ関数が数式として組み込まれています たとえば SUM 関数 は 指定した値をすべて合計する 仕組みです 長い計算式や複雑な計算式を作成せずに 簡単に結果を求めることができます 例合計 =A1+A2+A3 エクセル Ⅱ( 中級 ) 福岡市私立幼稚園連盟 Microsoft Excel 2010 Ver,1.0 関数とは 関数とは 結果を得るために 処理を行う仕組み です Excel2010 には あらかじめ関数が数式として組み込まれています たとえば SUM 関数 は 指定した値をすべて合計する 仕組みです 長い計算式や複雑な計算式を作成せずに 簡単に結果を求めることができます 例合計 =A1+A2+A3+A4+A5+A6+A7+A8+A9

More information

文法と言語 ー文脈自由文法とLR構文解析2ー

文法と言語 ー文脈自由文法とLR構文解析2ー 文法と言語ー文脈自由文法とLR 構文解析 2 ー 和田俊和資料保存場所 http://vrl.sys.wakayama-u.ac.jp/~twada/syspro/ 前回までの復習 最右導出と上昇型構文解析 最右導出を前提とした場合, 上昇型の構文解析がしばしば用いられる. 上昇型構文解析では生成規則の右辺にマッチする部分を見つけ, それを左辺の非終端記号に置き換える 還元 (reduction)

More information

横浜市環境科学研究所

横浜市環境科学研究所 周期時系列の統計解析 単回帰分析 io 8 年 3 日 周期時系列に季節調整を行わないで単回帰分析を適用すると, 回帰係数には周期成分の影響が加わる. ここでは, 周期時系列をコサイン関数モデルで近似し単回帰分析によりモデルの回帰係数を求め, 周期成分の影響を検討した. また, その結果を気温時系列に当てはめ, 課題等について考察した. 気温時系列とコサイン関数モデル第 報の結果を利用するので, その一部を再掲する.

More information

Datalink_summary

Datalink_summary データリンク ( 概要編 ) 目次データリンクの概要データリンクとは データリンクの起動 [ タイプ ] の設定 4 [ レブロ側 ] の設定 5 [ キー ] の設定 7 [Excel 側 ] の設定 9 [ アクション ] の設定 0 更新日 :08/0/3 Rebro08 対応 -- データリンクの概要 データリンクとは データリンクの機能では. Excelで作成された機器表などをレブロ図面に取り込むことができます.

More information

<4D F736F F D20438CBE8CEA8D758DC F0939A82C282AB2E646F63>

<4D F736F F D20438CBE8CEA8D758DC F0939A82C282AB2E646F63> C 言語講座第 2 回 作成 : ハルト 前回の復習基本的に main () の中カッコの中にプログラムを書く また 変数 ( int, float ) はC 言語では main() の中カッコの先頭で宣言する 1 画面へ出力 printf() 2 キーボードから入力 scanf() printf / scanf で整数を表示 / 入力 %d 小数を表示 / 入力 %f 3 整数を扱う int 型を使う

More information

09.pptx

09.pptx 講義内容 数値解析 第 9 回 5 年 6 月 7 日 水 理学部物理学科情報理学コース. 非線形方程式の数値解法. はじめに. 分法. 補間法.4 ニュートン法.4. 多変数問題への応用.4. ニュートン法の収束性. 連立 次方程式の解法. 序論と行列計算の基礎. ガウスの消去法. 重対角行列の場合の解法項目を変更しました.4 LU 分解法.5 特異値分解法.6 共役勾配法.7 反復法.7. ヤコビ法.7.

More information

Taro-スタック(公開版).jtd

Taro-スタック(公開版).jtd 0. 目次 1. 1. 1 配列によるの実現 1. 2 再帰的なデータ構造によるの実現 1. 3 地図情報処理 1. 4 問題 問題 1 グラフ探索問題 - 1 - 1. は データの出し入れが一カ所で行われ 操作は追加と削除ができるデータ構造をいう 出入口 追加 削除 操作 最初 111 追加 111 222 追加 111 222 333 追加 111 222 333 444 追加 111 222

More information

スライド 1

スライド 1 知識情報演習 Ⅲ( 後半第 3 回 ) 辻慶太 http://slis.sakura.ne.jp/cje3 1 索引付けの手順概要 ( 復習 ) (1) 索引語の抽出 文字バイグラム, 単語, フレーズなど (2) 不要語の削除 (3) 接辞処理 (4) 索引語の重み付け 検索手法 ( 検索モデル ) によっては不要例えば, 論理式によるブーリアンモデルでは不要 (5) 索引ファイルの編成 extract.prl

More information

Microsoft PowerPoint - ●SWIM_ _INET掲載用.pptx

Microsoft PowerPoint - ●SWIM_ _INET掲載用.pptx シーケンスに基づく検索モデルの検索精度について 東京工芸大学工学部コンピュータ応用学科宇田川佳久 (1/3) (2/3) 要員数 情報システム開発のイメージソースコード検索機能 他人が作ったプログラムを保守する必要がある 実務面での応用 1 バグあるいは脆弱なコードを探す ( 品質の高いシステムを開発する ) 2 プログラム理解を支援する ( 第 3 者が書いたコードを保守する ) 要件定義外部設計内部設計

More information

文字列探索

文字列探索 文字列探索 平成 23 年 12 月 2 日 アルゴリズム論 9 回目 文字列探索 データベース ( 構造化データ ) キーを指定 そのキーを持つレコード検索 テキスト ( 非構造データ ) 検索したい文字の並び (string): パターン探査される文字列を含む情報 : テキスト 腕ずくの方法 KMP(Knuth-Morris-Pratt) 法 BM(Boyer-Moore) 法 腕ずくの方法 Patten

More information

スライド 1

スライド 1 第 6 章表計算 B(Excel 2003) ( 解答と解説 ) 6B-1. 表計算ソフトの操作 1 条件付き書式の設定 1. ( ア )=E ( イ )= お 条件付き書式とは セルの数値によりセルの背景に色を付けたり 文字に色を付けたり アイコンをつけたりして分類することができる機能です 本問題では 以下の手順が解答となります 1 2 ユーザー定義の表示形式 1. ( ア )=2 ( イ )=4

More information

Microsoft PowerPoint - 5.ppt [互換モード]

Microsoft PowerPoint - 5.ppt [互換モード] 5. チューリングマシンと計算 1 5-1. チューリングマシンとその計算 これまでのモデルでは テープに直接書き込むことができなかった また 入力テープヘッドの操作は右方向だけしか移動できなかった これらの制限を取り除いた機械を考える このような機械をチューリングマシン (Turing Machine,TM) と呼ぶ ( 実は TMは 現実のコンピュータの能力を持つ ) TM の特徴 (DFA との比較

More information

逐次近似法の基礎と各種補正方法

逐次近似法の基礎と各種補正方法 逐次近似法の基礎と各種補正方法 横浜創英大学橋本雄幸 画像再構成における逐次近似法の歴史は長く,X 線 CT においても解析的方法が見つかる前は, 逐次近似法を用いて画像を再構成していた. 解析的方法が見つかってからは, 計算時間の長さから逐次近似法はあまり使われなくなった. しかし, コンピュータの発展に伴い, 繰り返しても計算時間がそれほどかからなくなったこともあり, 解析的方法が確立できない

More information

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View( でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View(  でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー KaPPA-Average 1.0 マニュアル 第 1.0 版 制作者 : かずさ DNA 研究所櫻井望 制作日 : 2010 年 1 月 12 日 目次 1. はじめに 2 1-1. KaPPA-Average とは 2 1-2. 動作環境 3 1-3. インストールと起動 3 2. 操作説明 4 2-1. メイン機能 - Calc. Average 4 2-1-1. データの準備 4 2-1-2.

More information

次の病院 薬局欄は 氏名 欄に入力された値によって入力すべき値が変わります 太郎の行く病院と花子の行く病院が必ずしも同じではないからです このような違いを 設定 シートで定義しておきましょう 太郎の行く病院のリストを 太郎 花子の行く病院のリストを 花子 として 2 つのリストが定義されています こ

次の病院 薬局欄は 氏名 欄に入力された値によって入力すべき値が変わります 太郎の行く病院と花子の行く病院が必ずしも同じではないからです このような違いを 設定 シートで定義しておきましょう 太郎の行く病院のリストを 太郎 花子の行く病院のリストを 花子 として 2 つのリストが定義されています こ 医療費の入力と集計 まえがき 医療費は一年間の合計を計算し 10 万円を超えていれば税務申告に際して医療費控除を受けることができます そこで 医療費を記入するたびに自動集計される仕組みを考えてみましょう ここで紹介する 医療費の入力と集計 は 税務申告で必要となる医療費のデータを作成するのに使うものです 特徴は ドロップダウンリストから簡便に入力ができ 入力と同時に自動集計されるようにしてあることです

More information

1 研究開発のねらい 糖鎖は 細胞表面のタンパク質や脂質に結合し 血液型の決定 細胞接着 抗原抗体反応 ウイルス感染などの生体反応で重要な役割を果たす生体分子である 糖鎖による多様な生物学的機能のうち 糖鎖結合タンパク質による糖鎖の特異的認識があり 糖鎖 - タンパク質間の相互作用の解析に糖鎖アレイ

1 研究開発のねらい 糖鎖は 細胞表面のタンパク質や脂質に結合し 血液型の決定 細胞接着 抗原抗体反応 ウイルス感染などの生体反応で重要な役割を果たす生体分子である 糖鎖による多様な生物学的機能のうち 糖鎖結合タンパク質による糖鎖の特異的認識があり 糖鎖 - タンパク質間の相互作用の解析に糖鎖アレイ ライフサイエンスデータベース統合推進事業統合データ解析トライアル研究開発課題 タンパク質 - 糖鎖間の糖鎖結合部位の解明のためのツール改良及び解析 研究開発終了報告書 研究開発期間 : 平成 25 年 9 月 ~ 平成 26 年 1 月 研究代表者 : 細田正恵 ( 創価大学大学院工学研究科生命情報工学専攻 大学院生 ) - 1-2014 細田正恵 ( 創価大学大学院 )licensed under

More information

プレポスト【解説】

プレポスト【解説】 コース名 : シェルの機能とプログラミング ~UNIX/Linux の効率的使用を目指して ~ 1 UNIX および Linux の主な構成要素は シェル コマンド カーネルです プロセスとは コマンドやプログラムを実行する単位のことなので プロセスに関する記述は誤りです UNIX および Linux のユーザーインターフェースは シェル です コマンドを解釈するという機能から コマンドインタープリタであるともいえます

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 復習 ) 時系列のモデリング ~a. 離散時間モデル ~ y k + a 1 z 1 y k + + a na z n ay k = b 0 u k + b 1 z 1 u k + + b nb z n bu k y k = G z 1 u k = B(z 1 ) A(z 1 u k ) ARMA モデル A z 1 B z 1 = 1 + a 1 z 1 + + a na z n a = b 0

More information

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 概要 NEC は ビッグデータの分析を高速化する分散処理技術を開発しました 本技術により レコメンド 価格予測 需要予測などに必要な機械学習処理を従来の 10 倍以上高速に行い 分析結果の迅速な活用に貢献します ビッグデータの分散処理で一般的なオープンソース Hadoop を利用 これにより レコメンド 価格予測 需要予測などの分析において

More information

13章 回帰分析

13章 回帰分析 単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える

More information

「不動産リスト」を解く

「不動産リスト」を解く Microsoft2010 不動産リスト を解く IF 関数 VLOOKUP 関数 CHOOSE 関数 LEFT 関数 MOD 関数 INT 関数 INDEX 関数 2015/01/27 パソコン技能検定 Ⅱ 種試験 Excel 1 級検定過去問題 ここで使用する関数の種類 よく使われる関数として SUM IF,AVERAGE AND,OR などがありますが そのほかにも 今回次のような関数を単独で

More information

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ Excel を使った相関係数の計算 回帰分析 準備データは授業のホームページ上に Excel ブックの状態 ( ファイル名 pop_traffic.xlsx) で用意してあるので, これをダウンロードして保存しておく ダウンロードされたファイルを開いたら,DATA シート中の空欄 (POP,TK の列 ) をそれぞれの合計値 (POP の場合は,POP1~POP3) で埋めるように,SUM 関数あるいは和の式を使って処理しておく

More information

C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ

C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ 今回のプログラミングの課題 次のステップによって 徐々に難易度の高いプログラムを作成する ( 参照用の番号は よくわかる C 言語 のページ番号 ) 1. キーボード入力された整数 10 個の中から最大のものを答える 2. 整数を要素とする配列 (p.57-59) に初期値を与えておき

More information

プログラミング実習I

プログラミング実習I プログラミング実習 I 03 変数と式 人間システム工学科井村誠孝 m.imura@kwansei.ac.jp 3.1 変数と型 変数とは p.60 C 言語のプログラム中で, 入力あるいは計算された数や文字を保持するには, 変数を使用する. 名前がついていて値を入れられる箱, というイメージ. 変数定義 : 変数は変数定義 ( 宣言 ) してからでないと使うことはできない. 代入 : 変数には値を代入できる.

More information

ヒトゲノム情報を用いた創薬標的としての新規ペプチドリガンドライブラリー PharmaGPEP TM Ver2S のご紹介 株式会社ファルマデザイン

ヒトゲノム情報を用いた創薬標的としての新規ペプチドリガンドライブラリー PharmaGPEP TM Ver2S のご紹介 株式会社ファルマデザイン ヒトゲノム情報を用いた創薬標的としての新規ペプチドリガンドライブラリー PharmaGPEP TM Ver2S のご紹介 株式会社ファルマデザイン 薬剤の標的分子別構成 核内受容体 2% DNA 2% ホルモン 成長因子 11% 酵素 28% イオンチャンネル 5% その他 7% 受容体 45% Drews J,Science 287,1960-1964(2000) G 蛋白質共役受容体 (GPCR)

More information

Microsoft PowerPoint - mp13-07.pptx

Microsoft PowerPoint - mp13-07.pptx 数理計画法 ( 数理最適化 ) 第 7 回 ネットワーク最適化 最大流問題と増加路アルゴリズム 担当 : 塩浦昭義 ( 情報科学研究科准教授 ) hiour@di.i.ohoku.c.jp ネットワーク最適化問題 ( 無向, 有向 ) グラフ 頂点 (verex, 接点, 点 ) が枝 (edge, 辺, 線 ) で結ばれたもの ネットワーク 頂点や枝に数値データ ( 距離, コストなど ) が付加されたもの

More information

模擬試験問題(第1章~第3章)

模擬試験問題(第1章~第3章) 基本情報技術者試験の練習問題 - 第 8 回 この問題は平成 19 年度秋期の問題から抜粋しています 問 1 次のプログラムの説明及びプログラムを読んで, 設問 1,2 に答えよ プログラムの説明 スタックを使って, 実数値を 10 進数字列 ( 文字列 ) に変換する副プログラム FloatFormat である (1) FloatFormat は, 実数 Float の値を 10 進数字列に変換し,

More information

地理情報システム論 外部データとのやりとり レイヤのエクスポートによるシェープファイルの作成金沢区を題材とした操作練習では, すでにマップ上に表示されているレイヤを複製することで, 同一のシェープファイルを, 一方は階級区分図に用い, 他方はチャート表示に用いてオーバーレイ表現

地理情報システム論 外部データとのやりとり レイヤのエクスポートによるシェープファイルの作成金沢区を題材とした操作練習では, すでにマップ上に表示されているレイヤを複製することで, 同一のシェープファイルを, 一方は階級区分図に用い, 他方はチャート表示に用いてオーバーレイ表現 外部データとのやりとり レイヤのエクスポートによるシェープファイルの作成金沢区を題材とした操作練習では, すでにマップ上に表示されているレイヤを複製することで, 同一のシェープファイルを, 一方は階級区分図に用い, 他方はチャート表示に用いてオーバーレイ表現できることを体験した 同様の操作は, 同一のシェープファイルに対して異なる条件のフィルタを設定することで, レイヤを複数使用したい場合にも有用である

More information

スライド 1

スライド 1 知識情報演習 Ⅲ( 後半第 3 回 ) 辻慶太 http://slis.sakura.ne.jp/cje3 1 索引付けの手順概要 ( 復習 ) (1) 索引語の候補の抽出 文字バイグラム, 単語, フレーズなど (2) 不要語の削除 (3) 接辞処理 (4) 索引語の重み付け 検索手法 ( 検索モデル ) によっては不要例えば, 論理式によるブーリアンモデルでは不要 (5) 索引ファイルの編成 stopword.prl

More information