人工知能補足_池村

Similar documents

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

遺伝子発現データの クラスタリングの理論的背景

AJACS_komachi.key

NGSデータ解析入門Webセミナー

Microsoft PowerPoint - プレゼンテーション1

nagasaki_GMT2015_key09

thermofisher.com mirVana miRNA mimics/inhibitors 検索マニュアル

分子系統解析における様々な問題について 田辺晶史

PowerPoint プレゼンテーション

ChIP-seq

Microsoft PowerPoint - BIセンターセミナー2013.pptx[読み取り専用]

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

Microsoft Word - PRESS_

Hi-level 生物 II( 国公立二次私大対応 ) DNA 1.DNA の構造, 半保存的複製 1.DNA の構造, 半保存的複製 1.DNA の構造 ア.DNA の二重らせんモデル ( ワトソンとクリック,1953 年 ) 塩基 A: アデニン T: チミン G: グアニン C: シトシン U

Microsoft PowerPoint - DNA1.ppt [互換モード]

研究最前線 HAL QCD Collaboration ダイオメガから始まる新粒子を予言する時代 Qantm Chromodynamics QCD 1970 QCD Keiko Mrano QCD QCD QCD 3 2

核内受容体遺伝子の分子生物学

GWB

分子系統樹推定の落とし穴と回避法 筑波大 生命環境 田辺晶史

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

報道発表資料 2007 年 8 月 1 日 独立行政法人理化学研究所 マイクロ RNA によるタンパク質合成阻害の仕組みを解明 - mrna の翻訳が抑制される過程を試験管内で再現することに成功 - ポイント マイクロ RNA が翻訳の開始段階を阻害 標的 mrna の尻尾 ポリ A テール を短縮

Untitled

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

37-4.indd

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

hyousi

<95F18D908F91967B95B62E696E6464>

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

5_motif 公開版.ppt

統合失調症発症に強い影響を及ぼす遺伝子変異を,神経発達関連遺伝子のNDE1内に同定した

GWB

ウイルス進化_池村

日本外傷歯学会認定医(平成24年11月30日付) H

A

2

福沢論文

Microsoft PowerPoint - lecture a.pptx

C H N

広報あぐい 2015年4月1日号

‚æ27›ñ06-…|…X…^†[

13FG-生物-問題_H1.indd

タンパク質の合成と 構造 機能 7 章 +24 頁 転写と翻訳リボソーム遺伝子の調節タンパク質の構造弱い結合とタンパク質の機能



301-A2.pdf

r


Untitled

研究成果報告書


サポートブック

大学院博士課程共通科目ベーシックプログラム

好きですまえばし



Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

180126_TOO_ウイルス感染症研究者向け資料【最終】.indd

PowerPoint プレゼンテーション

Microsoft PowerPoint - 資料6-1_高橋委員(公開用修正).pptx

ス H95) は EF-G の GTP 結合部位と明確に相互作用しており このループが GTP 加水分解に直接関与していることが示唆されました ( 図 4 右 ) 本研究成果は わが国で推進している タンパク 3000 プロジェクト の一環として行われたものです 本研究成果の詳細は 米国の学術雑誌

<4D F736F F D E95F14E565F838C D955F907D90E096BE5F8F4390B394C5816A2E646F63>

生命情報学

<4D F736F F F696E74202D AA8E7188E293608A7782CC8AEE D8EAF81698DB791D682A694C5816A>



スライド 1

Catalog No.AR006-e DIN EN ISO 9001 JIS Z 9901 Certificate: 販売終了

スライド 1

Slide 1

の活性化が背景となるヒト悪性腫瘍の治療薬開発につながる 図4 研究である 研究内容 私たちは図3に示すようなyeast two hybrid 法を用いて AKT分子に結合する細胞内分子のスクリーニングを行った この結果 これまで機能の分からなかったプロトオンコジン TCL1がAKTと結合し多量体を形

Untitled

PowerPoint プレゼンテーション

FdData社会歴史

AC-2

エンジョイ北スポーツ

PowerPoint Presentation

Microsoft PowerPoint - lecture a.pptx

計画研究 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシン

TIJ日本語教育研究会通信40号

風力発電インデックスの算出方法について 1. 風力発電インデックスについて風力発電インデックスは 気象庁 GPV(RSM) 1 局地気象モデル 2 (ANEMOS:LAWEPS-1 次領域モデル ) マスコンモデル 3 により 1km メッシュの地上高 70m における 24 時間の毎時風速を予測し



図 1 ヘテロクロマチン化および遺伝子発現不活性化に関わる因子ヘテロクロマチン化および遺伝子発現不活性化に関わる DNA RNA タンパク質 翻訳後修飾などを示した ヘテロクロマチンとして分裂酵母セントロメアヘテロクロマチンと哺乳類不活性 X 染色体を 遺伝子発現不活性化として E2F-Rb で制御


PowerPoint Presentation

ヒトゲノム情報を用いた創薬標的としての新規ペプチドリガンドライブラリー PharmaGPEP TM Ver2S のご紹介 株式会社ファルマデザイン

KEGG.ppt

untitled

研究開発の概要のイメージ ①画像 音声 映像情報の分析技術 周辺コンテンツや他情報源から収集したテキスト情報の分析 画像特徴量分析による信憑性検証 Web画像の典型度 過不足性 W b画像の典型度 過不足性 整合性の分析 映像 音声の偏り分析や 映像 音声の偏り分析や 視聴者評価情報の分析 Webア

Microsoft Word - Gateway technology_J1.doc

NGS_KAPA RNA HyperPrep Kit

Microsoft PowerPoint - 遺伝統計学夏の学校2018_Webツール入門.pptx

FCシリンダ

-2-

KASEAA 52(1) (2014)

物学的現象をはっきりと掌握することに成功した論文である との高い評価を得ています 2. 研究成果ブフネラゲノムの全塩基配列の決定に当たっては 全ゲノムショットガンシークエンス法 4 を用いました 今回ゲノム解析に成功したのは エンドウヒゲナガアブラムシ (Acyrthosiphon pisum) の

Code_Aster / Salome-Meca 中級者への道 2015年5月31日

RN201402_cs5_0122b.indd

Microsoft Word - 【広報課確認】 _プレス原稿(最終版)_東大医科研 河岡先生_miClear

Transcription:

私くしにとって 生涯の指針となっている木村先生の教え 1. 想定外の発見の重要性 à unsupervised data mining for big data 2. 技術への信頼と技術開発の重要性 2D gel à BLSOM

trna の二次元分離 : Methods in Enzymology 長さに依存する分離 想定外の 米国での Post Doc の時代 高分離能 長さに依存しない分離

29 種類の原核 物の のBLSOM 0 0 0 i 199 Uure Hinf Xfas Nmen Ecol Buch Tpal Vcho Rpro Cjej Chla Bhal Hpyl Syne Xfas Nmen Paer j Bbur Bsub Mtub Drad Tmar 111 Mjan Phor Paby Aper Aaeo Mthe Aful Halo big data

多次元空間のデータをその遠近関係を十分に反映しながら 2 次元平面上で表示する Sequences X1 X1 XM XM X2 Linear projection(ex, PCA) 線形写像ある平面に対して垂直に移動して 一番近い格子点へ帰属 X2 Non-linear projection(som) 非線形写像 漁師の網でかつゴムのように伸び縮みする 一番近い網の結び目に帰属後に ゴムの伸び縮みを無くす

Chr1 10kb 断片 各染色体のテロ メアから断片化 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 細胞 A 細胞 B 細胞 C 細胞 D 細胞 E 細胞 F 細胞 G 細胞 H 多様な ENCODE データについての BLSOM ヒストンのメチル化やアセチル化の数値に着目すれば それらの状態が細胞で異なるゲノム部位が BLSOM で細胞別にクラスター化する 特定の転写因子の結合レベルの数値に着目すれば その転写因子の結合が細胞で異なるゲノム部位が BLSOM で細胞別にクラスター化する 各断片での DNase sensitivity level の数値に着目 DNase sensitivity が細胞で異なるゲノム部位が BLSOM で細胞別にクラスター化する

各染 体の特定領域 (21q22.11 内の約 45kb) でのヒストンのメチル化やアセチル化レベルや DNase sensitivity レベルや特定の転写因 の結合レベルが表 されている 数値データも取得可能

ヒト DNA の百科事典 あらゆる機能要素類をゲノム上にマッピングしようという計画 2003(1%)& 2007: ENCODE project ENCODE data も big data 化しているので BLSOM を含む AI の良い研究対象

DNase で切れやすい場所 ゲノムの 3D 配置 Histone DNA 計算機予測と実験的検証 転写制御エレメント 転写 RNA (protein-coding & noncoding RNA) 遺伝子としては noncoding が多い?

数値データも取得可能

タンパク質 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 AA AC AD AE AF AG AH AI 2 連アミノ酸 BLSOM (COG) 11 にグループ化させた 3 連続アミノ酸頻度を いた が分離能が良い アミノ酸配列全 を いるよりも Window (200 aa に断 化 ) を設けた が分離能が良い

BLSOM は生命科学分野の多様な問題に適用可能である オリゴペプタイド頻度に基づく BLSOM によるタンパク質の機能推定法の確立 タンパク質の 2 連や 3 連アミノ酸 ( オリゴペプタイド ) の使用頻度に関する BLSOM を行うと タンパク質は機能ごとに分離する傾向を示した

Dipep-FL Dipep-W200S50 Tri11-W200S50 Tetra6-W200S50 得られた SOM マップ上にて 単一の COG が分類されている点を赤 2 つの COG の場合 薄い赤 3 つ以上の場合 青とした際の分類結果の分布図 アミノ酸配列全長を用いるよりも Window ( 断片化 ) を設けた方が分離能が良い 2 連続アミノ酸頻度 集約 6 アミノ酸の 4 連続アミノ酸頻度を用いるよりも 11 にグループ化させた 3 連続アミノ酸頻度を用いた方が分離能が良い

オリゴペプタイド頻度でのアミノ酸配列解析の際の条件の検討 1. 2.

便利なデータベースやソフト類 EmEditor 統合 TV

統合 TV は情報解析ツールの使い方の動画

多様な生物種の合計で約 3 万の mirna 配列

C mirna mir-122 mir-122

AI-guided search for interactions of disease viral RNAs with host mirnas Ebola, Flu, Zika, Dengue ウイルスゲノム由来の 20mer ( 両鎖 ) 全体 ヒトの 2500miRNA ( 約 20mer) を分類しておく

Sequences X1 X1 XM XM X2 Linear projection:pca X2 Non-linear projection(som) ヒト mirna の 6mer 組成の AI は学習の過程も教えてくれる

ヒトインフルエンザウイルスゲノム由来の主要な 4 万の約 20mer ( 両鎖 ) 合体させて BLSOM 学習 ヒトの 2500miRNA( 約 20mer) を分類しておく 機械学習を続けると の特定の 20mer と との対で を形成

1 0.8 0.6 0.4 0.2 0 1930 1950 1970 1990 2010 下線 : トリmiRNA TCCAGTGTATGTTGATGGAG TCCAGTAACTGTTGATGGAG 下線 : ヒトmiRNA TCCAGTAAATGTTGATGGAG TCCAGTGACTGTTGATGGAG 1 0.8 0.6 0.4 0.2 0 1930 1940 1950 1960 1970 1980 1990 2000 2010

UCCAGUGUAUGUUGAUGGAG 1934 major: トリ mirna (11/11) UCCAGUAAAUGUUGAUGGAG 1978 major UCCAGUAACUGUUGAUGGAG 1983 major UCCAGUGACUGUUGAUGGAG 1995 以降 major: ヒト mirna (11/11) (UCCAAUGACUGUUGAUGGAG)2006 と 2007 minor で 2008 に消えた A% C% 33.4 19.6 32.9 19.1 18.6 32.4 1930 1950 1970 1990 2010 1930 1940 1950 1960 1970 1980 1990 2000 2010 G% U% 24.6 23.7 24.1 23.6 1930 1950 1970 1990 2010 23.2 22.7 22.2 1930 1950 1970 1990 2010