Qlucore_seminar_slide_180604

Similar documents
NGSデータ解析入門Webセミナー

GWB_RNA-Seq_

次世代シークエンサーを用いたがんクリニカルシークエンス解析

PrimerArray® Analysis Tool Ver.2.2

Agilent 1色法 2条件比較 繰り返し実験なし

GWB

ThermoFisher

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science

PowerPoint Presentation

GWB

GWB

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

計算機生命科学の基礎II_

RNA-seq

アノテーション・フィルタリング用パイプラインとクリニカルレポートの作成

ArcGIS Desktop Ⅱ 基礎編

CLC Genomics Workbench ウェブトレーニングセミナー: 変異解析編

ステップ 5: ファイルの管理 ステップ 6: レイヤーのデータソースの変更 演習のまとめ 第 3 章レイヤーの操作と共有 第 3 章概要 画面移動 1 : レイヤーの全体表示 画面移動 2 : [XY へ移動 ] ツール...

バイオインフォマティクスⅠ

ChIP-seq

Microsoft PowerPoint - Ion Reporter?ソフトウェアを用いた変異解析4.6.pptx

Agilent Microarray Total Solution 5 5 RNA-Seq 60 mer DNA in situ DNA 5 2 QC 4200 TapeStation 2100 / mirna CGHCGH+SNP ChIP-on-chip 2 mirna QC

機能ゲノム学(第6回)

Partek Flow リリースノート バージョン : Partek Flow バージョン は高速化と使い勝手の改善のための新機能やパフォーマンス向上を含んでいます このバージョンへアップグレードするためには Partek Flow インストールガイド

Microsoft Word - Outlook_manual doc

ANOVA

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

SAMBA Stunnel(Mac) 編 1. インストール 1 セキュア SAMBA の URL にアクセスし ログインを行います xxxxx 部分は会社様によって異なります xxxxx 2 Mac OS 版ダウンロー

PrimerArray Analysis Tool Ver.2.1

二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株

機能ゲノム学(第6回)

Chapter 1 Epidemiological Terminology

Excel2013 ピボットテーブル基礎

データ科学2.pptx

KUVO DJミックス投稿ガイド

青焼 1章[15-52].indd

PowerPoint プレゼンテーション

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

Maser - User Operation Manual

4.統計解析.indd

概要 ABAP 開発者が SAP システム内の SAP ソースまたは SAP ディクショナリーオブジェクトを変更しようとすると 2 つのアクセスキーを入力するよう求められます 1 特定のユーザーを開発者として登録する開発者キー このキーは一度だけ入力します 2 SAP ソースまたは SAP ディクシ

PowerPoint プレゼンテーション

スライド 0

FTP ウェブコンテンツダウンロード手順書 ver1.0 作成 :KDDI 株式会社 作成日 :2018 年 10 月 31 日

スライド 1

1.chemSHERPA 入力フロー ページ 1 依頼者情報の入力 安川電機の情報を入力します 基本情報の入力 製品 部品情報を入力します 依頼者製品情報製品情報 遵法判断情報の入力 成分情報の入力 JGPSSI フォーマットに相当する情報 JAMP-AIS/MSDSplus に相当する情報 遵法判

PowerPoint Presentation

1. はじめに 本書は スプリット演算器 MFS2 用コンフィギュレータソフトウェア の取扱方法 操作手順 注意事項などを説明したものです Windows の操作や用語を理解している方を前提にしています Windows の操作や用語については それぞれのマニュアルを参照してください 1.1. MFS

スーパー英語アカデミック版Ver.2

Rの基本操作

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用

RNA-seq

スライド 1

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ ( から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

uCosminexus EUR 08-20新機能のご紹介

AudioGate 4 取扱説明書

000

548BGeneSpring12.5

Amazonポイントプログラム (設定編)

PowerPoint プレゼンテーション

V6 音声入力機能

統計的データ解析

Cica-Web を快適にご利用いただくために Cica-Web は Internet Explorer で動作確認を行っております その他のブラウザでご利用いただく際は本来の動作と異なる動作をすること がありますので ご了承ください Cica-Web は Cookie を有効にする設定でご利用くだ

The world leader in serving science OMNIC ユーザーライブラリベーシックマニュアル サーモフィッシャーサイエンティフィック株式会社

年齢別人数計算ツールマニュアル

Microsoft Word - S01-01_データ抽出設定.docx

PowerPoint プレゼンテーション

認証システムのパスワード変更方法

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

eYACHO 管理者ガイド

Microsoft Word - BMDS_guidance pdf_final

CONTENTS マニュアルの表記... S01-02_01 1.DataNature Smart 全体概要図... S01-02_11 2. 基本操作... S01-02_ ジョブの作成... S01-02_21 加工条件設定... S01-02_21 Step1: 処理対象データの指

講義「○○○○」

最小二乗法とロバスト推定

Create!Form V11 - Excel 出力設定

BIP Smart FAQ

SAMBA Stunnel(Windows) 編 1. インストール 1 セキュア SAMBA の URL にアクセスし ログインを行います xxx 部分は会社様によって異なります xxxxx 2 Windows 版ダウンロード ボ

コンテンツ作成基本編

リアルタイム気象ビューアー利用ガイド

Transcription:

シングルセル RNA-Seq のための 情報解析 フィルジェン株式会社バイオサイエンス部 (biosupport@filgen.jp) 1

シングルセル RNA-Seq シングルセル RNA-Seq のデータ解析では 通常の RNA-Seq データの解析手法に加え データセット内の各細胞の遺伝子発現プロファイルの違いを俯瞰できるような 強力な情報解析アルゴリズムと データのビジュアライズ機能を利用する必要がある Qlucore Omics Explorer に搭載されている各種解析アルゴリズムと 高度なグラフィックスおよび直感的なインターフェースを用いることで シングルセル RNA-Seq のデータ解析を効率的に行うことができる 2

Qlucore Omics Explorer すべてのデータを 3D プレゼンテーションとしてフルリアルタイムで操作が可能 マウスクリックでフィルターやパラメーターの設定条件を簡単に変更し 自動でグラフに反映 マイクロアレイデータ RNA-Seq データ (BAM ファイル ) のノーマライズが可能 階層クラスタリングとヒートマップ 主成分解析 (PCA) ボルケーノプロットやベン図 さらにシングルセル RNA-Seq 解析用に t-sne プロットをサポート 生物学的解釈を得るために GSEA (Gene Set Enrichment Analysis) を利用可能 サンプルの分類モデルの構築と 新サンプルへの適用を行うためのツールも搭載 3

アプリケーションエリアとデータファイル 対応アプリケーションエリア Gene expression and mirna (Microarrays and RNA-Seq) Proteomics NGS DNA Methylation Metabolomics Other 対応データファイル RNA-Seq.bam ファイル Affymetrix GeneChip WT, 3 Array.cel ファイル.chp ファイル Affymetrix GeneChip mirna Array.txt ファイル Agilent Gene Expression Array.txt ファイル (Feature Extraction ソフトウェア出力ファイル ) GEO Data Set.soft ファイル その他カスタムフォーマットファイル.txt ファイル 4

ソフトウェア機能概要 Visualize: Analyze: Explore: Share: 3D PCA プロットやヒートマップ ボルケーノプロットやベン図の他 シングルセル RNA-Seq 解析用に t-sne プロット 生存率評価にカプランマイヤー曲線などをサポートし 複数のプロットグラフをインタラクティブに操作することが可能 2 グループあるいは複数グループ間の比較用統計モデルを搭載し その他 R の Open API をインテグレートしてソフトウェア上で使用することが可能 また Fold Change や各種クラスタリング GSEA(Gene Set Enrichment Analysis) による生物学的解釈の評価や サンプルの分類モデルの構築に Support Vector Machines (SVM) や Random Trees (RT) も搭載 各種マイクロアレイの他 RNA-Seq データにおける Aligned BAM ファイルのインポートからノーマライズ GEO 登録データの自動ダウンロードなどを利用可能 データプロット図のイメージや実データのリストなどのファイル出力 さらに操作の記録のログや動画データによる保存にも対応 5

データプロット プロットの種類 Method タブの Plot と Type を選択することによって データの表示形式を切り替える プロットをサンプルに対して行うか 変数 ( 遺伝子など ) に対して行うかの選択や サンプル間の正規化の有無なども選択可能 ユーザー定義のアノテーション情報に基づき プロットの着色やラベル表示が可能 データのフィルタリングを実行すると フィルタリング結果がプロットにリアルタイムで反映される PCA Line Heatmap Genome Scatter - Scatter - Volcano - 2D t-sne Bar - Bar - Histogram - Box Table Special - Kaplan-Meier - Silhouette - Venn 6

データプロット PCA Heatmap t-sne Volcano Kaplan-Meier Venn 7

Manual Annotation プロット上のマウスカーソル操作で サンプルのグループ分類などのアノテーションを手動で追加することができる 8

データフィルタリング サンプル間のデータのばらつきによるフィルタリング サンプルグループ間の統計検定によるフィルタリング 使用可能な統計手法 Two Group Comparison (t-test) Multi Group Comparison (F-test) Linear Regression Quadratic Regression Rank Regression False discovery rates (FDR) サンプルグループ間の Fold Change によるフィルタリング Statistics Dock に任意の閾値を入力 あるいはスライダーを移動させ データのフィルタリングを行う フィルタリングの条件を変更するごとに データプロットにもリアルタイムで反映される 9

Projection Score Projection Score PCA Plot において Filter by Variance でフィルタリングを実施する際に計算されるスコア フィルタリングによりデータの次元を減らしていった際の データの情報性を数値化したものであり この値が最大になるように調整することで フィルタリングの閾値を決定できる スコアが高い場合は 緑色で表示される 10

Projection Score Projection Score が高いフィルタリング閾値を採用することによって 閾値の選択の根拠を客観的に示すことができる 11

Synchronized Plot 複数の種類のプロットを表示させ データのフィルタリング条件などを連動させることができる 12

GSEA 特定の生理作用 ( 疾患 薬物刺激など ) や遺伝子機能カテゴリー (Gene Ontology, パスウェイなど ) の条件で発現する遺伝子のグループ ( 遺伝子セット ) 情報を用いて 発現変動遺伝子セットに それらグループの遺伝子がどれだけ多く含まれているかを検定する 13

その他解析ツール Cluster: K-means Clustering などのアルゴリズムを使い データを指定数のクラスターに分類 Build Classifier: サンプルデータと既知のグループ情報をトレーニングセットとして用いて サンプルデータの分類を行うためのモデルを作成 Classifier: Build Classifier で作成した分類モデルを グループ情報未知サンプルデータに適用 14

ソフトウェアデモンストレーション 15

使用するデータセット 合計 329 サンプルの hesc 細胞のシングルセル RNA-Seq データ 細胞の分化過程の観察のため 4 つのタイムポイントごとにサンプリングを行っている 16

データ解析の手順 手順 1: サンプルデータのインポート RNA-Seq BAM ファイル または数値化データファイルをインポート 手順 2: 遺伝子の抽出 Projection Score などを用いて 解析に用いる遺伝子を抽出 手順 3: 各種プロットグラフの作成 PCA t-sne 階層クラスタリングなどのグラフ作成 17

BAM ファイルのインポート BAM ファイルのインポートメニューでは サンプルごとの BAM ファイルに加え 遺伝子アノテーションデータの GTF ファイルも指定する必要がある ノーマライゼーション手法としては TMM FPKM TPM を選択可能 マッピング時の各種クオリティ 情報によるフィルタリングや ストランドの設定を行うことも可能 18

BAM ファイルのインポート インポート時の設定条件や サンプル間の相関係数 クオリティーなどのグラフが出力される 19

数値データファイルのインポート すでに数値化されているデータをインポートする場合は タブ区切りまたはカンマ区切りのテキストファイルを使用する インポート時にサンプル名や遺伝子名などのフィールドを自由に指定することができるため 様々なデータフォーマットのファイルに対応することができる 20

インポートされたデータの表示 インポートが完了すると PCA プロットが表示される プロットを変更することで 数値化データをテーブルで確認することも可能 21

データの対数変換 対数データになっていない場合は 必要に応じて対数変換を行う 変換を行うと 各プロットの表示も自動で変化する 22

遺伝子の抽出 インポートした全遺伝子セットから 分散フィルターを使用し サンプル間の分散が大きい遺伝子のみを抽出する Projection Score が最大になるように調整することで フィルターの閾値を決定できる 23

t-sne プロット 抽出遺伝子データを用いて t-sne プロットを表示させた結果 サンプルが 4 つのグループに分類されることがわかる 分類がわかりやすいように 必要に応じて Manual Annotation でサンプルの色付けを行う 24

ヒートマップと階層クラスタリング プロットをヒートマップに切り替え 階層クラスタリングを実施することで 各グループに特徴的な発現遺伝子のクラスター等を確認することが可能 25

ソフトウェアの詳細は 以下サイトをご覧ください 弊社 Web サイト : http://www.filgen.jp/product/bioscience21-software/index15-qlucore.html メーカーサイト : http://www.qlucore.com/ お問い合わせ先 : フィルジェン株式会社 TEL 052-624-4388 (9:00~17:00) FAX 052-624-4389 E-mail: biosupport@filgen.jp 26