MiSeq Sample Sheet Quick Reference Guide (MiSeq サンプルシートクイックリファレンスガイド ) FOR RESEARCH USE ONLY Introduction ( はじめに ) 3 Setting Up the Sample Sheet ( サンプルシートのセットアップ ) 5 Sample Sheet Parameters ( サンプルシート ) 7 Analysis Workflow ( 解析ワークフロー ) 12 Technical Assistance ( テクニカルサポート ) ILLUMINA PROPRIETARY パーツ番号 15031827 改訂 A 2011 年 12 月
本書および本書の内容は Illumina, Inc. (Illumina) が所有権を有する知的財産であり 顧客が契約の下で使用することを意図したものです 本書に記載されたシステムの操作以外の目的での使用は意図されていません Illumina の事前の書面による許可なく 目的や方法を問わず 本書およびその内容を使用または配布 通信 開示 または複製することを禁じます 本システムやそのすべての構成部品が正常に動作するためには 経験を積んだオペレータが本書の手順に厳密かつ明示的に従う必要があります 本システムまたはその構成部品を操作する前に 本書の内容を熟読し 完全に理解する必要があります 本システムまたはその構成部品を操作する前に 本書の熟読や完全な理解を怠り 本書の記載に従わない場合 装置またはその部品が損傷したり 装置またはその部品を操作するオペレータが怪我をしたりする恐れがあります また Illumina, Inc. は その特許権 登録商標権 著作権 または慣習法上の権利もしくはその他の類似の権利の下でのいかなる許諾も付与しません Illumina, Inc. は 予告なく 本書に記載されたあらゆる手順 製品 またはその部品を変更する権利を有します 発行日の時点で 本書の内容については可能な限り完全かつ正確であるように万全を期しておりますが Illumina は保証または適合性を黙示するものではなく 本書に含まれる情報に起因して発生したいかなる損害についても一切責任を負いかねます FOR RESEARCH USE ONLY 2011 Illumina, Inc. All rights reserved. Illumina, illuminadx, BaseSpace, BeadArray, BeadXpress, cbot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iselect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, パンプキンオレンジ色, および Genetic Energy ストリーミングベースデザインは Illumina, Inc. の登録商標または商標です ここに含まれるその他すべてのブランドおよび名称の所有権はそれぞれの所有者に帰属します
Introduction ( はじめに ) サンプルシートは シーケンスランをセットアップ 実行 および分析するために必要な情報を保持するコンマ区切り値 (*.csv) ファイルです ランを開始する前に Setup Option ( オプションのセットアップ ) で指定した 装置制御コンピュータ内のロケーション または ネットワーク上のロケーションに サンプルシートをコピーします 新しいサンプルシートを追加するには Manage Files ( ファイルの管理 ) 機能を使用します 詳細については MiSeq System User Guide (MiSeq システムユーザーガイド ) を参照してください ランの開始時に ソフトウェアはサンプルシートをランフォルダのルートにコピーします ラン終了時に サンプルシートはセカンダリ解析のために MiSeq Reporter 解析ソフトウェアによって使用されます Introduction ( はじめに ) Illumina Experiment Manager サンプルシートを作成するには Experiment Manager を使用できます Experiment Manager はウィザードベースのアプリケーションであり 表示される手順に従うだけで ランに対する解析ワークフローに基づいてサンプルシートを作成することが可能です Experiment Manager により サンプルプレートの ( サンプル ID やデュアルインデックスなど ) と 以下のライブラリー調製プロトコールの 96 ウェルプレートに該当するその他のを記録する機能が提供されます } Nextera } TruSeq DNA } TruSeq RNA } Small RNA } TruSeq カスタムアンプリコン Experiment Manager を使用すると サンプルプレートをサンプルシートにインポートできます Experiment Manager は あらゆる Windows プラットフォームで実行できます Experiment Manager は Illumina の Web サイト (http://www.illumina.com) からダウンロードできます MiSeq サポートページにアクセスし [Downloads] をクリックしてください ダウンロードするには MyIllumina アカウントが必要となります Sample Sheet Template ( サンプルシートテンプレート ) サンプルシートテンプレートは Excel や Notepad ( メモ帳 ) で開いたり編集したりすることが可能です サンプルシートテンプレートは Illumina の Web サイト (http://www.illumina.com) からダウンロードできます MiSeq サポートページにアクセスし [Downloads] をクリックしてください ダウンロードするには MyIllumina アカウントが必要となります 注意サンプルシートのフィールドには カンマ スペース またはその他の無効な文字を使用しないでください フィールド内にカンマが含まれていると ソフトウェアではサンプルシートを正しく読み取ることができません Illumina では Illumina Experiment Manager を使用してサンプルシートを正しく作成することを推奨します MiSeq サンプルシートクイックリファレンスガイド 3
Naming the Sample Sheet ( サンプルシートの名前付け ) ラン前のチェックの実行時に ソフトウェアでは 前のランセットアップ手順で装置にロードされた試薬カートリッジに関連するサンプルシートを自動的に検索します そのため Illumina では ランに使用する試薬カートリッジのバーコード番号をサンプルシート名にすることを推奨します ( 形式 : 試薬カートリッジのバーコード番号 + *.csv 拡張子 ) バーコード番号は カートリッジラベルのバーコードの下に記載されています 4 パーツ番号 15031827 改訂 A
Setting Up the Sample Sheet ( サンプルシートのセットアップ ) 注意 Illumina では シーケンスランに使用する試薬カートリッジのバーコード番号をサンプルシート名にすることを推奨します バーコード番号は カートリッジラベルに記載されています 1 試薬カートリッジのバーコード番号に csv 拡張子を付ける形で サンプルシートに名前を付けます この例では サンプルシート名は MS0001082-50.csv のようになります 図 1 試薬カートリッジラベル 2 Illumina Experiment Manager またはサンプルシートテンプレートを使用して サンプルシートを装置外で作成します 必要に応じて 実験者名 プロジェクト名 実験名 および日付も入力してください 3 適切な解析ワークフロー (Resequencing Amplicon Metagenomics DenovoAssembly SmallRNA または LibraryQC) を入力します この際 スペースを入力しないように注意してください 各ワークフローの詳細については 下の表を参照してください 4 ランに対するケミストリーを指定します デュアルインデックスランに対しては amplicon と入力します その他のすべてのランに対しては このフィールドを空白のままにするか または default を入力します 5 各リードに対するサイクル数を入力します 注意インデックスランの場合 [Data] セクションで各サンプルのインデックス配列を含める必要があります Index1 のに対しては i7 のインデックス配列を記入してください Index2 の ( アンプリコンケミストリーに固有 ) に対しては i5 のインデックス配列を入力してください 6 実施する解析ワークフローに固有な残りのサンプルシートセクションへの入力を完了させます 各サンプルには一意のサンプル ID (SampleID) が必要です サンプル名 (Sample_Name) は同じでもかまいません Setting Up the Sample Sheet ( サンプルシートのセットアップ ) 解析ワークフロー Manifests SiteReports Data Resequencing 該当なし オプション 必須 :SampleID オプション :Index Index2 Amplicon 必須 オプション 必須 :SampleID Manifest オプション :Index Index2 DenovoAssembly 該当なし該当なし必須 :SampleID MiSeq サンプルシートクイックリファレンスガイド 5
解析ワークフロー Manifests SiteReports Data オプション :Index Index2 SmallRNA 該当なし 該当なし 必須 :SampleID Contaminants mirna RNA オプション :Index Index2 Metagenomics 該当なし 該当なし 必須 :SampleID オプション :Index Index2 LibraryQC 該当なし 該当なし 必須 :SampleID オプション :Index Index2 注意 TruSeq カスタムアンプリコンサンプルシートの適切なインデックス配列の組み合わせについては TruSeq Custom Amplicon Library Preparation Guide (TruSeq カスタムアンプリコンライブラリー調製ガイド ) を参照してください Nextera DNA サンプルシートの適切なインデックス配列の組み合わせについては Nextera DNA Sample Preparation Guide (Nextera DNA サンプル調製ガイド ) を参照してください 7 [Setup Options] で指定したネットワークの場所にサンプルシートをコピーするか または USB フラッシュドライブと [Welcome] 画面からアクセスできる [Manage Files] 機能を使用して 装置にサンプルシートをコピーします 詳細については MiSeq システムユーザーガイド を参照してください 6 パーツ番号 15031827 改訂 A
Sample Sheet Parameters ( サンプルシート ) Header ( ヘッダー ) サンプルシートは [Header] [Reads] [Manifests] [Data] など セクション別に整理されます セクションの見出しでは 大文字と小文字が区別されます その他のすべてのフィールドでは 大文字と小文字が区別されません 図 2 Excel で開いたサンプルシートの例 ランに対してサンプルシートのセクションがすべて適用されるわけではありません 適用セクションは ランに固有の解析ワークフローによって異なります サンプルシートの [Header] セクションには ランに関する情報を含めます 余分なフィールドは無視されます Sample Sheet Parameters ( サンプルシート ) InvestigatorName ProjectName ExperimentName Date Workflow Chemistry 説明実験者名プロジェクト名実験名実験日必須解析ワークフロー名 (Resequencing Amplicon DenovoAssembly SmallRNA Metagenomics または LibraryQC) を正しく入力します 詳細については 12 ページの Analysis Workflow ( 解析ワークフロー ) を参照してください Illumina Experiment Manager を使用する場合は ドロップダウンリストからワークフローを選択します このフィールドにより ランに固有のレシピを構築するために使用されるレシピフラグメントが識別されます このフィールドを空白にした場合 システムではデフォルトのレシピフラグメントを使用します オプション : TruSeq RNA ライブラリーまたは TruSeq DNA ライブラリーに対しては このフィールドを空白のままにし デフォルト設定を使用できます 必須 : デュアルインデックスを使用するすべてのワークフロー ( 特に Nextera および TruSeq カスタムアンプリコン ) で必須フィールドです このフィールドには amplicon を入力してください MiSeq サンプルシートクイックリファレンスガイド 7
Reads ( リード ) [Reads] セクションでは 各リードのシーケンスサイクル数を指定します リード 1 に対するサイクル数 リード 2 に対するサイクル数 説明ターゲットシーケンスのリードの長さ インデックスリードに対するサイクル数は [Data] セクションで定義したインデックス配列によって示されます ターゲットシーケンスのリードの長さ 注意インデックスリードに対するサイクル数は [Data] セクションで定義したインデックス配列によって示されます Manifests ( マニフェスト ) TruSeq カスタムアンプリコンライブラリーのシーケンスに対する Amplicon 解析ワークフローの場合 サンプルシートのこのセクションは必須です その他の解析ワークフローを使用する場合は このセクションに入力する必要はありません マニフェストファイル名 説明カスタムアッセイ (CAT) に対して Illumina によって提供されるマニフェストファイルの名前 マニフェストファイルはマニフェストフォルダ内に存在します マニフェスト名を入力する際には ファイル拡張子 (*.txt) を含めないでください マニフェストは複数指定することが可能です ( カスタム CAT に対して 1 つ コントロール CAT に対して 1 つ ) 個々のマニフェストは サンプルシートの [Manifests] セクションで A および B として定義されます マニフェストファイルは [Manage Files] 機能を使用して指定の場所にロードします 詳細については MiSeq System User Guide (MiSeq システムユーザーガイド ) を参照してください 図 3 複数のマニフェストが指定されているサンプルシートの例 8 パーツ番号 15031827 改訂 A
SiteReports (SiteReport) Data ( データ ) サンプルシートのこのセクションは Resequencing 解析ワークフローと Amplicon 解析ワークフローによって使用されます SiteReport インプットファイル名 説明 [SiteReports] セクションの各行は SiteReport インプットファイルの名前です 特定の染色体における位置をこのファイルで指定すると その位置で見つかった遺伝子型がレポートされます これはユーザーが生成するファイルです インプットファイルは 各ランに対して複数使用することが可能です SiteReport インプットファイルは サンプルシートと同じフォルダ場所に存在する必要があります SiteReport インプットファイルはカンマ区切り値 (*.csv) ファイルで 以下のルールが適用されます 最初の行はカラム名である 必須カラムは Position ( 位置 ) と Chromosome ( 染色体 ) です ユーザー定義のその他のカラムは 指定の位置に対して生成される解析レポートに付け足される SiteReport インプットファイル名を入力する際には ファイル拡張子 (*.csv) を含めないでください このセクションでは 1 行につき 1 つのサンプルに関する情報を入力します このセクションには少なくとも 1 つのサンプルを含める必要があります このセクションでは 解析ワークフローごとに異なるカラムが必要となります カラムの順序は重要ではありません Sample Sheet Parameters ( サンプルシート ) SampleID Sample_Name Index Index2 説明必須通常ではこれはバーコードですが 任意の値を指定することもできます ( ただし 固有でなければならない ) オプションこれは レポート Web ページで使用されます シングルインデックスまたはデュアルインデックスでのマルチサンプルアッセイに対しては必須です ヌクレオチドシーケンス : 有効な文字は A C G T および N で N は任意の塩基に相当します i7 のインデックス配列を入力してください デュアルインデックス (Illumina の Nextera サンプル調製シーケンスや TruSeq カスタムアンプリコンシーケンスなど ) でのマルチサンプルアッセイに対しては必須です ヌクレオチドシーケンス : 有効な文字は A C G T および N で N は任意の塩基に相当します i5 のインデックス配列を入力してください Resequencing ワークフローに対するその他のカラム 説明必須アライメントステップで使用される FASTA ファイルを含んでいるリファレンスゲノムフォルダ には ネットワークの場所または MiSeq のローカルドライブを指定できます 最適な結果を実現するには ローカルハードドライブにゲノムを格納するか または BaseSpace を使用してください MiSeq サンプルシートクイックリファレンスガイド 9
説明 の場所は FASTA ファイルを含んでいるフォルダにする必要があります ファイルパスの例は D:\Illumina\MiSeq Reporter\Genomes\PhiX\Illumina\RTA\Sequence\Chromosomes です Amplicon ワークフローに対するその他のカラム Manifest 説明推奨これは 変異のアノテーションを提供し ( 可能な場合 ) *.bam ファイルアウトプットで染色体サイズを設定するために使用されます 必須このサンプルによって使用されるアッセイ (CAT) に対してマニフェストファイルを指定します DenovoAssembly ワークフローに対するその他のカラム ( または Genome) 説明オプションこのフィールドに入力する場合は ゲノムフォルダへの絶対パスを指定します 入力されたフォルダが存在しない場合 MiSeq Reporter は GenomePath 構成設定に指定されたゲノム文字列を使用します パスが存在しない場合 MiSeq Reporter では処理を停止します SmallRNA ワークフローに対するその他のカラム Contaminants mirna RNA 説明オプションこのフィールドに入力した場合 完全リファレンスゲノムに対してクラスターがアラインされます 必須コンタミネーションの FASTA ファイルを含んでいるフォルダへのパス 必須 mature mirna の FASTA ファイルを含んでいるフォルダへのパス 必須 small RNA の FASTA ファイルを含んでいるフォルダへのパス Library QC ワークフローに対するその他のカラム 説明必須アライメントステップで使用される FASTA ファイルを含んでいるリファレンスゲノムフォルダ 10 パーツ番号 15031827 改訂 A
Settings ( 設定 ) サンプルシートの [Settings] セクションは オプションで指定します 以下は このセクションで入力可能なエントリです FilterPCRDuplicates MinQScore OnlyGenerateFastq Adapter 説明 0 または 1 を設定します デフォルトは 1 ( フィルタリング ) です 1 に設定すると PCR 重複にフラグが付けられ 変異コーリングに使用されなくなります 重複は 両方のリードでのアライメント位置が完全に同じであるペアエンドリードとして定義されます 変異コールを行う際の Q 値のしきい値を指定します 0 または 1 を設定します デフォルトは 0 です 1 に設定すると MiSeq Reporter では FASTQ ファイルを生成し その後ワークフローを終了します このオプションは FASTQ ファイルを処理するために CASAVA または第三者ツールの使用を希望する場合のショートカットとして提供されています 注意 : データをアラインしない場合でも に対してパスを指定する必要があります 一部のクラスターは アダプターからのサンプル DNA とリードベースを超えてシーケンスできます アダプターシーケンスをマスクするには ここでそのアダプターシーケンスを指定します アダプターシーケンスをマスクすると 2 次解析における精度と速度が増します 注意 : SmallRNA ワークフローでのアダプターのトリミングは デフォルトで常に行われます また Illumina の Nextera サンプル調製キットを使用して調製したサンプルに対しては アダプターのマスキングが推奨されます Sample Sheet Parameters ( サンプルシート ) MiSeq サンプルシートクイックリファレンスガイド 11
Analysis Workflow ( 解析ワークフロー ) 解析ワークフローは MiSeq の 2 次解析ソフトウェアである MiSeq Reporter によって実行される手順です 2 次解析は Real Time Analysis (RTA) ソフトウェアによって 1 次解析が完了すると開始します MiSeq は 6 つの解析ワークフローをサポートします ランに対する解析ワークフローは サンプルシートで指定されます サンプルシートに解析ワークフローを入力する際には 下の ワークフロー カラムに表示されているとおりに名前を入力してください ワークフローアプリケーションアウトプット ターゲットリシーケンス入力名 :Resequencing アンプリコンシーケンス入力名 :Amplicon デノボアセンブリ入力名 : DenovoAssembly Small RNA シーケンス入力名 :SmallRNA メタゲノム解析入力名 :Metagenomics ライブラリー QC 入力名 :LibraryQC ヒトゲノムの濃縮部分のシーケンス または大腸菌のような小さなゲノムのシーケンス リードはリファレンスに対してアラインされ 変異がレポートされる 特定のゲノム位置を対象とするプローブからの TruSeq カスタムアンプリコンのシーケンス ( 最大約 96 サンプルから最大約 384 箇所 ) ゲノムリファレンスは推奨されるが 必須ではない リファレンスを含めると *.bam ファイルヘッダーのゲノムサイズが正確になり dbsnp または遺伝子内での変異のアノテーションが可能になる リードは サンプルシートで指定したマニフェストファイルに対してアラインされる マニフェストは 2 つ ( コントロール用に 1 つとサンプル用に 1 つ ) 指定できる ゲノムリファレンスを使用しない リードからの小さい (< 20 Mb) ゲノムのアセンブリ ゲノムリファレンスが含まれる場合 ゲノム位置のリファレンス対コンティグのドットプロットが生成される mirna のシーケンス リードは コンタミネーション mature mirna smrna ゲノムリファレンスの各順で指定したファイルに対してアラインされる ゲノムリファレンスはメタゲノム解析ワークフローに対して必須ではない リードは MiSeq Reporter ソフトウェアに付属の 16S rrna データのデータベースを使用して分類される DNA ライブラリーの品質管理 (QC: Quality Control) を行ったり サンプルごとの統計を生成したりするための リファレンスゲノムのクイックリシーケンス *.bam 形式でアラインされたリード *.vcf 形式の変異コール *.bam 形式でアラインされたリード *.vcf 形式の変異コール FASTA 形式でのコンティグ 各レコードの相対存在度に関するレポート 界から属まで 分類群別のリード分類 サンプルごとのサマリー統計 12 パーツ番号 15031827 改訂 A
Technical Assistance ( テクニカルサポート ) テクニカルサポートに関しては Illumina カスタマーサポートまでお問い合わせください 表 1 Illumina 一般問合わせ先情報 Illumina Web サイト http://www.illumina.com 電子メール techsupport@illumina.com 表 2 Illumina カスタマーサポート電話番号 地域 問合わせ先番号 地域 問合わせ先番号 北米 1.800.809.4566 イタリア 800.874909 オーストリア 0800.296575 オランダ 0800.0223859 ベルギー 0800.81102 ノルウェー 800.16836 デンマーク 80882346 スペイン 900.812168 フィンランド 0800.918363 スウェーデン 020790181 フランス 0800.911850 スイス 0800.563118 ドイツ 0800.180.8994 イギリス 0800.917.0041 アイルランド 1.800.812949 その他の国 +44.1799.534000 Technical Assistance ( テクニカルサポート ) MSDSs ( 化学物質安全データシート ) 化学物質安全データシート (MSDS) は Illumina の Web サイト http://www.illumina.com/msds でご覧になれます Product Documentation ( 製品マニュアル ) 追加の製品マニュアルが必要な場合は Illumina の Web サイトから PDF ファイルでご利用いただけます http://www.illumina.com/support に移動して製品を選択してください マニュアルをダウンロードするには MyIllumina にログインするよう要求されます ログイン後 PDF を表示または保存できます MyIllumina アカウントに登録するには https://my.illumina.com/account/register を開いてください MiSeq サンプルシートクイックリファレンスガイド
Illumina Headquartered in San Diego, California, U.S.A. +1.800.809.ILMN (4566) +1.858.202.4566 (outside North America) techsupport@illumina.com www.illumina.com