バクテリアゲノム解析

Similar documents
AJACS18_ ppt

プレゼンテーション2.ppt

Introduction Purpose This training course describes the configuration and session features of the High-performance Embedded Workshop (HEW), a key tool

Sequencher 4.9 Confidence score Clustal Clustal ClustalW Sequencher ClustalW Windows Macintosh motif confidence Sequencher V4.9 Trim Ends Without Prev


スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎

PostgreSQLによる データベースサーバ構築技法

作業手順手引き

Vol.55 No (Jan. 2014) saccess 6 saccess 7 saccess 2. [3] p.33 * B (A) (B) (C) (D) (E) (F) *1 [3], [4] Web PDF a m

スパコンに通じる並列プログラミングの基礎

EPSON PX-A720 操作ガイド

CpG (Whole genome bisulfite sequencing; WGBS) MeDip-Seq 1 DNA CpG-rich 1. SureSelect Reduced representation bisulfite sequencing (RRBS) DNA CpG PCR DN

kut-paper-template.dvi

Microarray Data Analysis Tool Ver3.0 Manual.doc

KNOB Knoppix for Bio Itoshi NIKAIDO

HDL-XRシリーズ LAN DISK 管理マニュアル

XJTAG

スタートアップガイド_応用編

計算機生命科学の基礎II_

PowerPoint プレゼンテーション

gworksctl コマンドマニュアル 2019/6/17 株式会社 GDEP アドバンス 本書は GDEP Advance gworksctl コマンドマニュアルです G-Works G-Works Deep Learning Distribution for Linux( 以下 G-Works)


FA0072 FA0028

Introduction Purpose This training course demonstrates the use of the High-performance Embedded Workshop (HEW), a key tool for developing software for

IPSJ SIG Technical Report Vol.2010-NL-199 No /11/ treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corp

Microsoft PowerPoint - 阿部貴志.ppt

MINI2440マニュアル

目次 Ion Reporter 概要とメタゲノム解析 Ion16S Metagenome Kit データ解析概略 解析実行手順 解析実行結果 カスタムプライマー利用時のWorkflow 作成 サポート情報 p.3 p.9 p.14 p.19 p.26 p.35 2

& Vol.5 No (Oct. 2015) TV 1,2,a) , Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Ro

リード・ゲノム・アノテーションインポート

資料5:聖ウルスラ学院英智小・中学校 提出資料(1)

I I / 47

M M M M

_念3)医療2009_夏.indd


2 3

POWERCHR.backup.OMB

FPGAメモリおよび定数のインシステム・アップデート

‡ç‡¢‡Ó‡Ü‡Á‡Õ04-07„”

output2010本文.indd

ネットリストおよびフィジカル・シンセシスの最適化

OpenMP¤òÍѤ¤¤¿ÊÂÎó·×»»¡Ê£±¡Ë

[2] OCR [3], [4] [5] [6] [4], [7] [8], [9] 1 [10] Fig. 1 Current arrangement and size of ruby. 2 Fig. 2 Typography combined with printing

DPA,, ShareLog 3) 4) 2.2 Strino Strino STRain-based user Interface with tacticle of elastic Natural ObjectsStrino 1 Strino ) PC Log-Log (2007 6)

New version (2.15.1) of Specview is now available Dismiss Windows Specview.bat set spv= Specview set jhome= JAVA (C:\Program Files\Java\jre<version>\

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用

CG-WLR300N




TM-T88VI 詳細取扱説明書


目    次

Introduction Purpose This course explains how to use Mapview, a utility program for the Highperformance Embedded Workshop (HEW) development environmen

PowerPoint プレゼンテーション

国立遺伝学研究所におけるDNAデータバンク:DDBJ

1 122

Microsoft Word - Meta70_Preferences.doc


The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). The material has been made available on the website

dTVIIman.PDF

17. (1) 18. (1) 19. (1) 20. (1) 21. (1) (3) 22. (1) (3) 23. (1) (3) (1) (3) 25. (1) (3) 26. (1) 27. (1) (3) 28. (1) 29. (1) 2

ジェネリック医薬品販売会社(田辺製薬販売株式会社)の設立に伴う包装変更のご案内

06地図目録.pwd

目次 1.rug について zmd の動作確認 rug からの情報の取得 rug コマンドの使用例 アップデート可能なパッケージの一覧を表示 パッケージを検索する 特定のパッケージをインストール / ア

02

,,,,., C Java,,.,,.,., ,,.,, i


Transcription:

GCCGTAGCTACCTTTACAATA GCCGTAGCT AGCTACC GCTACCTTT CCTTTAC CTTTACAATA GCCG CCGT CGTA GTAG TAGC AGCT AGCT GCTA CTAC TACC GCTA CTAC TACC ACCT CCTT CTTT CCTT CTTT TTTA TTAC CTTT TTTA TTAC TACA ACAA CAAT AATA GCCG CTTT TTTA CCGT CCTT TTAC CGTA ACCT TACA GTAG TACC ACAA TAGC CTAC CAAT GCCGTAGCTAC TACCTTTAC AGCT GCTA AATA TACAATA

http://ddbj.nig.ac.jp/drasearch/

mkdir aaa cd aaa wget ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/sra117/sra117449/srx45628 7/SRR1151187_1.fastq.bz2 wget ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/sra117/sra117449/srx45628 7/SRR1151187_2.fastq.bz2 bzcat SRR1151187_1.fastq.bz2 head -2000000 > SRR1151187_1.1M.fastq bzcat SRR1151187_2.fastq.bz2 head -2000000 > SRR1151187_2.1M.fastq

wget http://platanus.bio.titech.ac.jp/?ddownload=145 -O platanus chmod a+x platanus./platanus Platanus version: 1.2.4./platanus Usage: platanus Command [options] Command: assemble, scaffold, gap_close

wget https://www.evernote.com/shard/s205/sh/4b2497a5-f63a-42d5-afcc- ad07b7376ede/2afddc0e11c6d81e/res/346d91e8-76d9-4f1a-9624- c2b0a93f0ab5/run_platanus.sh qsub run_platanus.sh #$ -S /bin/bash #$ -pe def_slot 4 #$ -cwd #$ -l mem_req=4g,s_vmem=4g #$ -l short READ1=SRR1151187_1.1M.fastq READ2=SRR1151187_2.1M.fastq FILE_PREFIX=SRR1151187./platanus assemble -t 4 -m 16 -o ${FILE_PREFIX} -f $READ1 $READ2./platanus scaffold -t 4 -o ${FILE_PREFIX} -c ${FILE_PREFIX}_contig.fa -b ${FILE_PREFIX}_contigBubble.fa -IP1 $READ1 $READ2./platanus gap_close -t 4 -o ${FILE_PREFIX} -c ${FILE_PREFIX}_scaffold.fa -IP1 $READ1 $READ2

wget https://www.evernote.com/shard/s205/sh/4b2497a5-f63a-42d5-afcc- ad07b7376ede/2afddc0e11c6d81e/res/f986e7fa-e95f-4204-99c4-7582452cee46/fastalengthfilter.py python fastalengthfilter.py SRR1151187_gapClosed.fa 200 > SRR1151187_200.fa wget https://www.evernote.com/shard/s205/sh/4b2497a5-f63a-42d5-afcc- ad07b7376ede/2afddc0e11c6d81e/res/8f2b14b9-8725-4b9e-8020-100a4d07ed62/fasta_stat.py python fasta_stat.py SRR1151187_200.fa TOTAL SEQUENCE LENGTH bp: 1788584 TOTAL SEQUENCE NUMBER #: 13 LENGTH of 10 LONGEST SEQUENCES: [574295, 571013, 299830, 168523, 106529, 63258, 1415, 1114, 1019, 630] N50: 571013 N ratio: 0.011070%

>Chromosome TGGTAATATTACTGTTGATTCATCAACGAGTAGCCCCATAGGGGCAATGGCAAAAGCATACTCCCGTTAATTCGGATGT ATAAATATTAAGTCGAATAAAAGGTATCTAGGAAAACTTGTGAGTACACGTGAAAAACGTCTGCTCTCCTTGCTCTTTT TAAATGAAAAAGAGCCAAAGTCCATAAGGAGGTGTAACAGTTAATGGAACCAAAACGTTATGAAATTACGTACATCATT CGTCCTGACATGGATGAAGCTGCTAAAACAGCGCTTGTTGAACGATTTGACAAGATTGTGTCAGATAATGGTGCTACGA TCGTTGATTCGAAAGACTGGTCTACTCGTCGATTTGCTTATGAAATTGGTGATTACAACGAAGGTACTTACCATATCGT TAATATCACAGCAAACGATGATGTAGCGCTAAACGAATTTGATCGTTTAGCTAAGTTTAGTGACGATATCTTGCGTCAC ATGATTGTTAAGCGTGAAGCTTAATCTAATCAATTTAAAGTTAAGAAAGGAGTATTAGAATCAAACGTGCTCGGATTAT GGGTCTGCTACCATTCGTTGCAGAAGACTAATTTGAAATTGTCCATATTGTATCTCTCGAGCCAATTAAATCAATTAGG AAACTGCCAGAGGAGGGAAATTCAATGGCTCAACAAAGAAGAGGCGGACATCGTCGCCGTAAGGTTGACTTTATTGCCG TTCACAGATTTAAGACACATACTTTTTGTTTTGTGTTCTTGTTTTATTAGTGCTATCGTGTTATAATTTTTGCTTACCG Gene YYY with ZZZ domain Similar to xxx of yyy (zz.z%) Gene XXX Function for xxxxxx AAAAACACGTTCACATCACATAGGCGTTAAAATAATACATCGATTACAAAGATACTGATTTACTAAAACGTTTTATTTC TGAACGCGGTAAGATTTTACCACGTCGATTTAATGTAAATGTTTATTTAAATCCTAATTATGCCATGATTGTGGTGTGA TTAGGTCTCGTCCCGTAAGGTAAGAACATTAACAATATCACCCACTATATGATTAATCGTACAATTCTTGTTGGACGCT TAACTAGAGATCCTGAGTTGCGATACACAACTAGTGGAGCTGCTGTAGCAACGTTTACCGTTGCTGTCAATCGGCAGTT TACCAATCAACAGGGTGAACGGGAAGCTGATTTTATTAGCTGCGTCATTTGGCGTAAAGCTGCTGAAAATTTTTCCAAT TTCACTCATAAGGGTTCTTTGGTTGGGGTTGATGGCCGCATTCAAACGCGAAATTATGAAAATCAACAGGGTCAACGTG TTTATGTAACGGAAGTAGTAGTTGAAAACTTCTCGTTACTAGAAACGAAAGCCCAAAGTCAAAACCATAATAATGGTGC CCCAAGCTTTGACAATAATCAACAAGCCAATGCTCCTCAATCATCATCAGCAAATGATAATCCGTTTGGTAATGCTAAT GACAATGCAAATGCGGGAAGTAGTAGTGCTAACAGCAATGCTAACGATCCATTCGCTAATAATGGCGAACCAATCGACA TTTCAGATGACGATTTGCCGTTCTAACAAAGTTAGTGGAACAAGTGCTAAAAACCAGCGTCGTTTAACAATTGCAATCA AACGTGCTCGGATTATGGGTCTGCTACCATTCGTTGCAGAAGACTAATTTGAAATTGTTTTAAT...

Data submission Prerequisite for paper Sequence data Public sequence databases Genome annotation / data submission pipelines PGAP 1~2 weeks to get results Limited for GenBank submitters GenBank Intensive manual curation

DDBJ Fast Annotation and Submission Tool Prokaryotic genome annotation Data submission to DDBJ Fast, flexible, and powerful

Graphical user interface for beginners https://dfast.nig.ac.jp Command operations for experts (DFAST-core) Create DDBJ submission file using online editor Sample usage dfast --genome your_genome.fna --config sample.cfg Stand-alone version available for download (https://github.com/nigyta/dfast_core)

assembly gap Genomic FASTA file CDS rrna trna Structural annotation phase de facto standard gene prediction tools parallel processing Collect features Resolve overlap Functional Annotation Functional annotation phase Ultrafast homology search using GHOSTX - 10 times faster Small, but well-curated references (Suzuki et al. 2014) - Default database constructed from 120 representative genomes - Optional organism-specific database Output (GenBank, GFF, DDBJ-MSS...) Pseudogene detection Flexible and customizable

wget https://github.com/nigyta/dfast_core/archive/1.0.5.tar.gz tar xvfz 1.0.5.tar.gz cd dfast_core-1.0.5/ python3 dfast -h python3 scripts/file_downloader.py --protein dfast python3 dfast --config example/test_config.py

cd.. export _JAVA_OPTIONS="-Xmx256m -XX:ParallelGCThreads=1" python3 dfast_core-1.0.5/dfast --genome SRR1151187_200.fa --out result -- no_cdd --no_hmm