xmlv2 エンジンを用いた annotated CRF の作成と検証方法の検討 Creation and verification method of annotated CRF using xmlv2 engine 三澤喬 日本たばこ産業株式会社医薬事業部 Takashi Misawa Pharmaceutical Division, JAPAN TOBACCO INC.
要旨 注釈付き症例報告書 ( Annotated CRF ) 作成の時間削減及び品質向上を目的とし,xmlv2 エンジンを用いた Annotated CRF の作成方法及び検証方法の検討を行った キーワード :XMLV2, CDISC, SDTM, Annotated CRF(aCRF), MAP, XML, XFDF 2
Annotated CRF とは? 承認申請時の電子データ提出等に関する技術的ガイドについて より CRF 収集項目が全て SDTM に格納されているかの確認用? Define-XML-2-0_ReleasePackage20140424 blankcrf.pdf より 3
どうやって作るのか? SDTM-MSG より どんなツールを用いるかは, スポンサーに委ねられている SDTM-MSG によると, 下記 2 つの対応が必要 1 注釈の検索可能 2 ブックマークの設定 ( 目次は必須ではない ) Domain ベース Visit ベース 4
注釈 (Annotation) のルール 公式なルールはなく, 例示があるのみ 作成するにしても確認するにしても, ルールがないと属人化してしまい, 効率が良くない 5
注釈 (Annotation) のルール 公式なルールはなく, 例示があるのみ 社内 (or 業界 ) でルールがあると確認しやすい [SDTM Annotations: Automation by implementing a standard process] より 6
作成タイミング PRT CRF Spec EDC SDTM Spec Blank CRF Raw SDTM TLF 作成後に作成しても問題ないが, 既に CRF/SDTM が固定しているため, 修正することは出来ない EDC セットアップ前に作成も可能だが, 担当者が同じ場合それどころではない ADaM Spec ADaM TLF 作成タイミング 固定タイミング 時間軸 7
検討内容 1. SDTM 変数のAnnotationを自動作成 2. Raw 定義書からブランクCRFのページを特定 3. Domainベース,VISITベースのブックマークを自動作成 4. acrfとdefine.xmlの整合性チェック 2と3は,PDFMARKを用いて対応出来るようですが, 再現できず断念 Reference : SDTM Annotations: Automation by implementing a standard process (PharmaSUG 2015 ) Geo Joy, Novartis フリーソフトではいくつか存在している Reference : Merge multiple RTF files, convert to PDF and add bookmark (PharmaSUG China 2017 ) - Xiang Wang 本発表では,1. 及び 4. の検討結果を報告する 8
そもそも注釈 (Annotation) を, プログラムで扱えるのか? https://helpx.adobe.com/jp/acrobat/kb/3419.html FDF という形式のファイルで, 注釈を書き出すことが可能 9
Forms Data Format とは? PDF FDF xxxx xxxx SDTM SDTM FDF 又は XFDF として注釈部分を書き出し / 取り込みすることが可能 また XML 形式である XFDF は,SAS を用いて容易に取り込みが可能 10
XFDF ファイルの書き出し方法 11
XFDF ファイルに必要な情報 Blank CRF* から抽出した XFDF ファイル例 * Define-XML-2-0_ReleasePackage20140424 blankcrf.pdf テキストエディタ表示 SAS XML Mapper 表示 12
1. SDTM 変数の Annotation を自動作成 ( ここでは XMLV2 エンジンは使用しません ) 13
SDTM 変数の Annotation を自動作成 新規 CRF Spec CRF XFDF acrf 本発表の方法では, いずれのプロセスも, 適切な場所へのマッピング, ブックマークは, 手作業であることに注意 レガシーコンバージョン CRF Spec ここで間違えていたら正しいものは出来ない Pinnacle SDTM CRF Define.xml XFDF acrf Spec Spec 14
必要なファイル 1 Pinnacle 21 Community で作成する define.xml 作成用 spec 2 空の PDF XFDFファイルを開くためのベースとなるPDF XFDFファイルで必要とするページ数が必要 15
プログラム実行手順 枠内の色違い (Annotation は全て同じ ) 予め該当する PDF ファイルの Path を XFDF 内で指定しておけば, この処理は不要です その後, 適切な場所へのマッピング, ブックマークは, 手作業 16
手作業部分 マッピング Copy & Paste Copy & Paste ブックマーク 17
作成方法 1 下記 2 シートを読み込み,Origin= CRF で絞る 事前にページ数を定義するのは, 工数がかかる そのため本プログラムでは, 使用していない Sheet [Variables] Sheet [ValueLevel] 18
作成方法 2Annotation 用に加工 今回作成したのは下記の Annotation 仕様のみ DOMAIN = Domain name VARIABLE VARIABLE in SUPPXX VARIABLE1 where VARIABLE2 = VALUE 加工が必要 プログラムで分解 ルールの通りに変換 VSORRESU where VSTESTCD = HEIGHT and COUNTRY = CAN 19
作成方法 3Annotation の仕様 ( ボックスサイズや色 ) を指定 ボックスの大きさを内容により変更 1 ページに複数の Domain を記載する場合, 複数の色を使用 Domain と変数の色は分ける 20
作成方法 4XFDF ファイルに出力 Header/Trailer Body Output 21
2. DB 定義書からブランク CRF のページを特定 3. Domain ベース,VISIT ベースのブックマークを自動作成 ( どなたか SAS を用いた方法の検討をお願いします ) 22
4.aCRF と define.xml の整合性チェック ( 既に acrf の QC をしていればチェックする必要なし ) 23
整合性チェックは必要か? Rejectルールにはないため, 間違えていても ( 恐らく ) 問題ない しかし, 不整合があると, 他の成果物も疑わしくなる そのため, チェックする必要があるが, 労力をかけたくない? 24
XML ファイルのデータセット化 SAS 9.3(TS1M2) より MAP ファイルを簡単に作成出来るようになり,XMLV2 エンジンを用いることで,XML ファイルを容易にデータセット化できるようになった Sample 47349: Create and use an XMLMap file in a SAS session Map ファイルが作成される 25
MAP ファイルとは? XML の構造を SAS データセット構造へ変換するためのファイル Element ごとにデータセットが作成される Attribute が変数になる 26
整合性チェックフロー 1XMLファイルをXMLV2エンジンを用いてSASデータセット化 2 必要な情報に絞り, 各注釈の関連情報を加工 3 想定していないAnnotationを除外する等の処理 1 2 プログラムで抽出した, acrf と define.xml の差分リスト 3 annotation 仕様外の注釈リスト ( 目視チェックが必要 ) 27
2 必要な情報に絞り, 各注釈の関連情報を加工 XFDXファイルにある注釈テキスト, 背景色, ページ番号を取得後, Domain, 変数の区分は, 文字サイズで判別 (18ptと12pt) 各変数の属するDomainは, 背景色で判別 28
3 想定していない Annotation を除外する等の処理 Domain や変数が特定できないものは,Define.xml の情報と比較できないため, 除外して一覧にして目視確認 1 obs: 見た目は同じ色だが, 背景色の設定が違う 2 obs: 想定外の仕様であるため, プログラムでの確認が出来ない 3 obs: 想定外の仕様であるため, プログラムでの確認が出来ない #BFFFFF #A4FFFF 29
比較結果 正しいか正しくないかは, 各社の判断 acrf では 4 つマッピングされているが, define.xml 上は 1 ページのみ 30
検証結果 SAS を用いてある程度の工数削減が可能となった PDF 上でAnnotationを手作業で作るのは一苦労 ( 作成したことがある人は分かるはず ) 最終成果物チェックとして活用は出来そうだが, acrfを完全自動作成するには改良が必要である しかしながら, 申請以外でaCRFを活用することはほぼ無く, (CRF SpecやSDTM Specに情報はあるので ) どこまで検討に力を入れるかは要検討 31
今後の展望 XML 形式のファイルを使用することが増えてくることが予想されるため,import した通りの構造で export 出来る容易なプロセスを用意いただけると非常にうれしく思う 今後, タグで表現されるファイル ( XML, RDF 等 ) の活用事例が多く出てくることを強く望む 32
ご清聴頂きありがとうございました プログラムは公開予定ですが, 公開されていない場合は, 下記メールアドレスまでご連絡ください takashi.misawa@jt.com 33
Reference CDISC Study Data Tabulation Model Metadata Submission Guidelines (SDTM-MSG) Ver.1.0 CDISC Define-XML Specification Version 2.0 Adobe XML Forms Data Format Specification Ver.3.0 Adobe Acrobat SDK 8.0 pdfmark Reference, Edition 1.0, November 2006 SAS SAS 9.4 XML LIBNAME Engine: User s Guide Sample 47349: Create and use an XMLMap file in a SAS session Other 承認申請時の電子データ提出等に関する技術的ガイドについて平成 27 年 4 月 27 日 SDTM Annotations: Automation by implementing a standard process (PharmaSUG 2015 ) Geo Joy, Novartis Merge multiple RTF files, convert to PDF and add bookmark (PharmaSUG China 2017 ) - Xiang Wang 34
Backup 35
XFDF ファイルの詳細 36
XFDF ファイルに必要な情報 Annotation に必要な情報 Attributes Element FDF annotation attributes Markup annotation attributes page Required creationdate Optional Common annotation attributes opacity Optional color Optional subject Optional date Optional Border style attributes flags Optional width Optional name Optional dashes Optional rect Required style Optional title Optional Freetext annotation attributes rotation Optional justification Optional intent Optional [XML Forms Data Format Specification Ver.3.0] より 37
XFDF ファイルに必要な情報 必須項目だけでは意図するものはできない 38
Annotation に最低限必要な情報 acrf 確認作業に必要と判断した Freetext Element Body Element page style color P Element date v < 表示する文字列 > rect title v 39
Blank CRF* の XFDF を見てみると * Define-XML-2-0_ReleasePackage20140424 blankcrf.pdf Blank CRF の記載方法 (Span element が使用されている ) 前ページの記載方法 Blank CRF の XFDF では, 上記の 2 つの方法で記載されている 表示上は何も変わらないので, どちらの記載でも問題ない 40
xmlnsとxmlns:xfaがないと, PDFでの加工が出来ない ( 正確な情報かどうかは不明です あくまで検証したらこれで出来たというだけです ) テキストを選択すると 41
MAP ファイルの詳細 42
自動作成の MAP ファイルの Length 切れ ダブルバイトやブランクが含まれる場合,Length が短くなることがある XML file Map file 現状, 手作業で修正する必要がある WARNING: 変数 p にデータトランケーションが発生しました : 列長 =122 追加長 =142 ただし,Log に適切な Length を表示してくれるので手間はそこまでかからない 43
複数 Path を同じ変数として格納する方法 Span というデータセットに格納される P というデータセットに格納される 両方注釈が無いようなので, 同じ変数として取り扱いたい 44
複数 Path を同じ変数として格納する方法 残念ながら現状はありません しかし,SAS テクニカルサポートの松井様より ( テクニカルサポートのご案内 )http://www.sas.com/offices/asiapacific/japan/service/technical/techsup.html 改めて調査頂き, ありがとうございました! 45
ただし, 自動作成された MAP の下記赤字部分を削除すれば, 1 ファイルとして取り扱えます 次ページに続く 46
前ページの続き 1 ファイルにはなりますが,P という変数と SPAN という変数に格納されるところは変わらない 47
( テクニカルサポートのご案内 )http://www.sas.com/offices/asiapacific/japan/service/technical/techsup.html 48