変換が必要なもの 1.Stata13( またはそれ以前 ) で保存した以下のもので 拡張 ASCII 文字 ( 日本語フォントなど ) が含まれるもの dta ファイル do ファイル ado ファイル smcl ファイル log ファイル ( gph ファイル stsem ファイル stpr ファ

Similar documents
eYACHO 管理者ガイド

<8B9E93738CF092CA904D94CC814090BF8B818F B D836A B B B816A2E786C73>

よくある質問 Q1. 署名付きメールを受信後 署名アイコンをクリックしてメッセージの作成者から正常に送信されていることを確認しましたが 取り消し状態 に デジタル ID の確認が無効になっています と表示されました (Outlook Express6 Windows Mail) 初期設定では 証明書

目次 専用アプリケーションをインストールする 1 アカウントを設定する 5 Windows クライアントから利用できる機能の紹介 7 1ファイル フォルダのアップロードとダウンロード 8 2ファイル更新履歴の管理 10 3 操作履歴の確認 12 4アクセスチケットの生成 ( フォルダ / ファイルの

ご利用のブラウザのバージョンによっては 若干項目名が異なる場合があります 予めご了承ください Windows をお使いの場合 [ 表示 ] [ エンコード ] [ 日本語 ( 自動選択 )] を選択 [ 表示 ] [ エンコード ] [Unicode(UTF-8)] を選択 Firefox をご利用

図 1 アドインに登録する メニューバーに [BAYONET] が追加されます 登録 : Excel 2007, 2010, 2013 の場合 1 Excel ブックを開きます Excel2007 の場合 左上の Office マークをクリックします 図 2 Office マーク (Excel 20


(7) 手順 1 の (5) で保存した定款をダブルクリックして開きます ダブルクリック (8) 電子定款の Word 文書が表示されますので 内容を確認します Point 定款認証の事前確認について 申請前に指定公証役場と連絡をとり 定款の案をファックスやメールで送付するなどして 事前の打ち合わせ

管理番号 内容仮想テーブル設定画面およびマッチング条件設定画面においてコメントを設定した場合 変換エラーが発生する マッピング情報設定画面の出力情報に固定値を選択し区分に 動的バイナリ値 を指定した場合 関数を設定す

ビューアページ画像の仕様

「平成20年障害福祉サービス等経営実態調査」

ULTRA DRIVE とは インターネット上 ( クラウド ) に大切なデータを保存することができる便利なアプリケ ーション ( オンラインストレージ ) です 本資料について ULTRA DRIVE サービスは マイナーバージョンアップ等もあるため 実際のクライア ントと本資料に差分が発生する場

セキュリティ設定ツールインストール 桐セキュリティ設定ツールインストール C: K3 KIRIV9 Security フォルダ内 KISECURE をダブルクリックして設定を開始します 初回セキュリティ設定ツールを起動時はウィザート形式で設定します メッセージにしたがって初期設定を行ってください セ

農業・農村基盤図の大字小字コードXML作成 説明書

Windowsクライアントユーザーマニュアル_version+1_0_1_

大阪ガス株式会社 情報通信部 御中

Microsoft Word - macマニュアル【 】.doc

スライド 1

スライド 1

Microsoft Word - Word1.doc

FTP 共有を有効にする あらかじめ作成済みの共有フォルダーを FTP 共有可能にする設定を説明します 共有フォルダーの作成方法は 画面で見るマニュアル をご覧ください ファイル数の多い共有フォルダーを変更すると 変更が完了するまでに時間がかかる場合があります また 変更が完了するまで共有フォルダー

Moodleアンケートの質問一括変換ツール

Microsoft Word - RefWorksコース doc

Graph Interface インストール手順及び操作手順

<4D F736F F D F82C A815B835982B782E98FEA8D8782CC91CE8F E646F6378>

スクールCOBOL2002

成功しました と表示されればライセンス認証の更新は完了です プロダクトキーを入力した後にテキストエディタが開き エラーメッセージが表示された場合 WEB ブラウザを起動して指定されたアドレスにアクセスしアカウントでログインします 画面に表示された ライセンスファイル を全てコピーし Originのダ

Microsoft PowerPoint - Borland C++ Compilerの使用方法(v1.1).ppt [互換モード]

Rational Roseモデルの移行 マニュアル

Mozilla Thunderbird アカウント設定手順 株式会社アマダアイリンクサービス

DBMSリポジトリへの移行マニュアル

レベルアップ詳細情報 < 製品一覧 > 製品名 バージョン < 追加機能一覧 > 管理番号 内容 説明書参照章 カナ文字拡張対応 < 改善一覧 > 管理番号 内容 対象バージョン 説明書参照章 文字列のコピー ペースト改善 ~ 子画面の表示方式 ~ 履歴の詳細情報 ~ タブの ボタン ~ 接続時の管

スーパー英語アカデミック版Ver.2

目次 1. ログイン ログアウト デスクトップ ( 例 :Word Excel 起動中 ) Dock( 例 :Word Excel 起動中 ) Finder ウィンドウ メニューバー ( 例 :Word 起動中 )...

取引上手くん 9 のインストール時にエラーが表示される際の対処法 ~Windows8 Windows8.1~ 本ドキュメントは Windows8/8.1 のパソコンにおいて 取引上手くん 9 のインストールが正常にできなかった場合の対処 法をまとめたものです なお インストールの手順そのものにつきま

OTRS10 他社システムOTRS呼出利用手順書

各種パスワードについて マイナンバー管理票では 3 種のパスワードを使用します (1) 読み取りパスワード Excel 機能の読み取りパスワードです 任意に設定可能です (2) 管理者パスワード マイナンバー管理表 の管理者のパスワードです 管理者パスワード はパスワードの流出を防ぐ目的で この操作

Windows ユーザー名に全角が含まれている場合は インストールできません のエラーが表示される 手順 1 管理者権限のある Windows ユーザーでログインした上で 以下の処理を行ってください 左下のスタートボタンをクリックし メニューが表示されましたら コントロールパネル をクリックしてくだ

パソコンバンクWeb21 操作マニュアル[サービス利用編]

DataWare-NETご利用ガイド

このうち ツールバーが表示されていないときは メニューバーから [ 表示 (V)] [ ツールバー (T)] の [ 標準のボタン (S)] [ アドレスバー (A)] と [ ツールバーを固定する (B)] をクリックしてチェックを付けておくとよい また ツールバーはユーザ ( 利用者 ) が変更

マクロの実行許可設定をする方法 Excel2010 で 2010 でマクロを有効にする方法について説明します 参考 URL:

JDL Webストレージサービス はじめにお読みください

目 次 1. はじめに アルコールチェッカー管理ソフトのインストール アルコールチェッカー管理ソフトのアンインストール アルコールチェッカー管理ソフトの操作方法 ソフトの起動 NG 判定値の設定

生存確認調査ツール

スライド 0

譲渡人複数証明データコンバータ操作説明書 平成 26 年 6 月

サイボウズ Office「リンク集」

Windows ユーザー名に全角が含まれている場合は インストールできません のエラーが表示される場合の対処法 手順 1 管理者権限のある Windows ユーザーでログインした上で 以下の処理を行ってください 画面左下の 旗のマークを左クリックし 続いて表示される一覧から 設定 ( 左側に歯車のよ

7: 1 ページ手順 5 で保存した定款をダブルクリックして開きます ダブルクリック 8: 電子定款の Word 文書が表示されるので 内容を確認します Point 定款認証の事前確認について 申請前に指定公証役場と連絡をとり 定款の案をファックスやメールで送付するなどして 事前の打ち合わせを行いま

Ⅰ 調査票 ( エクセル ファイル ) を開いたら (1) このメッセージが出てきた時の対応方法 Excel 2003 を使用する場合 A. 表示 1 マクロが使用できません というダイアログが表示された場合 OK ボタンをクリックし 下記手順にて設定を行ってください 1. メニューから 1 ツール

2. FileZilla のインストール 2.1. ダウンロード 次の URL に接続し 最新版の FileZilla をダウンロードします URL: なお バージョンが異なるとファイル名が

LINE WORKS セットアップガイド目次 管理者画面へのログイン... 2 ドメイン所有権の確認... 3 操作手順... 3 組織の登録 / 編集 / 削除... 7 組織を個別に追加 ( マニュアル操作による登録 )... 7 組織を一括追加 (XLS ファイルによる一括登録 )... 9

目次 JAVIS Appli の基本機能... 3 JAVIS Appli について... 3 音声確認機能 JAVIS Appli( 有償版 ) の機能... 4 音声で読みの確認をする... 4 辞書機能... 5 単語を登録する... 5 単語を削除する... 6 音声コードの作成... 7

<4D F736F F D F8E FEE95F1836C F8EE88F878F F88979D8BC68ED2976C A2E646F63>

メールアーカイブASP ご利用マニュアル

Origin 2017 と 2018 のプロダクトキーは共通なので 両方のバージョンを合わせてご契約 台数までしかインストールすることができません あらかじめご了承ください Origin を使用する PC を変更したい場合は 元の PC でライセンスを取り外してから 別の PC に同じプロダクトキー

PowerPoint プレゼンテーション

5-2. 顧客情報をエクスポートする 顧客管理へのアクセス手順 メールディーラーで管理する顧客情報に関する設定を行います 1. 画面右上の 管理設定 をクリックする 2. 管理設定 をクリックする 3. ( タブ ) 顧客管理 をクリックする 2

目次 第 1 章はじめに 取扱いについて 記載内容について... 6 第 2 章基本操作 Excel Online を開く ファイル ( ブック ) を作成する ファイル ( ブック ) を開く..

やさしく名刺ファイリング PRO v.7.0 簡易操作マニュアル

Microsoft Word - CBSNet-It連携ガイドver8.2.doc

年齢別人数計算ツールマニュアル

V-Client for Mac ユーザーズガイド

Microsoft Word - RefWorksコース( _.doc

スライド 1

操作マニュアルアテンダント

<4D F736F F D208AC888D B836A F C91808DEC837D836A B81698AC7979D8ED A E646F6

全体の流れ 1 ID パスワードの申請 2 協会けんぽから ID パスワード送付 3 健診対象者データ 手続き資料 (Opti) をダウンロード 4 健診機関へ予約 5 Opti で健診申込データ作成 6 申込内容を確認しアップロード 事業所担当者様が協会けんぽホームページの情報提供サービスから行う

基本的な利用法

スライド 1

償却奉行 i8/ i シリーズ 汎用データ受入の手順書 汎用データの作成方法を知りたい 汎用データのフォーマットがわからない 汎用データ受入をしたら受入エラーが発生した について資産データの受入を例に説明します 本手順書では OBC 受入形式 ( ) の汎用データの受入を 受入フォーマットに従って

PowerPoint プレゼンテーション

P-touch Transfer Manager の使用方法 ご使用になる前に 必ず本書をお読みください 本書はお読みになったあとも いつでも手にとって参照できるようにしてください Version 0 JPN

Shareresearchオンラインマニュアル

Transcription:

2017 年 7 月株式会社ライトストーン Stata14,15 における文字のエンコード形式について Stata 14 および 15 では それ以前の Stata との間で拡張 ASCII 文字のエンコード形式に違いがあり ます これにより Stata13 やそれ以前の Stata で保存したファイル ( 拡張子が dta do ado smcl gph stsem stpr のファイル ) について 拡張 ASCII 文字が含まれる場合 Stata14 および 15 では表示の文字化けが発生します 文字化けが発生すると do ファイルなどは正常に動作しないことがあります この文字化けを回避するには エンコード形式が UTF-8 である新たなファイルへデータを変換する必要があります 変換方法については いくつかの方法を本資料に記述します Stata で ASCII 文字すなわち半角英数のみを使用している場合 この変更による影響は特にありませ ん 引き続き以前の Stata のデータを使用できます 図 1. Stata13 で保存した日本語文字 ( 左 ) は Stata14 またはそれ以降でそのまま開くと文字化けします ( 右 )

変換が必要なもの 1.Stata13( またはそれ以前 ) で保存した以下のもので 拡張 ASCII 文字 ( 日本語フォントなど ) が含まれるもの dta ファイル do ファイル ado ファイル smcl ファイル log ファイル ( gph ファイル stsem ファイル stpr ファイルは変換できません 何卒ご了承ください ) ( ひとたび変換をおこなうと Stata13 またはそれ以前の Stata では文字化けの生じるファイルとなります ) 2.Windows 上または Unix 上で作成した以下のもので 拡張 ASCII 文字 ( 日本語フォントなど ) が含まれるもの csv ファイル txt ファイル ( Mac 上で作成した場合でも エンコード形式をデフォルトの UTF-8 からそれ以外の形式に変更したものも含みます ) 変換が不要なもの 1.Stata13( またはそれ以前 ) の Stata で保存した以下のもので 拡張 ASCII 文字 ( 日本語フォントなど ) が含まれないもの 2.Stata14 またはそれ以降で保存したもの 3. インポート前の Excel ファイル xls ファイル xlsx ファイル 2017 Lightstone Corp. - 2 -

Stata で変換する方法 クリックすると変換の方法を示したページへジャンプします Stata 15 Stata 14 dta ファイル データセットラベル 変数ラベル 値ラベルのいずれも含まないデータセットラベル 変数ラベル 値ラベルのいずれかを含む csv 経由 コマンド コマンド コマンド do ファイル do ファイルエディタ コマンド ado ファイル do ファイルエディタ コマンド smcl ファイル コマンド コマンド csv ファイル ダイアログ インポートコマンド Stata 以外で変換する方法 Stata を用いない変換方法も考えらえます 詳細はこちらをクリックしてご参照ください 2017 Lightstone Corp. - 3 -

背景 Stata 14 からは文字のエンコード形式が変わり ASCII 文字 ( 半角の 0-9 A-Z a-z および >.+-などの記号 ) 以外のいわゆる拡張 ASCII 文字のエンコード形式が それまでのプラットフォーム依存でなく 新たに Unicode(UTF-8) へ統一されております これにより Stata13 やそれ以前の Stata で保存した dta ファイル ( 拡張子が dta のファイル ) do ファイル ( 同 ) ado ファイル ( 同 ) について 拡張 ASCII 文字が含まれる場合 Stata14 およびそれ以降では表示の文字化けが発生します これらの文字を正しく表示するには エンコード形式が UTF-8 である新たなファイルへデータを変換する必要があります Stata で ASCII 文字すなわち半角英数のみを使用している場合 この変更による影響は特にありませ ん 引き続き以前の Stata のデータを使用できます Excel ファイルをインポートする場合 この変更による影響は特にありません テキストファイル ( 拡張子が csv などのファイル ) をインポートする場合 インポートする際に読み込むエン コード形式を指定できます ( 詳しくはこちらを参照ください ) 事前の UTF-8 形式への変換は必要ありませ ん 変換が必要なものと不要なものについてはこちらを参照ください 一般的に 拡張 ASCII 文字は 保存されたコードからは使用したエンコード形式を明確に判別できない こともあり すべて自動で完璧に行うことができません また 文字コードの衝突などから ここで説明する 方法を用いても 変換が完全には行えない可能性があります 2017 Lightstone Corp. - 4 -

do ファイルエディタで変換を行う方法 Stata 15 では do ファイルエディタにエンコード形式を変換する機能が追加されました ここではそれを使用した変換方法を説明します 1.do ファイルエディタを起動し do ファイルを開きます 上記のように do ファイルが UTF-8 でエンコードされていない場合 ポップアップが表示されます 2. エンコードで日本語 (Shift JIS) あるいは日本語 (ISO 2022-JP) を選択します ( Windows および Mac 上で作成したファイルは Shift_JIS Unix 上で作成したファイルは ISO 2022-JP を選択します ) 3. ファイル > 保存あるいはファイル > 名前を付けて保存を選択し ファイルを保存します Stata で変換する方法 の先頭に戻る 2017 Lightstone Corp. - 5 -

csv インポートで変換を行う方法 Stata 15 では csv ファイルのインポート時にエンコード形式を選択する機能が追加されました ここではそれを使用した変換方法を説明します 1. dta ファイルから csv を経由する場合 ファイル > エクスポート > テキストデータ ( デリメタ.csv 等 ) を選択し 保存 をクリックしてファイル名を指定し OK をクリックします 2. ファイル > インポート > テキストデータ ( デリメタ.csv 等 ) を選択し ダイアログを開きます 3. 参照 でインポートする csv ファイルを選択し テキストのエンコードで日本語 (Shift JIS) あるいは日本語 (ISO 2022-JP) を選択します ( Windows および Mac 上で作成したファイルは Shift_JIS Unix 上で作成したファイルは ISO 2022-JP を選択します ) 4.OK をクリックします Stata で変換する方法 の先頭に戻る 2017 Lightstone Corp. - 6 -

コマンドで変換を行う方法 Stata 14 およびそれ以降には拡張 ASCII 文字を Unicode に変換するための新たなコマンド unicode が用意されています 変換作業の大まかな流れは以下です ( 詳細は help unicode translate を 実行し ヘルプをご覧ください ) 0. 前準備 1. unicode analyze による分析 2. unicode encoding set による読み込み形式の設定 3. unicode translate による変換 4. 変換の検証 作業の一助となる操作の一覧は以下です A. ファイルを変換前の状態へ戻す B. データを変更せずその他の情報のみ変換する C. バックアップファイルを削除する D. ログの開始 / 停止 / 表示 E. テキストファイルへのエクスポート F. テキストファイルのインポート Stata で変換する方法 の先頭に戻る 0. 前準備 変換をする前に 以下の 2 つを実施してください 1 メモリ上のデータのクリア Stata で既にデータセットを開いている場合 必要があれば保存し その後 clear コマンドを実行してメ モリ上から一掃します clear 2 作業フォルダの移動 変換の対象となるファイルが現在の作業フォルダに存在しない場合 変換の対象となるファイルがあるフ ォルダまで作業フォルダを移動してください 作業フォルダの移動は 以下のコマンドを実行するか また はメニューから操作します cd 変換の対象となるファイルがあるフォルダ名 2017 Lightstone Corp. - 7 -

または [ ファイル ] > [ 作業フォルダの変更 ] を選択して以下のようなダイアログを開き 変換の対象となるフ ァイルのあるフォルダを選択 1. unicode analyze による分析 変換の対象となるファイルを分析します Stata のコマンドウィンドウで 以下を実行してください unicode analyze ファイル名 ファイル名には 変換の対象となるファイルを.dta や.do.ado などの拡張子付きで指定します 二重引 用符 (" ") で囲んでも問題ありません ただし 別のフォルダにあるファイルは指定できません 例として prec.dta というファイルを指定して実行した結果は 以下です 2017 Lightstone Corp. - 8 -

上記の結果のように赤字で File needs translation. と表示された場合 UTF-8 で未定義のコードが発見されたことなどを理由に 変換が必要と判定されたことになります 水平線より上にある記述は 詳細な分析結果です 上の例では 11 variable labels need translation と 1 str# variable needs translation とあり 11 個の値ラベルと 1 個の str# 型の変数に変換が必要であることが示されています 一方でもし 以下の実行結果のように does not need translation と表示された場合 ファイルを変換 する必要はありません 上記の unicode analyze を実行すると 作業フォルダに bak.stunicode というフォルダが新たに作成され ここに分析結果が保存されます また同フォルダには 変換の際 変換前のファイルがバックアップとして保存されます 2017 Lightstone Corp. - 9 -

なお unicode analyze は一度に複数のファイルを指定したり * を用いた形で指定したりすることもで きます 1. unicode analyze による分析法 の先頭に戻る コマンドで変換を行う方法 の先頭に戻る 2. unicode encoding set による読み込み形式の設定 次に ファイルの読み込みに用いる文字コードの形式を指定します 前述のように ファイルに保存された 文字コードそのものから使用された形式を判定することは不可能です しかし 日本語でよく使用される形 式は限られています 日本語における Unicode 以外の代表的なものは以下です Shift_JIS EUC-JP JIS Windows および Mac で用いられる形式 Windows-932 などもこれに類似 Unix で用いられる形式 電子メールで用いられる形式 ISO-2022-JP はこれに同じ ファイルで用いられた形式が正確に分からない場合 ひとまず上記のどれかであると当たりをつけます 文字コードの形式は 以下で設定します unicode encoding set " 形式名 " " 形式名 " は "Shift_JIS" "EUC-JP" "JIS" など 二重引用符付きで入力します 大文字と小文字 の区別はありません また アンダーバー (_) とハイフン (-) の区別もありません 例として "Shift_JIS" への設定を行った結果は以下です なお Stata でサポートしている文字コードの一覧を表示するには help encodings を実行します 2. unicode encoding set による読み込み形式の設定 の先頭に戻る コマンドで変換を行う方法 の先頭に戻る 2017 Lightstone Corp. - 10 -

3. unicode translate による変換 次に 変換を実施するため以下のコマンドを実行します unicode translate ファイル名 先ほど分析したファイルを指定して実行すると 次のような結果が出ます 実行結果で 水平線のすぐ下に File successfully translated と表示された場合 無事に変換が行われています 水平線より上の記述は 変換プロセスの詳細なログです たとえば all variable names okay, ASCII からは すべての variable name( 変数名 ) が ASCII 文字 であったことが分かります ASCII 文字はそのまま表示できるので このコマンドでの変換は行われません また all variable labels translated からは すべての variable label( 変数ラベル ) が変換された ことが分かります 変換した文字は 実際にファイルを開いて目で確認してください ( 4. 変換の検証 へ移動する ) 一方 変換が失敗すると 次のような結果が出ます 2017 Lightstone Corp. - 11 -

用いた文字コードの形式 処理したファイルの数 変換プロセスのログ ( 変換できない文字 (unconvertable characters) の場所や数の特定に役立つ ) 結論と提案 上記の結果のように赤字で表示された File not translated との記述がある場合 何らかの理由により変換は行われていません 赤字で続けて表示されている because it contains unconvertable characters は その理由が 変換できない文字があったため であることを示しています 水平線より上の記述は変換プロセスのログです たとえば label for variable 1 (A) contains unconvertable characters は 変数 1( 名前 A) の変数ラベルが変換できない文字を含んでいた ことを示します 上記のような失敗の結果は 今後の作業を効率化するために メモ帳やログに保存し いつでも見直せる ようにすることをお勧めします 変換が失敗する原因は様々です 今の場合のように変換できない文字が数多くある場合 原因 1 読み込みに使用した文字コードの形式が適切でなかった ということが考えられます この場合 別の形式へ設定することで問題が解決する可能性があります 2. unicode encoding set による読み込み形式の設定 へ戻り 先ほどとは別の形式を選択してから 3. unicode translate による変換 を実行します 文字コードの形式は数多くあり 他の形式に若干の追加を行ったもの 呼び方のみ異なるものなど様々あります Stata で変換できる文字コードの形式の一覧を表示するには help encodings を実行してください 2017 Lightstone Corp. - 12 -

いくつかの形式を試しても なかなか変換に成功する形式が見つからない場合 原因 2 一つの形式の文字コードでは絶対に変換ができない ということが考えられます unicode translate は読み込みに用いる形式は一度につき一つしか設定 できません この原因がある場合 一度変換を行った後 そこから更に変換を行うことで問題が解決 する可能性があります 変換できない文字があっても強制的に変換を行うには 以下を実行します 変換が実施されファイルの内容が置き換わる際 変換前のファイルが bak.stunicode に保存され 変換後においても unicode restore ファイル名を実行することにより元の状態に戻すことができます ファイルを強制的に変換するには 以下のコマンドのうちどれかを実行します unicode translate ファイル名, invalid(mark) unicode translate ファイル名, invalid(ignore) unicode translate ファイル名, invalid(escape) invalid(mark) を指定すると 変換できない文字は Unicode で公式の置き換え用の文字 (Replacement character U+fffd) で置き換えて変換を実施します Replacement character は や や SUB という表示になります invalid(ignore) を指定すると 変換できない文字は削除して変換を実施します invalid(escape) を指定すると 変換できない文字は %X## というエスケープシーケンスコードで置き 換えて変換を実施します ## には変換できなかった文字の 16 進数コードです 変換後は 実際にファイルを開き 文字化けしていない文字が見られるかを確認してください 全く見られないようであれば 再び文字コードの形式の設定からやり直します 正しい文字が見られ 部分的にでも変換が成功しているようであれば ファイルのコピーを作成し 必要であれば半角英数のみの名前にファイル名を変更した後 そのファイルについて 再び 1. unicode analyze による分析法 から実行します あるいは 変換できない文字の数が少数である場合 無理に対応形式を探さず データエディタなどから手動で修正する方法も考えられます 2017 Lightstone Corp. - 13 -

3. unicode translate による変換 の先頭に戻る コマンドで変換を行う方法 の先頭に戻る 4. 変換の検証 変換が成功したら 実際に Stata14 で開いてみて 本当に正しい変換が行われたかを確認します 目で確認して文字化けがなさそうであれば 正しい形式を選択して変換を行ったと考えられます 全体的に文字化けが見られるようであれば 2. unicode encoding set による読み込み形式の設 定 へ戻り 形式の設定からやり直してください 変換が成功した場合でも 本当に変換が正しく行われたのかの確認は行いたいところです 変換の正当性の検証は 別の方法による変換結果と比較する方法が考えられますが 残念ながら Stata のデータセット形式を認識した上で拡張 ASCII 文字の変換を行える別の方法は存在せず 一刀両断的に結論が与えられるような検証方法がありません ただし ある程度範囲を絞った上で 条件付きで検証を行う方法が考えられます 以下は そのうちのいくつかです 検証法 1 変換前と変換後の.dta ファイルをテキストデータに出力して比較する 検証法 2 変換前と変換後の.dta ファイルを以前の Stata と Stata14 で開き 文字を表示させた状 態をスクリーンショットで保存するなどして 両者の文字を目で見て比較する 2017 Lightstone Corp. - 14 -

検証法 3 変換前と変換後の.dta ファイルについて summarize コマンドを実行し 結果を比較す る 以下 検証法 1のみを取り上げて説明します まず Stata で.dta ファイルを開き テキストデータへ出力します テキストファイルへのエクスポートの方法については テキストファイルへのエクスポートをご覧ください 出力したファイルは Microsoft 社の Word 文書で 比較 という機能を使って比較できます Word 2013 では メニューから [ 校閲 ]-[ 比較 ]-[ 比較 ] を選択すると 以下のようなダイアログが開きます 左上にある [ 元の文書 ] でボックスの右にあるフォルダマークをクリックし 比較するテキストファイルのうちの一つを開きます エンコードを選択するウィンドウが出る場合 そのままの状態で OK を選択します 次に同様に 右上にある [ 変更された文書 ] でボックスの右にあるフォルダマークをクリックし 比較するテキストファイルのうちのもう一つを開きます すると次のような画面になります 2017 Lightstone Corp. - 15 -

上の例では 変換での変更になった点が エクスポート上の仕様によるわずかなスペースの違いを除けば 変数 s の型が str8 から str12 に変更されたのみであることが分かります ちなみに この変更はエンコード形式の違いにより必要なバイト数が変わったためであると考えられます より重要なのは 両者のファイルで日本語の文字にも ASCII 文字に違いが見られないという結果が得られたことであり これにより 少なくとも変数の値 変数名 変数ラベルにおいては 変換が正しく行われたことが検証されたと言えます 4. 変換の検証 の先頭に戻る コマンドで変換を行う方法 の先頭に戻る A. ファイルを変換前の状態へ戻す 一度変換したファイルを 変換前の状態に戻すには 以下のコマンドを実行します unicode restore ファイル名 コマンドで変換を行う方法 の先頭に戻る 2017 Lightstone Corp. - 16 -

B. データを変更せずその他の情報のみ変換する 変数の値として格納された文字は 可読性よりもコードの値が一定であることが重要になる場合がありま す 変数の値に含まれた文字を変換せず 変数ラベル 値ラベルなどのその他にある文字列のみを変換 するには 以下のコマンドを実行します unicode translate ファイル名, nodata コマンドで変換を行う方法 の先頭に戻る C. バックアップファイルを削除する 変換の実施により作成されたファイルを削除するには 以下のコマンドを実行します unicode erasebackups, badidea コマンドで変換を行う方法 の先頭に戻る D. ログの開始 / 停止 / 表示 ログを開始するには 以下のコマンドを実行またはメニューを選択します log using ファイル名 [ ファイル ] > [ ログ ] > [ 開始 ] を選択してファイル名を指定 ログを終了するには 以下のコマンドを実行またはメニューを選択します log close [ ファイル ] > [ ログ ] > [ 終了 ] を選択 ログを表示するには 以下のコマンドを実行またはメニューを選択します view ファイル名 [ ファイル ] > [ ログ ] > [ 開始 ] を選択してファイル名を指定 コマンドで変換を行う方法 の先頭に戻る 2017 Lightstone Corp. - 17 -

E. テキストファイルへのエクスポート まず 変換するファイルをテキストファイルへエクスポートします Stata で変換するファイルを読み込んだ 後 コマンドウィンドウで以下を実行するか またはメニューから以下を選択してください export delimited ファイル名, replace [nolabel] [ ファイル ] > [ エクスポート ] > [ テキストデータ ( デリメタ.csv 等 )] ファイル名には出力先のファイル名を指定します.csv や.txt などの拡張子付きで指定します 二重引用符 (" ") で囲んでも問題ありません ただ 別のフォルダにあるファイルは指定できません nolabel を指定した場合 値ラベルを適用したデータについて 値ラベルでなく数値データが出力されます 指定しない場合 数値ラベルでなく 値ラベルが出力されます たとえば prec.dta を開いた後 prec.csv というファイルへエクスポートすると 以下のように 結果ウィンドウには特に表示は出ません 4. 変換の検証 の先頭に戻る コマンドで変換を行う方法 の先頭に戻る Stata 以外での変換 の先頭に戻る 2017 Lightstone Corp. - 18 -

F. テキストファイルのインポート 次に 変換したテキストファイルを Stata にインポートします コマンドウィンドウで以下を実行するか また はメニューから以下を選択してください import delimited ファイル名, clear [encoding(" エンコード形式 ")] [ ファイル ] > [ インポート ] > [ テキストデータ ( デリメタ.csv 等 )] ファイル名には入力するファイル名を指定します.csv や.txt などの拡張子付きで指定します 二重引用符 (" ") で囲んでも問題ありません ただ 別のフォルダにあるファイルは指定できません encoding(" エンコード形式 ") を指定した場合 エンコード形式に入力した形式でファイルを読み込みます encoding("shift_jis") あるいは encoding("iso-2022-jp") と指定すると それぞれの形式で保存されたテキストファイルを文字化けなくインポートできます ( Windows および Mac 上で作成したファイルは Shift_JIS Unix 上で作成したファイルは ISO-2022-JP を指定します )Stata14 でメニュー操作をおこなう際 ダイアログに表れる テキストのエンコード では "Latin 1" "MacRoman" "UTF-8" "UTF-16" の 4 つのみしか指定できません それ以外を指定する場合 コマンド操作をご利用ください 4. 変換の検証 の先頭に戻る コマンドで変換を行う方法 の先頭に戻る Stata 以外での変換 の先頭に戻る 2017 Lightstone Corp. - 19 -

Stata 以外での変換 文字の変換は 必ずしも Stata14 またはそれ以降を利用して行う必要はありません 文字の変換を行う方 法は何通りも考えられます ただ Stata 以外での変換に当たっては 以下の点に留意する必要がありま す.dta ファイルにおいては Stata 以外を用いて Stata 独自のデータセット形式を認識しながら行うこと ができません したがって 変数の値 変数名 変数ラベル 値ラベルなど すべての情報を失わず に変換を行うのは困難な作業になることが見込まれます.do ファイルや.ado ファイルにおいては それらが純粋にテキストファイルであるため 一般的なテキ ストエディタなどを用いて変換を行える可能性があります Stata 以外で変換を行う方法の一つとして 1.dta ファイルをテキストファイルへエクスポート 2テキストファイルを UTF-8 で保存 3 保存したテキストファイルをインポート という手順で実施する方法が考えられます この方法は比較的短い作業で かつ広く一般的に用いられている方法で変換を行えるという長所があります 一方で 前述のように変数の値と変数ラベル 変数名以外のデータが失われてしまいます ( 逆に言えば.dta ファイルでそれら以外を利用していない場合は 極めて有用な手段になります ) テキストファイルを UTF-8 で保存する場合 テキストとして表示されない BOM というデータをファイルに含める方法と含めない方法の 2 通りが存在します Stata 用に変換を行う場合 この BOM がない方法で保存が行われる必要があります もし BOM を含んだ方法で保存したファイルを Stata で利用しようとすると ファイルがインポートできなかったり コマンドが実行できなかったりします Windows のメモ帳は UTF-8 での保存ができる大変便利なツールですが BOM を含めない方法で保存することができないため この変換には利用できません 以下には 関連する機能についての説明です E. テキストファイルへのエクスポート F. テキストファイルのインポート コマンドで変換を行う の先頭に戻る 2017 Lightstone Corp. - 20 -