755 解 説 連 載 :eコンテンツのためのデータ 加 工 第 2 回 ルのデータをこれらの 形 式 で 出 力 することもでき る 1 エクセルのデータをこれらの 形 式 に 変 換 するに は[ファイル]メニューの[ 名 前 を 付 けて 保 存 ]の ダイアログボックスでファイルの 種 類



Similar documents
<4D F736F F D20819C486F70658F6F93588ED297708AC7979D89E696CA837D836A B E A2E646F63>

年齢別人数計算ツールマニュアル

一 括 登 録 方 法 一 括 登 録 をするには 予 め 専 用 の CSV ファイルを 作 成 する 必 要 があります 普 段 エクセルファイルで 管 理 をされている 方 は, 以 下 の 3 列 のみのデータとなるようにデータを 加 工 して CSV ファイルとして 保 存 して 下 さ

Ver 改 訂 日 付 改 訂 内 容 1

ボタンをクリックします ( 警 告 が 表 示 されない 場 合 もあります ) 9 画 面 に Win SFX32M V と 表 示 されますので 保 存 する 箇 所 を 選 択 し OK をクリックしてください 選 択 した 箇 所 にインストールしたフォルダが 保 存 され

以 下 に 手 順 の 流 れを 記 載 します 3ページ 以 降 で 各 項 目 の 手 順 を 説 明 します ( をクリックすると 該 当 ページにジャンプします ) また 4ページに 汎 用 データ 受 入 に 関 するよくあるお 問 い 合 わせをご 紹 介 しています Step (3ペー

雇用保険被保険者資格取得届(様式)編

Microsݯft Word - 91 forܠ2009November.docx

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

Microsoft Word - 03accessデータベース演習レジメ.doc

1. アクセスする 2. 簡 易 検 索 画 面 (fig. 1) アクセスすると 最 初 に 出 る 画 面 です 検 索 語 入 力 ボックスにキーワードを 入 力 して 論 文 検 索 ボタンをクリックし ます 3. ボックス 下 部 のチェック 項

図 2 エクスポートによるシェープファイルの 新 規 保 存 新 規 保 存 するファイルは,より 分 かりやすい 名 前 をつけて 適 切 なフォルダ(shape フォル ダにまとめておくのがよい) 上 に 保 存 しておく 2 / 10

光ディスク等による届出用ファイルの作成方法

目 次 1. 積 算 内 訳 書 に 関 する 留 意 事 項 1 ページ 2. 積 算 内 訳 書 のダウンロード 3 ページ 3. 積 算 内 訳 書 の 作 成 (Excel 2003の 場 合 ) 6 ページ 4. 積 算 内 訳 書 の 作 成 (Excel 2007の 場 合 ) 13

<4D F736F F D C97F195CF8AB DEC90E096BE8F912091E6312E313294C52E646F63>

改 定 履 歴 改 訂 日 改 訂 理 由 及 び 内 容 承 認 者 確 認 者 改 訂 者 05/8/7 新 版 発 行 05/0/5 推 奨 動 作 環 境 を 追 記

医 療 費 自 己 負 担 額 支 払 明 細 書 入 力 シート - 目 次 - < 第 1 章 > 共 通 事 項 説 明 医 療 費 自 己 負 担 額 支 払 明 細 書 入 力 シート 目 次 1.1 本 システムの 注 意 点 入 力 項 目 について 基 本 情

TIPS - 棚 割 りを 開 始 するまで Liteを 起 動 し 企 業 情 報 の 追 加 を 行 い 棚 割 を 行 う 企 業 の 追 加 をして 下 さい 企 業 情 報 の 追 加 時 に エラーメッセージが 表 示 された 場 合 別 途 TIPS トラブルが 発 生 した 場 合

地域ポータルサイト「こむねっと ひろしま」

事前チェック提出用現況報告書作成ツール入力マニュアル(法人用)

別冊資料-11

Word 003 スキルブック 06 - オブジェクトの 利 用 0.Word で 作 る 表 : 行 幅 を 最 小 値 より 小 さく 設 定 する 3 表 の 左 右 のサイズを 適 宜 調 整 します Word で 表 を 作 成 するとき, 列 幅, 行 幅 ともに 基 本 的 に 自 由

Microsoft Word - word_05.docx

ことばを覚える

Microsoft Word - 教科書VBA_第1章2013_.doc

2.4 箇 条 書 のスタイルを 変 更 する 右 クリックして 箇 条 書 と 番 号 付 け を 選 択 する. あとは 少 し 遊 べば, このようなことをやりたい 人 は 理 解 できると 思 います 3 いろいろな 入 力 ワープロを 使 う 上 で 肝 心 な 点 は, 空 白 調 整

目 次 1.ログイン 方 法 P2 2.ログアウト 方 法 P3 3. 基 本 設 定 変 更 サイトネーム スローガンの 設 定 P10~11 カラーバリエーションの 選 択 P12 メニュースタイル 色 の 設 定 P12 4.トップページの 画 像 編 集 画 像 の 変 更 P13~14 T

スライド 1

Microsoft Word - 養生学研究投稿規定(改)

2 / 18 ページ 第 13 講 データの 活 用 とデータマップの 作 成 13-1 ホームページの 保 存 ホームページ(Web ページ)に 表 示 される 様 々な 情 報 を ファイルとして 保 存 することができます

目 次 1. 大 学 情 報 データベースシステムの 使 用 方 法 について EXCEL 一 括 登 録 EXCEL ダウンロード 検 索 条 件 の 指 定 プレビュー EXCEL ダウンロード(データ 抽 出 あ

1-1 一覧画面からの印刷

MetaMoJi ClassRoom/ゼミナール 授業実施ガイド

目 次 遺 失 物 管 理 プログラム 利 用 者 マニュアル 1. 動 作 条 件 遺 失 物 管 理 プログラムのインストール 運 用 の 流 れ 起 動 方 法 操 作 方 法 について 基 本 的 な 操

治 験 実 施 管 理 システム NMGCP 向 け Excel 形 式 プロトコール 作 成 手 順 書 V4.0.3 対 応 版 第 1 版 株 式 会 社 富 士 通 アドバンストエンジニアリング All Rights Reserved,Copyright 株 式 会 社 富 士 通 アドバン

< 目 次 > 8. 雇 用 保 険 高 年 齢 雇 用 継 続 給 付 27 ( 育 児 休 業 給 付 介 護 休 業 給 付 ) 8.1 高 年 齢 雇 用 継 続 給 付 画 面 のマイナンバー 設 定 高 年 齢 雇 用 継 続 給 付 の 電 子 申 請 高

2 課 題 管 理 ( 科 学 研 究 費 補 助 金 ) 画 面 が 表 示 されます 補 助 事 業 期 間 終 了 後 欄 の[ 入 力 ] をクリックします [ 入 力 ]ボタンが 表 示 されていない 場 合 には 所 属 する 研 究 機 関 の 事 務 局 等 へお 問 い 合 わせく

R4財務対応障害一覧

(Microsoft Word - \215u\213`\203m\201[\203g doc)

SXF 仕 様 実 装 規 約 版 ( 幾 何 検 定 編 ) 新 旧 対 照 表 2013/3/26 文 言 変 更 p.12(1. 基 本 事 項 ) (5)SXF 入 出 力 バージョン Ver.2 形 式 と Ver.3.0 形 式 および Ver.3.1 形 式 の 入 出 力 機 能 を

名刺作成講習

PowerPoint プレゼンテーション

01_07_01 データのインポート_エクスポート_1

購買ポータルサイトyOASIS簡易説明書 b

Basic

目 次 第 1 章 は じ め に... 3 第 2 章 基 本 的 な キ ー 操 作... 4 第 3 章 メ ニ ュ ー 画 面... 6 第 4 章 入 荷 業 務... 7 第 5 章 出 荷 業 務... 9 第 6 章 商 品 照 会...11 第 7 章 棚 卸 業 務...12 第

Office 10 パッケージ版「リンク集」

<4D F736F F D20819C B78AFA95DB91538C7689E68DEC90AC289

マーケティングプラットフォームユーザーマニュアル その 他 の 機 能 設 定 方 法 結 合 項 目 を 利 用 してCSVダウンロードする CSVダウンロードの 設 定 を 下 記 のようにして 頂 くことで アンケートのセル 内 改 行 の 自 働 変 換 を 抑 え 郵 便 番 号 ( 00

入札方式別操作

2016 年 度 情 報 リテラシー 変 更 された 状 態 同 様 に 価 格 のセルを 書 式 設 定 する 場 合 は 金 額 のセルをすべて 選 択 し [ 書 式 ]のプルダウンメニューか ら[ 会 計 ]を 選 択 する すると が 追 加 され 金 額 としての 書 式 が 設 定 さ

第 1 章 : 概 要 このウェブサイトでは ウェブブラウザに 必 要 とする 電 動 機 スペックを 入 力 する 事 により 誘 導 電 動 機 の 外 形 図 を 検 索 & 照 会 すること ができます 画 面 の 紹 介 ログインボタン 一 覧 表 形 式 で 選 定 ボタン ログイン 画

スライド 1

Outlook Express, Windows Mail / Outlook のアドレス 帳 からエクスポートした CSV ファイルを Active! mail にインポートする 場 合 勤 務 先 の 番 地 / 番 地 ( 会 社 )が 複 数 行 入 力 されているとインポート 時 に 改

(Microsoft Word - \203G\203N\203V\201[\203h.docx)

Microsoft Word - 操作マニュアル(石油コンビナート_オフラインソフト編)_v0.2.doc

以 下 に 手 順 の 流 れを 記 載 します 3ページ 以 降 で 各 項 目 の 手 順 を 説 明 します ( をクリックすると 該 当 ページにジャンプします ) また 15ページに 汎 用 データ 受 入 に 関 する よくあるお 問 い 合 わせをご 紹 介 しています Step1 (

目 次 1.はじめに 書 式 の 説 明 表 紙 スケジュール 組 入 れ 基 準 併 用 禁 止 薬 併 用 注 意 薬 同 種 同 効 薬 医 師 モニタリング..

POWER EGG V2.01 ユーザーズマニュアル ファイル管理編

2

1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図

はじめに この 平 成 28 年 度 地 域 型 住 宅 グリーン 化 事 業 適 用 申 請 書 記 入 の 手 引 き は 申 請 者 のみなさん が 申 請 書 の 作 成 と 評 価 業 務 をスムーズに 行 うため 申 請 書 の 書 き 方 を 手 引 きするものです 申 請 書 を 本

研究者情報データベース

目 次 JAVIS Appli の 基 本 機 能... 3 JAVIS Appli について... 3 音 声 確 認 機 能 JAVIS Appli( 有 償 版 )の 機 能... 4 音 声 で 読 みの 確 認 をする... 4 辞 書 機 能... 5 単 語 を 登 録 する... 5

目 次 機 能 概 要 配 信 管 理 1. メールの 配 信 履 歴 と 予 約 を 確 認 する

PowerPoint プレゼンテーション

入 札 参 加 資 格 申 請 システム 操 作 マニュアル 入 札 参 加 資 格 の 資 格 有 効 ( 変 更 ) 日 を 迎 えると 追 加 届 の 登 録 ができるようになります ( 入 札 参 加 資 格 申 請 の 定 時 受 付 では いずれかの 申 請 先 団 体 から 入 札 参

Microsoft PowerPoint - 報告書(概要).ppt

( 別 途 調 査 様 式 1) 減 損 損 失 を 認 識 するに 至 った 経 緯 等 1 列 2 列 3 列 4 列 5 列 6 列 7 列 8 列 9 列 10 列 11 列 12 列 13 列 14 列 15 列 16 列 17 列 18 列 19 列 20 列 21 列 22 列 固 定

振込データの作成

2016 年 度 情 報 リテラシー 三 科 目 合 計 の 算 出 関 数 を 用 いて 各 教 科 の 平 均 点 と 最 高 点 を 求 めることにする この2つの 計 算 は [ホーム]タブのコマ ンドにも 用 意 されているが 今 回 は 関 数 として 作 成 する まず 表 に 三 科

PowerPoint プレゼンテーション

1

返還同意書作成支援 操作説明書

目 次 機 能 運 用 上 の 注 意 処 理 手 順 画 面 説 明 ログイン 直 送 先 選 択

Microsoft PowerPoint - 集計サービス手順説明

もくじ 0.はじめに 1 1. 用 紙 をスキャナで 用 紙 を 読 み 込 む 1 2. 書 式 定 義 マークした 部 分 を 個 々のデータとして 取 り 込 む 場 合 ( 複 数 回 答 対 応 ) マークした 部 分 をグループ 化 して 取 り 込 む 場 合

スライド 1

<4D F736F F D2090C389AA8CA72D92F18F6F2D D F ED28CFC82AF91808DEC837D836A B E838B A815B816A2E646F6378>

文科省様式3-2集計オプションマニュアル

0 目 次 1. 畑 のあしあとの 使 い 方 P.3 2.オプション P.6 3.モバイルデバイスより 履 歴 取 得 P.8 4. 基 本 情 報 管 理 P 栽 培 計 画 P.22 6.ドキュメント 出 力 P 栽 培 履 歴 管 理 P.28 8.モバイルでの 栽

_責)Wordトレ2-1章_斉

PowerPoint プレゼンテーション

決 算 時 の 流 れ-1 1 年 間 の 仕 訳 入 力 が 終 了 したら 以 下 の 手 順 で 決 算 書 を 作 成 します Step1 精 算 表 を 印 刷 する 1.[F2 入 力 ]タブより 合 計 表 を 選 択 し 月 度 の 指 定 で 期 首 ~12ヶ 月 目 を 指 定

目 次 1. 化 学 研 究 所 研 究 者 データベースについて 研 究 者 情 報 データベース 登 録 システムログイン 画 面 メニュー 画 面 パスワードの 変 更 公 開 時 の 表 示 / 非 表 示 の 設 定.

操 作 の 手 順 : 個 人 住 民 税 一 括 納 付 / 新 規 依 頼 修 正 複 写 個 人 住 民 税 一 括 納 付 メニュー 個 人 住 民 税 一 括 納 付 新 規 依 頼 修 正 複 写 依 頼 / 委 託 者 情 報 入 力 (P100) 依 頼 修 正 / 委 託 者 情

PowerPoint プレゼンテーション

<4D F736F F D2093CD8F6F82AA954B977682C88C9A95A882CC94BB926682CC DD5F48508C668DDA E646F63>

メール 受 信 画 面 のレイアウトを 変 更 することができます ここでは 初 期 設 定 のレイアウトで 表 示 されているボタ ンやマークについて 解 説 します メール 一 覧 画 面 には 受 信 したメールが 一 覧 表 示 されます メール 受 信 タブをクリックすると 受 信 箱 フ

■ディレクトリ


(Microsoft Word - Word\211\236\227p8\217\315.docx)

Acrobat早分かりガイド

<4D F736F F D AC90D1955D92E CC82CC895E DD8C D2816A2E646F63>

Microsoft Word - 生物学技研報告ONLINE ガイドブック.doc

1 はじめに 1.1 アドインの 機 能 このツールは Microsoft Excel 用 のアドインです 本 アドインには 下 記 の 機 能 があります スペルと 文 章 のチェック 機 能 Microsoft Word の スペルチェックと 文 章 校 正 の 機 能 を 使 用 して Exc

5 振 込 依 頼 書 の 作 成 方 法 ()ツールの 起 動 コピーまたはダウンロードしたツールをダブルクリックして 開 いてください (ツール 起 動 の 際 マクロを 有 効 にしてください ) ダブルクリック 後 以 下 のメッセージが 出 力 されますので 読 み 取 り 専 用 ボタン

Microsoft Word - 203MSWord2013

PowerPoint プレゼンテーション

A

Transcription:

解 説 連 載 : eコンテンツのためのデータ 加 工 第 2 回 長 谷 川 秀 記 1 著 者 抄 録 :Webサイトの 構 築 や 広 報 システムの 電 子 化 などに 伴 い, 各 種 のOAデータをeコンテンツ 用 のデータに 加 工 する 技 術 が 必 要 とされる この 連 載 はデータ 入 手 からテキスト 化,データ チェック, 文 字 の 問 題,タグ データ 加 工 までの 各 段 階 について, 基 本 知 識 と 技 術 の 実 務 を 解 説 する 今 回 は アプリケーション データからのテキスト データ 取 り 出 し の 続 きで 作 表 ソフ トを 取 り 上 げ 解 説 する キーワード: 作 表 ソフト,Microsoft Excel,XML,HTML,テキスト データ,タブ 区 切 りデータ, CSV,スペース 区 切 りデータ,カンマ 区 切 りデータ,タブ 文 字,セル 内 改 行,セル 結 合 Author Abstract: In building web sites or making digitized PR system ones need to use techniques of processing OA data for e-contents. This series explain the basic knowledge and practices in the course starting from data acquisition to data processing, including making the text data, the data checking, characters dealt with in, tagging. This article, the second part of the series, covers the continued from the first part on to take text data out from application data, that is, software for tabulation. Key words: tabulation software, Microsoft Excel, XML, HTML, text data, data segmented by tab, CSV, data segmented by space, data segmented by comma, tab character, line return inside cell, cell connection ( 情 報 管 理 ) 前 回 までは 以 下 の 項 目 を 説 明 した eコンテンツに 適 したデータ データの 入 手 とその 意 点 アプリケーション データからの テキスト データ 取 り 出 し ワープロ データからのテキスト デー タ 取 り 出 し 今 回 は アプリケーション データからのテキス ト データ 取 り 出 し の 続 きとして 作 表 ソフトを 取 1 ( 有 ) 自 由 電 子 出 版 ( 151-0053 東 京 都 渋 谷 区 代 々 木 2-22-8 イースト( 株 ) 内 )Tel. 03(5358)3941 E-mail: info@jiyudensi.co.jp 1 Jiyu-denshi Publishing Co., Ltd. (22-8, Yoyogi 2-chome, Shibuya-ku, Tokyo, 151-0053) り 上 げ 解 説 する 作 表 ソフトからのテキスト データ 取 り 出 し eコンテンツの 元 データとして 渡 されるデータに はマイクロソフト エクセルなどの 作 表 ソフトも 多 く 使 われている 表 の 形 式 に 合 致 するデータはエク セルなどの 作 表 ソフトで 作 ってもらうと 間 違 いが 少 ない ここではマイクロソフト エクセルからテ キストデータを 取 り 出 す 際 の 意 点 を 述 べる( 以 下 の 説 明 はMicrosoft Excel 2002に 準 拠 した) テキスト 出 力 の 種 類 エクセルでは, 以 下 の 種 類 のテキスト データ 形 式 が 扱 える これらの 形 式 のテキスト データをエ クセルに 読 み 込 ませることもできるし,またエクセ

755 解 説 連 載 :eコンテンツのためのデータ 加 工 第 2 回 ルのデータをこれらの 形 式 で 出 力 することもでき る 1 エクセルのデータをこれらの 形 式 に 変 換 するに は[ファイル]メニューの[ 名 前 を 付 けて 保 存 ]の ダイアログボックスでファイルの 種 類 から 該 当 す るものを 選 択 して 保 存 すればよい テキストファイル(スペース 区 切 り)(*.prn) テキストファイル(タブ 区 切 り)(*.txt) CSV 形 式 (カンマ 区 切 り)(*.csv) HTML 形 式 XML 形 式 DIF 形 式 SYLK 形 式 以 下 にそれぞれの 形 式 についてeコンテンツ データとしての 向 き 不 向 きを 解 説 した テキストファイル(スペース 区 切 り) 拡 張 子 が prn で 出 力 されるスペース 区 切 りの テキスト データ エクセルの 画 面 と 同 じ 表 示 にな るように 半 角 空 白 を 付 加 して 出 力 される( ) この 形 式 は 印 刷 や 表 示 には 適 したテキストデー タであるが,このデータを 加 工 しようとするとデー タの 区 切 りが 区 別 できなくなることがあるのでeコ ンテンツ 用 のデータとしては 不 適 である 形 式 (カンマ 区 切 り) * CSV(Comma Separated Value)は 表 形 式 のデータ を 表 現 する 最 もポピュラーな 形 式 である CSV 形 式 では 表 の 行 を1 行 で 表 現 し, 列 と 列 の 間 に 半 角 のカンマ, を 入 れてデータを 区 分 する( 図 ) 問 題 になるのはデータ 中 にカンマが 使 用 されて いた 場 合 である この 場 合 はデータをダブルコー テーションで 括 る データ 中 にダブルコーテーショ ンが 使 用 されていた 場 合 はダブルコーテーション を2つつなげる( ) CSV 形 式 は 一 般 的 なデータフォーマットなのだ がデータ 中 にカンマ 使 用 された 場 合,データ 区 切 り との 区 別 をつけるのが 難 しい データ 処 理 にとって は 実 は 扱 いづらい 形 式 であり, 次 に 説 明 するタブ 区 切 りデータを 利 用 した 方 がよい テキストファイル(タブ 区 切 り) * CSV 形 式 のカンマの 代 わりにタブ 文 字 2 を 使 用 したものである( ) この 形 式 ではデータ 中 にカ ンマやダブルコーテーションがあっても 区 切 り 文 字 と 重 複 しないのでCSVよりはるかに 扱 いやすい エクセルではCSV 形 式 と 同 じルールを 適 用 し, データ 中 にカンマがある 場 合 はダブルコーテー ションで 囲 み,ダブルコーテーションが 登 場 した 場 合 はダブルコーテーションを2つつなげて 出 力 する また 後 述 の セル 結 合 や セル 内 改 行 を 行 っ た 場 合 にも 問 題 が 発 生 するので 意 が 必 要 である 形 式 1 行 目 : 数 字 項 目 と 文 字 項 目 が 区 別 不 能 になる 123DEF 2 行 目 : 空 白 のある 項 目 ではスペース 区 切 り が 余 計 に 発 生 してし ま う 形 式 セル 内 にカンマやダブル コーテーションがあった 場 合 2 行 目 の1 列 目 と3 列 目 がカンマ 入 り, 2 列 目 はダブルコーテーシ ョ ンが 入 っている 形 式 ( 図 1と 同 じデータをCSVに 変 換 ) は 改 行 を 表 す 1) テキスト 化 によるデータの 変 化 についてはエクセル のヘルプの Excel のファイル 形 式 変 換 では 保 存 され ない 書 式 と 機 能 に 書 いてある 参 照 されたい

756 情 報 管 理 Vol. 44 No. 11 February 2002 タブ 区 切 り 変 換 図 3と 同 じエクセルファイルをタブ 区 切 りに 変 換 [タブ]はタブ 文 字 を 表 す この 形 式 が 最 もデータを 単 純 化 することが 可 能 であり, 一 番 推 奨 できる 変 換 方 式 である この 形 式 からデータを 取 り 出 す 方 法 については 後 述 する 出 力 エクセルのHTML 出 力 はHTMLのTABLEデータ としてエクセルデータを 出 力 するもので,エクセル のデータ 情 報 がほぼ 完 全 に 入 っている テキスト 化 したデータとしては 情 報 が 落 ちていないので 望 ま しいデータといえるが, 複 雑 なデータとなることが 難 点 である エクセルのデータをHTMLライクなTABLE 構 造 として 加 工 しようとするなら,この 出 力 が 役 に 立 つ だろう サンプルデータ( )から 出 力 されたHTMLファ イル( )は 文 字 種 の 指 定 やエクセル 独 自 タグな どゴチャゴチャしたデータとなっているが, 前 回 説 明 したWordからのHTML 出 力 加 工 と 同 じように, 不 要 な 指 定 をなくしていくことで 整 理 されたデータ を 得 ることができるはずだ タグデータを 検 討 する 場 合 の 要 点 は 以 下 のよう なものである 連 続 した 空 セルは<td colspan=n>となる(40,44 行 目 ) ダブルコーテーションは " カンマはそのま サンプル 用 エクセルデータ セルC3はC1+C2 と いう 計 算 式 が 入 っ ている ま 入 っている(18,19 行 目 ) 入 力 時 のルビが 埋 め 込 まれている(24,25 行 目 読 みデータとして 正 しいという 保 証 はないだろ う) 計 算 項 目 のセルには, 計 算 式 が 属 性 値 として 示 さ れる(26 行 目 コンテンツデータとしては 通 常 不 要 だろう) セル 内 改 行 は<td>タグ 内 のデータを<br>タグで 区 切 っている(35 行 目 ) セル 結 合 は<td rowspan=n>や<td colspan=n>の 形 になっている(23,29 行 目 ) 出 力 エクセル2002からはXML 出 力 もフォローされ た この 出 力 ファイルを 解 析 してテキスト 化 するこ とも 可 能 である 通 常 は 単 純 な 表 形 式 のフォーマッ トが 多 いと 思 われるので, 上 記 のタブ 区 切 りのもの を 利 用 する 方 が 簡 単 であるが,セルの 連 結 などを 多 用 しているものなどにはこの 方 式 からのコンバー トが 向 いている タグの 整 理 方 法 はHTML 出 力 と 同 様 である XML 出 力 を 整 理 する 場 合 の 要 点 は 以 下 である 3 コードはUTF-8 4 となる セル 内 改 行 は とユニコードの 文 字 表 記 となる セルの 連 結 は 縦 方 向 はMergeDown="n", 横 方 向 な らMergeAcross="n"という 属 性 になる(nは 連 結 さ れるセル 数 -1) 2) タブ 文 字 :キーボードの [TAB] キーを 押 したときに 入 力 される 文 字 空 白 と 同 じように 表 示 されるが, 次 の 文 字 が 一 定 の 桁 数 ( 一 般 的 には 半 角 で8 文 字 の 倍 数 )になるように 長 さが 調 節 される 本 来 は 文 字 の 桁 合 わせに 使 用 されるが, 通 常 のデー タには 登 場 しない 文 字 であるためデータの 区 切 りと しても 用 いられる コードは09(H) テキスト エディタなどの 正 規 表 現 では t と 表 現 する なおタブ 文 字 は 空 白 と 見 た 目 が 区 別 できないので 作 業 上 不 便 である テキスト エディタの 設 定 でタブ 文 字 を 表 示 するオプションがあればそれを 有 効 にし ておくとよい 秀 丸 エディタでは[その 他 ]メニュー の[ファイルタイプ 別 の 設 定 ]で[ 表 示 タブ]を 選 び, タブ 文 字 表 示 にチェックを 入 れておく 3) エクセル 形 式 と XML 形 式 の 差 についてはマイクロ ソフトOfficeアシストセンターの 以 下 のページに 詳 しく 記 述 されている XML ワークシート 形 式 の 機 能 と 制 限 <http://office.microsoft.com/japan/assistance/2002/ articles/xlfeatureslimitationxmlspread.aspx>

757 解 説 連 載 :eコンテンツのためのデータ 加 工 第 2 回 出 力 の 例 ( 要 素 のみを 例 示 ) 図 5のエクセルファ イルを 変 換

758 情 報 管 理 Vol. 44 No. 11 February 2002 形 式 変 換 結 果 ( 抜 粋 ) 形 式 変 換 結 果 ( 抜 粋 ) 計 算 項 目 のセルには, 計 算 式 とその 結 果 が 記 述 さ れる 形 式 * / 形 式 (シンボリックリンク 形 式 ) * ともに 表 形 式 のデータを 交 換 するためのテキス ト 形 式 であるが,データ 構 造 が 複 雑 になるためテキ スト 化 には 向 いていない( および ) タブ 区 切 りデータの 加 工 セル 内 改 行 の 処 理 エクセルでは1つのセル 内 で 文 字 列 を 改 行 するこ とができる(ALT+ 改 行 キー) セル 内 で 改 行 が 行 われた 場 合,CSV 変 換 やタブ 区 切 りテキスト 変 換 で は のようにデータ 中 に 通 常 の 改 行 が 入 ってし まう タブ 区 切 り 形 式 でのセル 内 改 行 の 発 見 法 はカン マが 入 っている 場 合 と 同 様 にダブルコーテーショ ンが 付 加 されることに 着 目 する つまり, "~[ 改 行 ]~" ([ 改 行 ]は 改 行,~はタブでも 改 行 でもない 文 字 を 表 す) というパターンを 発 見 すればよい このパターンをテキスト エディタ,たとえば 秀 丸 エディタの 正 規 表 現 を 使 った 置 換 で 処 理 する 場 4) UTF-8 ユニコードのエンコーディング 方 式 の1つ 8ビット 単 位 で 文 字 をコード 化 する 他 のエンコード 方 式 と してはUTF-7やUTF-16があるが 現 状 ではUTF-8が 最 も 使 われている ユニコードで 記 述 されたテキストはユニコード 対 応 のテキスト エディタで 読 むことができる が, 対 応 していない 場 合 は 文 字 化 けを 起 こす また 通 常 の Shift-Jis でデータを 作 成 する 場 合 は コード 変 換 を 行 わなくてはならない( 詳 細 は 後 日 解 説 する 予 定 )

759 解 説 連 載 :eコンテンツのためのデータ 加 工 第 2 回 (1) 行 頭 の ", 行 末 の ",タブに 連 続 する " を 空 文 字 5 と 置 換 これを 秀 丸 エディタの 正 規 表 現 で 記 述 すると 以 下 のようになる 被 置 換 文 字 : ^" 行 頭 の " "$ 行 末 の " 置 換 文 字 : 空 文 字 セル 内 改 行 の 例 は 改 行 文 字, [タブ] はタブ 文 字 を 表 す 被 置 換 文 字 : " t タブの 直 前 の " t" タブの 直 後 の " 置 換 文 字 : t (^は 行 の 最 初 を$は 行 の 最 後 を 表 す) (2) 2つ 連 続 したダブルコーテーションを1つにまと める 合 は 以 下 のようになる 置 換 に 際 して 改 行 は 何 か 特 殊 な 他 の 部 分 で 出 現 しないものに 置 き 換 える ここ では 仮 に <BR> という 文 字 列 とする 被 置 換 文 字 :" f[^ t]* f n f[^ t]* f" 置 換 文 字 : 1<BR> 3 ( t はタブ 文 字, [^ t] はその 否 定 でタブ 文 字 でない 文 字, [^ t]* はタブ 文 字 でない 文 字 の0 個 以 上 の 繰 り 返 し n は 改 行 にマッチ する 置 換 文 字 の 1 は 被 置 換 文 字 の f で 区 切 られた2 番 目, 3 は4 番 目 の 文 字 列 を 表 す ここでタブ 文 字 でない 文 字 を0 個 以 上 の 繰 り 返 しとしたのは,データの 最 初 にセル 内 改 行 が 登 場 したり, 最 後 にセル 内 改 行 がつけられ ているケースを 想 定 している) タブ 区 切 りデータの 加 工 不 要 なダブルコー テーションを 削 除 エクセルからタブ 区 切 りデータへ 変 換 すると,カ ンマやダブルコーテーションの 入 ったセルはダブ ルコーテーション 囲 みで 出 力 される このダブル コーテーション 囲 みは 不 要 であるので 通 常 は 削 除 する ここではテキスト エディタを 利 用 した 方 法 を 紹 介 する 被 置 換 文 字 :"" 置 換 文 字 :" なおこの 処 理 は 前 に 説 明 したセル 内 改 行 の 処 理 が 終 わってから 行 わなくてはならない 最 初 にこの 処 理 を 行 うとセル 内 改 行 の 目 印 が 失 われてしまう タブ 区 切 りデータの 加 工 セル 結 合 の 処 理 エクセルでは2つ 以 上 のセルを1つのセルとして 結 合 することができる セル 結 合 を 行 ったデータを タブ 区 切 りデータに 変 換 した 場 合 には, 結 合 セルの 最 初 にデータが 入 り, 他 のセルは 空 のままとなる タブ 区 切 りデータに 変 換 するような 用 途 ではセ ル 結 合 は 都 合 が 悪 いことが 多 い しかしタブ 区 切 り 形 式 ではセル 結 合 は 特 定 のパターンにならないた め 発 見 は 困 難 である セル 結 合 の 個 所 を 確 実 に 発 見 する 方 法 は 同 じ データをHTML 変 換 してデータ 中 に colspan= rowspan= という 文 字 列 がないか 検 索 するとよい <td colspan=2> ならその 個 所 で 列 を2つ 結 合 して いる 可 能 性 がある rowspan なら 行 の 結 合 を 表 し ている 5) 空 文 字 何 も 文 字 がない 状 態 を 空 文 字 と 呼 ぶ ある 文 字 を 空 文 字 と 置 換 するという 表 現 は 削 除 することと 同 等 となる