1. はじめに 近 年,Webアプリケーションが 自 身 の 機 能 をWeb APIとして 提 供 する 事 例 が 増 えている.Web APIに よってWebアプリケーション 開 発 者 は 他 の 任 意 のWebアプリケーションの 機 能 を 利 用 することができ る.Web APIリポ



Similar documents
1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図

(Microsoft Word - [Kiyou]HiroshiUeda_HarumiMurakami_-_NDCSuggest_Modified_06\201c)

預 金 を 確 保 しつつ 資 金 調 達 手 段 も 確 保 する 収 益 性 を 示 す 指 標 として 営 業 利 益 率 を 採 用 し 営 業 利 益 率 の 目 安 となる 数 値 を 公 表 する 株 主 の 皆 様 への 還 元 については 持 続 的 な 成 長 による 配 当 可

中根・金田台地区 平成23年度補償説明業務

一般競争入札について

ìäçeãKíˆÅEç◊ë•Åiç≈èIî≈àÛç¸ópÅj

(Microsoft Word - \203A \225\345\217W\227v\227\314 .doc)

2 役 員 の 報 酬 等 の 支 給 状 況 平 成 27 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 役 名 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 2,142 ( 地 域 手 当 ) 17,205 11,580 3,311 4 月 1

PowerPoint プレゼンテーション

平成25年度 独立行政法人日本学生支援機構の役職員の報酬・給与等について

text

Taro-10入札公告_一般_最低価格_

Ⅰ 調 査 の 概 要 1 目 的 義 務 教 育 の 機 会 均 等 その 水 準 の 維 持 向 上 の 観 点 から 的 な 児 童 生 徒 の 学 力 や 学 習 状 況 を 把 握 分 析 し 教 育 施 策 の 成 果 課 題 を 検 証 し その 改 善 を 図 るもに 学 校 におけ

Microsoft PowerPoint - 報告書(概要).ppt

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

(Microsoft Word - \221\346\202P\202U\201@\214i\212\317.doc)

Taro-官報 入札公告【埼玉病院】

RaQuest MindManager

入札公告 次 の と お り 一 般 競 争 入 札 に 付 し ま す 平 成 2 6 年 7 月 2 4 日 経 理 責 任 者 独 立 行 政 法 人 国 立 病 院 機 構 兵 庫 青 野 原 病 院 長 栗 栖 茂 調 達 機 関 番 号 所 在 地 番 号 2 8 第 0 9

Microsoft Word - 養生学研究投稿規定(改)

続 に 基 づく 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 再 認 定 を 受 けていること ) c) 会 社 更 生 法 に 基 づき 更 生 手 続 開 始 の 申 立 てがなされている 者 又 は 民 事 再 生 法 に 基 づき 再 生 手 続 開 始 の 申 立 てがなさ

(6) Qualification for participating in the tendering procedu

<4D F736F F D20342E92868D E293608E718E918CB982CC8AC7979D82C98AD682B782E98C6F89DF915B92752E646F6378>

スライド 1

(6) Qualification for participating in the tendering procedu

Taro-入札公告官報掲載(あきた清

スライド 1

中国会社法の改正が外商投資企業に与える影響(2)

入札公告 次 の と お り 一 般 競 争 入 札 に 付 し ま す 平 成 3 0 年 1 0 月 1 0 日 経 理 責 任 者 独 立 行 政 法 人 国 立 病 院 機 構 神 戸 医 療 セ ン タ ー 院 長 森 田 瑞 穂 調 達 機 関 番 号 所 在 地 番 号 2

18 国立高等専門学校機構

1 林 地 台 帳 整 備 マニュアル( 案 )について 林 地 台 帳 整 備 マニュアル( 案 )の 構 成 構 成 記 載 内 容 第 1 章 はじめに 本 マニュアルの 目 的 記 載 内 容 について 説 明 しています 第 2 章 第 3 章 第 4 章 第 5 章 第 6 章 林 地

b) 参 加 表 明 書 の 提 出 時 において 東 北 地 方 整 備 局 ( 港 湾 空 港 関 係 を 除 く) における 平 成 年 度 土 木 関 係 建 設 コンサルタント 業 務 に 係 る 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 認 定 を 受 けて

入札公告 次 の と お り 一 般 競 争 入 札 に 付 し ま す 平 成 3 0 年 1 2 月 2 5 日 経 理 責 任 者 独 立 行 政 法 人 国 立 病 院 機 構 琉 球 病 院 長 福 治 康 秀 調 達 機 関 番 号 所 在 地 番 号 4 7 第 号 ( N

06.9- はじめての 本 や 論 文 の 探 し 東 京 大 学 本 部 情 報 基 盤 課 [ 学 術 情 報 リテラシー 担 当 ] TREE(UTokyo REsource Explorer)とは TREE [UTokyo REsource Explorer] は シンプルに ひとつ

平成27年度大学改革推進等補助金(大学改革推進事業)交付申請書等作成・提出要領

Taro-入札公告 (病院情報システム

スライド 1

している 5. これに 対 して 親 会 社 の 持 分 変 動 による 差 額 を 資 本 剰 余 金 として 処 理 した 結 果 資 本 剰 余 金 残 高 が 負 の 値 となるような 場 合 の 取 扱 いの 明 確 化 を 求 めるコメントが 複 数 寄 せられた 6. コメントでは 親

目 次 1. 大 学 情 報 データベースシステムの 使 用 方 法 について EXCEL 一 括 登 録 EXCEL ダウンロード 検 索 条 件 の 指 定 プレビュー EXCEL ダウンロード(データ 抽 出 あ

Microsoft Word - h doc

Microsoft PowerPoint - final.ppt

入札公告 次 の と お り 一 般 競 争 入 札 に 付 し ま す 平 成 3 0 年 1 1 月 2 6 日 経 理 責 任 者 独 立 行 政 法 人 国 立 病 院 機 構 四 国 が ん セ ン タ ー 院 長 谷 水 正 人 調 達 機 関 番 号 所 在 地 番 号 3

Microsoft Word 役員選挙規程.doc

入札公告 次 の と お り 一 般 競 争 入 札 に 付 し ま す 平 成 2 8 年 1 2 月 2 2 日 経 理 責 任 者 独 立 行 政 法 人 国 立 病 院 機 構 栃 木 医 療 セ ン タ ー 院 長 長 谷 川 親 太 郎 調 達 機 関 番 号 所 在 地 番

Taro-入札公告(寝具賃貸借契約)

Microsoft Word 公開買付け結果_final02.doc

(6) Qualification for participating in the tendering procedu

財団法人○○会における最初の評議員の選任方法(案)

(2) 広 島 国 際 学 院 大 学 ( 以 下 大 学 という ) (3) 広 島 国 際 学 院 大 学 自 動 車 短 期 大 学 部 ( 以 下 短 大 という ) (4) 広 島 国 際 学 院 高 等 学 校 ( 以 下 高 校 という ) ( 学 納 金 の 種 類 ) 第 3 条

入札公告 次 の と お り 一 般 競 争 入 札 に 付 し ま す 平 成 2 4 年 3 月 2 1 日 経 理 責 任 者 独 立 行 政 法 人 国 立 病 院 機 構 東 京 医 療 セ ン タ ー 院 長 松 本 純 夫 調 達 機 関 番 号 所 在 地 番 号 1 3

(6) Qualification for participating in the tendering procedu

目 次 機 能 概 要 配 信 管 理 1. メールの 配 信 履 歴 と 予 約 を 確 認 する

bid_ pdf


2 1.ヒアリング 対 象 (1) 対 象 範 囲 分 類 年 金 医 療 保 険 雇 用 保 険 税 備 考 厚 生 年 金 の 資 格 喪 失 国 民 年 金 の 加 入 老 齢 給 付 裁 定 請 求 など 健 康 保 険 の 資 格 喪 失 国 民 健 康 保 険 の 加 入 健 康 保 険

Taro-官報公告(院内清掃30

(3) その 他 市 長 が 必 要 と 認 める 書 類 ( 補 助 金 の 交 付 決 定 ) 第 6 条 市 長 は 前 条 の 申 請 書 を 受 理 したときは 速 やかにその 内 容 を 審 査 し 補 助 金 を 交 付 すべきものと 認 めたときは 規 則 第 7 条 に 規 定 す

主要生活道路について

財政再計算結果_色変更.indd

<4D F736F F D20819C486F70658F6F93588ED297708AC7979D89E696CA837D836A B E A2E646F63>

2 出 願 資 格 審 査 前 記 1の 出 願 資 格 (5) 又 は(6) により 出 願 を 希 望 する 者 には, 出 願 に 先 立 ち 出 願 資 格 審 査 を 行 いますので, 次 の 書 類 を 以 下 の 期 間 に 岡 山 大 学 大 学 院 自 然 科 学 研 究 科 等

<4D F736F F D C93FA967B91E5906B8DD082D682CC91CE899E2E646F6378>

(別紙3)保険会社向けの総合的な監督指針の一部を改正する(案)

Taro-入札公告(病院情報システム)

対 象 者 株 式 (1,287,000 株 ) 及 び 当 社 が 所 有 する 対 象 者 株 式 (1,412,000 株 )を 控 除 した 株 式 数 (3,851,673 株 )になります ( 注 3) 単 元 未 満 株 式 も 本 公 開 買 付 けの 対 象 としております なお

研究者情報データベース

2 立 候 補 するには 次 に 掲 げる 条 件 を 満 たしていることとする (1) 理 事 又 は 評 議 員 2 名 以 上 の 推 薦 があること (2) 連 続 5 年 以 上 本 学 会 の 正 会 員 で 会 費 を 完 納 していること (3) 選 考 が 行 われる 前 年 の1

2011論稿_吉川宏之.indd

った 場 合 など 監 事 の 任 務 懈 怠 の 場 合 は その 程 度 に 応 じて 業 績 勘 案 率 を 減 算 する (8) 役 員 の 法 人 に 対 する 特 段 の 貢 献 が 認 められる 場 合 は その 程 度 に 応 じて 業 績 勘 案 率 を 加 算 することができる

<6D313588EF8FE991E58A778D9191E5834B C8EAE DC58F4992F18F6F816A F990B32E786C73>

Microsoft Word - 目次.doc

2. 番 号 種 別 の 利 用 方 法 わが 国 の 番 号 方 式 に 照 らして INSネットでの 番 号 種 別 の 具 体 的 な 利 用 方 法 を 記 述 すると 以 下 のようにな ります (1) 番 号 種 別 (TON)= 不 定 電 話 サービスと 同 様 のダイヤル 手 順

接続試験実施要領【障害者総合支援法(平成27年4月報酬改定)対応】

(6) Qualification for participating in the tendering procedu

新 生産管理システム ご提案書 2002年10月15日 ムラテック情報システム株式会社

1. 前 払 式 支 払 手 段 サーバ 型 の 前 払 式 支 払 手 段 に 関 する 利 用 者 保 護 等 発 行 者 があらかじめ 利 用 者 から 資 金 を 受 け 取 り 財 サービスを 受 ける 際 の 支 払 手 段 として 前 払 式 支 払 手 段 が 発 行 される 場 合

入札公告 機動装備センター

<4D F736F F D204D46834E A6D92E8905C8D905F93B193FC819593FA8E9F95D C5292E646F63>

<4D F736F F D2088CF88F589EF814395AA89C889EF E E834F838B815B83768B4B96F E322E323089FC92E8816A2E646F63>

<6D33335F976C8EAE CF6955C A2E786C73>


<4D F736F F D2095CA8E A90DA91B18C9F93A289F1939A8F D8288B3816A5F E646F63>

( 運 用 制 限 ) 第 5 条 労 働 基 準 局 は 本 システムの 維 持 補 修 の 必 要 があるとき 天 災 地 変 その 他 の 事 由 によりシステムに 障 害 又 は 遅 延 の 生 じたとき その 他 理 由 の 如 何 を 問 わず その 裁 量 により システム 利 用 者

自己評価書様式

●電力自由化推進法案

Taro-入札公告 一般 最低価格 

SPARQL Finder設置方法

よりメンバーに 配 布 した 第 2 期 は 第 1 期 に 開 発 した 大 気 時 間 値 集 計 解 析 ツールをベースに 機 能 改 良 を 行 った 国 立 環 境 研 究 所 では メンバーから 寄 せられる 要 望 使 い 勝 手 に 関 する 意 見 感 想 不 具 合 発 生 など

4 承 認 コミュニティ 組 織 は 市 長 若 しくはその 委 任 を 受 けた 者 又 は 監 査 委 員 の 監 査 に 応 じなければ ならない ( 状 況 報 告 ) 第 7 条 承 認 コミュニティ 組 織 は 市 長 が 必 要 と 認 めるときは 交 付 金 事 業 の 遂 行 の

5 民 間 事 業 者 における 取 扱 いについて( 概 要 資 料 P.17~19) 6 法 人 番 号 について( 概 要 資 料 P.4) (3) 社 会 保 障 税 番 号 制 度 のスケジュールについて( 概 要 資 料 P.20) 1 平 成 27 年 10 月 から( 施 行 日 は

<4D F736F F D2095BD90AC E D738FEE816A939A905C91E D862E646F63>

Microsoft Word 印刷ver 本編最終no1(黒字化) .doc

小 売 電 気 の 登 録 数 の 推 移 昨 年 8 月 の 前 登 録 申 請 の 受 付 開 始 以 降 小 売 電 気 の 登 録 申 請 は 着 実 に 増 加 しており これまでに310 件 を 登 録 (6 月 30 日 時 点 ) 本 年 4 月 の 全 面 自 由 化 以 降 申

容 積 率 制 限 の 概 要 1 容 積 率 制 限 の 目 的 地 域 で 行 われる 各 種 の 社 会 経 済 活 動 の 総 量 を 誘 導 することにより 建 築 物 と 道 路 等 の 公 共 施 設 とのバランスを 確 保 することを 目 的 として 行 われており 市 街 地 環

6 構 造 等 コンクリートブロック 造 平 屋 建 て4 戸 長 屋 16 棟 64 戸 建 築 年 1 戸 当 床 面 積 棟 数 住 戸 改 善 後 床 面 積 昭 和 42 年 36.00m m2 昭 和 43 年 36.50m m2 昭 和 44 年 36.

する ( 評 定 の 時 期 ) 第 条 成 績 評 定 の 時 期 は 第 3 次 評 定 者 にあっては 完 成 検 査 及 び 部 分 引 渡 しに 伴 う 検 査 の 時 とし 第 次 評 定 者 及 び 第 次 評 定 者 にあっては 工 事 の 完 成 の 時 とする ( 成 績 評 定

12 大 都 市 の 人 口 と 従 業 者 数 12 大 都 市 は 全 国 の 人 口 の 約 2 割 従 業 者 数 の 約 3 割 を 占 める 12 大 都 市 の 事 業 所 数 従 業 者 数 及 び 人 口 は 表 1 のとおりです これらの 12 大 都 市 を 合 わせると 全

Transcription:

Web API 利 用 のためのプログラムライブラリ 自 動 生 成 高 井 正 成 1 阪 口 哲 男 2 筑 波 大 学 大 学 院 図 書 館 情 報 メディア 研 究 科 1 筑 波 大 学 図 書 館 情 報 メディア 系 2 305-8550 茨 城 県 つくば 市 春 日 1-2 概 要 近 年,Webアプリケーションの 提 供 者 はその 機 能 を 他 のアプリケーションから 利 用 してもらうため, Web APIを 提 供 する 事 例 が 増 加 している.Web APIではHTTPなどの 通 信 プロトコルによるリクエス ト レスポンスにより 通 信 を 行 うという 大 きな 枠 組 みは 共 通 しているものの, 細 かな 仕 様 は 各 Web API 提 供 者 によって 定 められる.そのため 各 Web APIに 互 換 性 がなく,Webアプリケーション 開 発 者 はWeb APIを 利 用 する 場 合, 仕 様 を 確 認 しそれぞれのWeb APIの 仕 様 に 沿 ったプログラムライブラリを 作 成 す る 必 要 がある.そこで 本 研 究 では 開 発 者 がプログラムライブラリを 自 分 で 作 成 する 手 間 を 省 くため, Web APIの 仕 様 文 書 から 情 報 を 抽 出 し,プログラムライブラリを 自 動 生 成 する 手 法 を 提 案 する. キーワード Web API,Webアプリケーション, 情 報 抽 出 Automatic Generation of Program Libraries for Accessing Web APIs Masanari TAKAI 1 Tetsuo SAKAGUCHI 2 Graduate School of Library, Information and Media Studies, University of Tsukuba 1 Faculty of Library, Information and Media Science, University of Tsukuba 2 1-2, Kasuga, Tsukuba, Ibaraki, 305-8550, JAPAN Abstract The case is increasing that Web Application providers publish Web APIs which are used by other applications with Web protocol. They are designed based on common simple protocol but detail specification of each of them is decided by its provider. So Web APIs don t have compatibility with each other. Web application developers have to read documents of Web APIs and make program libraries for them if they use Web APIs. This paper proposes a method to make program libraries automatically by means of information extraction from Web API documents in order to developers avoids the trouble of making program libraries. Keywords Web API,Web Application, Information Extraction 1

1. はじめに 近 年,Webアプリケーションが 自 身 の 機 能 をWeb APIとして 提 供 する 事 例 が 増 えている.Web APIに よってWebアプリケーション 開 発 者 は 他 の 任 意 のWebアプリケーションの 機 能 を 利 用 することができ る.Web APIリポジトリであるProgrammable Web [1] には 現 在 6000 件 以 上 のWeb APIが 登 録 されており, Web APIの 登 録 数 は 年 々 増 加 している( 図 1). Webアプリケーション 開 発 者 はWeb APIを 利 用 する 場 合, 各 Web APIの 仕 様 を 提 供 されるオンライン ドキュメントなどで 確 認 する.プログラミングの 際 はWeb APIを 利 用 する 処 理 はプログラムライブラリ として 他 の 処 理 と 分 けて 記 述 する 場 合 が 多 い.Web APIではHTTPなどの 通 信 プロトコルによるリクエ スト レスポンスにより 通 信 を 行 うという 大 きな 枠 組 みは 共 通 しているものの, 細 かな 仕 様 は 各 Web API 提 供 者 によって 定 められる.そのため 各 Web APIに 互 換 性 がなく,Webアプリケーション 開 発 者 は Web APIを 利 用 する 場 合,それぞれのWeb APIの 仕 様 に 沿 ったプログラムライブラリを 作 成 する 必 要 が ある. 新 たなWeb APIが 公 開 された 場 合 複 数 の 開 発 者 がそのWeb APIを 利 用 しようとして, 複 数 の 同 様 の 機 能 を 持 ったプログラムライブラリが 作 成 されてしまう. 実 際 にマイクロブログサービスtwitterの Web APIではプログラムライブラリが 複 数 作 成, 公 開 されており, 公 式 サイトで 紹 介 されているものだ けでも43 件 のプログラムライブラリが 存 在 し,Rubyという 一 つのプログラミング 言 語 に 限 った 場 合 で も5 件 のライブラリが 存 在 する [2].このように 複 数 の 開 発 者 が 別 々にWeb APIのプログラムライブラリを 作 成 することは 非 効 率 である.Web APIの 仕 様 が 変 更 された 場 合 は,プログラムライブラリを 修 正 しな ければならないが, 複 数 あるライブラリ 全 ての 修 正 が 必 要 となり, 修 正 漏 れがあったプログラムライブ ラリは 動 作 不 能 になったり, 機 能 が 不 足 してしまったりすることもある. 以 上 のような 理 由 からWeb APIのプログラムライブラリを 開 発 者 が 作 成 するのは 開 発 において 非 効 率 であるといえる.そこで 本 研 究 では 開 発 者 がプログラムライブラリを 自 分 で 作 成 する 手 間 を 省 くため,Web APIのオンラインドキュ メントから 情 報 を 抽 出 し,プログラムライブラリを 自 動 生 成 する 手 法 を 提 案 する. 図 1. Programmable Webにおける 年 ごとのWeb API 登 録 数 の 推 移 ([1]から 引 用 ) 2

2. Web APIのプログラムライブラリ 生 成 手 法 2.1. 概 要 本 章 ではWeb APIのプログラムライブラリの 生 成 手 法 について 述 べる. 本 手 法 では 各 Web APIのオン ラインドキュメントを 利 用 し,そこからプログラムライブラリの 生 成 に 必 要 な 情 報 を 抽 出 する( 図 2). 抽 出 した 情 報 からプログラムライブラリを 生 成 する.ここでいうオンラインドキュメントとは,Web APIを 利 用 する 開 発 者 のためにWeb APIの 仕 様 を 記 述 したもので,リクエストのベースURLや 利 用 でき るパラメータ,レスポンスの 形 式 などが 記 述 されている. 図 2. Web APIプログラムライブラリ 生 成 手 法 概 要 図 2.2. Web APIオンラインドキュメントからの 情 報 抽 出 プログラムライブラリの 生 成 に 必 要 な 情 報 は 各 Web APIのオンラインドキュメントから 抽 出 する. 抽 出 にはWeb APIのオンラインドキュメントに 見 られる 規 則 性 を 利 用 する.オンラインドキュメントでは Web APIの 情 報 が 提 供 元 によって 様 々な 記 述 形 式 で 記 されているがその 中 には 幾 つかの 共 通 点 がある. 例 としてtwitter APIのオンラインドキュメントとYahoo! Answers APIのオンラインドキュメントをそ れぞれ 図 3, 図 4に 示 す. 図 3. Twitter APIのオンラインドキュメント( 一 部 ) 3

図 4. Yahoo! Answers APIのオンラインドキュメント( 一 部 ) Web APIの 中 で, 特 にREST 型 と 呼 ばれるものは,HTTPのリクエストを 送 りそのリクエストに 応 じた レスポンスが 返 される. 図 2, 図 3ではドキュメント 中 にResource URLもしくはRequest URLとしてベ ースとなるURL(ベースURL)が 記 述 されている.その 下 にベースURLと 一 緒 に 送 るリクエストパラ メータについて,そのパラメータ 名 とパラメータの 型 や 説 明 が 記 述 されている.このように 多 くのオン ラインドキュメントではベースURLの 記 述 からパラメータに 関 する 説 明 など 共 通 の 項 目 が 説 明 されて おり, 各 情 報 は 箇 条 書 きや 表 によって 整 理 されていたり, 大 文 字 によるタイトルの 後 に 記 述 されていた りと 記 述 の 方 法 にある 程 度 の 規 則 性 が 見 られる. 本 手 法 ではオンラインドキュメントのHTMLのタグ 構 造 とキーワードに 見 られる 規 則 性 を 利 用 し, 情 報 の 抽 出 を 行 う. 2.3. 抽 出 した 情 報 の 記 述 とプログラムライブラリへの 変 換 本 研 究 では 抽 出 した 情 報 の 記 述 にWebアプリケーション 仕 様 記 述 言 語 であるWADL(Web Application Description Language) [3] を 用 いる.WADLはREST 型 のWeb APIの 仕 様 を 記 述 する 場 合 に 用 いられる 記 述 形 式 で,XMLで 記 述 される.WADLを 利 用 することで 抽 出 した 情 報 を 機 械 的 に 解 釈 しやすい 形 で 記 述 できる. 現 在 WADLを 利 用 することで 既 存 の 開 発 環 境 においてプログラムライブラリを 生 成 することが 可 能 となっている. 例 えば 統 合 開 発 環 境 のひとつであるNetBeansではWADLを 読 み 込 み,プログラム ライブラリを 生 成 することができる. WADLの 生 成 にあたり, 本 研 究 では 生 成 に 必 要 とする 情 報 を 以 下 の7 項 目 とした. 本 手 法 ではオンラ インドキュメントからこれらの 情 報 を 抽 出 し,WADLを 作 成 する. 4

ベースURL HTTPリクエストを 送 る 際 に 指 定 するURL パラメータ 名 リクエストで 指 定 できるパラメータの 名 前 パラメータの 型 文 字 列 や 数 字 など 各 パラメータで 指 定 できる 型 パラメータのデフォルト 値 リクエストで 指 定 しなかった 場 合 の 省 略 時 値 必 須 パラメータか 否 か 必 ず 指 定 しなければならないパラメータであるか 否 か リクエストの 形 式 リクエストの 送 信 方 法 に 関 する 規 定 (GETメソッドかPOSTメソッドか,など) レスポンスの 形 式 レスポンス 自 体 の 形 式 に 関 する 規 定 (XMLかJSONか,など) 3. 抽 出 手 法 の 評 価 本 研 究 では 抽 出 手 法 を, 実 際 のWeb APIオンラインドキュメントに 対 して 適 用 し 評 価 する. 抽 出 精 度 は, 人 出 による 抽 出 との 比 較 によって 求 める. 対 象 はProgrammable Webに 登 録 されている Web APIのオンラインドキュメント(HTMLソースコード)とする. 対 象 から,まず 人 手 で2.3に 示 し た7 項 目 の 情 報 を 抽 出 する. 次 に 抽 出 手 法 を 実 装 したプログラムを 対 象 に 適 用 し, 人 手 で 得 られた 結 果 とプログラムの 結 果 を 比 較 する. 本 手 法 のプログラムは,オンラインドキュメントの 規 則 性 に 対 応 する 複 数 の 抽 出 ルールを 実 装 したも のとする. 抽 出 ルールとは 例 えば tableタグがあり,かつ パラメータ という 単 語 がtableタグより 上 の 行 にある 場 合 は,tableタグの 第 1 要 素 をパラメータ 名 とみなす などである.この 例 はパラメータ 名 に 関 する 抽 出 ルールのひとつである. 単 純 に 抽 出 精 度 を 求 める 他 に,どのルールがより 情 報 抽 出 に 役 立 つか,いくつのルールがあれば 情 報 抽 出 が 行 えるか 実 験 を 行 い,それぞれの 抽 出 ルールに 対 しての 評 価 も 行 う. 実 験 対 象 と, 人 手 で 抽 出 した 情 報 と 比 較 する 際 に,プログラム 内 で 適 用 する 抽 出 ルールを 実 験 ごとに 変 更 し,どのルールが 抽 出 精 度 に 影 響 を 与 えるか 確 認 する. 4. 予 備 実 験 本 研 究 の 手 法 の 有 効 性 を 確 かめるため, 予 備 実 験 を 行 った. 本 章 ではその 予 備 実 験 の 方 法 と 結 果,お よびそれによって 得 られた 知 見 について 述 べる. 4.1. 実 験 方 法 と 結 果 本 手 法 を 実 装 したプログラムを 実 際 のWeb APIオンラインドキュメントに 対 して 適 用 し, 情 報 が 抽 出 できるかどうか 試 行 した. 対 象 としたオンラインドキュメントを 以 下 に 示 す. (1) はてなキーワードAPI( 旧 文 書 ) http://d.hatena.ne.jp/keyword/%a4%cf%a4%c6%a4%ca%a5%ad%a1%bc%a5%ef%a1%bc% A5%C9API( 参 照 2012-08-20) (2) はてなキーワードAPI( 新 文 書 ) http://developer.hatena.ne.jp/ja/documents/keyword/apis/rest( 参 照 2012-08-20) (3) CiNii API( 論 文 検 索 ) http://ci.nii.ac.jp/info/ja/api/a_opensearch.html( 参 照 2012-08-20) (4) 郵 便 番 号 検 索 API http://groovetechnology.jp/webservice/zipsearch/index.html( 参 照 2012-08-20) 5

(5) 顔 検 出 API http://kaolabo.com/webapi/spec( 参 照 2012-08-20) はてなキーワードAPIに 関 しては, 旧 文 書 と 新 文 書 の2 件 が 存 在 したので,その 両 方 を 利 用 した. 予 備 実 験 では 抽 出 する 情 報 は,2 章 で 示 した7 項 目 のうち,ベースURLとパラメータ 名 のみとした. 実 験 では 対 象 から 人 手 で 情 報 を 抽 出 し,それを 正 解 とする.その 後 本 手 法 を 実 装 したプログラムを 以 上 の5 件 のオ ンラインドキュメントに 対 して 適 用 し, 抽 出 した 情 報 を 正 解 と 比 較 した. 今 回 適 用 したルールを 以 下 に 示 す. (ルール1) http:// で 始 まるURLの 記 法 に 則 っており,そのURLの 記 法 に 則 った 文 字 列 以 前 の 行 に ベ ースURL や Request URL など,ベースURLに 関 係 するキーワードが 多 くある 場 合,その 文 字 列 をベースURLとみなす. (ルール2) http:// で 始 まり, 途 中? で 区 切 られる,Web APIのベースURLとしてよく 見 られる URLの 記 法 に 則 っており,そのURLの 記 法 に 則 った 文 字 列 以 前 の 行 に ベースURL や Request URL など,ベースURLに 関 係 するキーワードが 多 くある 場 合,その 文 字 列 をベース URLとみな す.このルールによって 発 見 されたベースURLはルール1より 優 先 されることとする. (ルール3)HTMLのtableタグで 囲 まれた 表 の 中 の 要 素 の 一 つであり,かつそのtableタグ 以 前 の 行 もし くは 表 内 で パラメータ や Parameter などパラメータに 関 係 するキーワードが 多 くある,か つ 要 素 自 体 は 英 数 字 とURLとして 利 用 可 能 な 記 号 で 構 成 されている 文 字 列 がある 場 合,その 文 字 列 をパラメータ 名 とみなす. (ルール4)HTMLのdtタグで 囲 まれており,かつそれ 自 体 は 英 数 字 とURLとして 利 用 可 能 な 記 号 で 構 成 されている 文 字 列 である 場 合,その 文 字 列 をパラメータ 名 とみなす. 実 験 の 結 果 として,3.1で 示 したすべてのオンラインドキュメントから 正 解 と 等 しい 情 報 を 抽 出 するこ とができた. 実 験 におけるベースURLの 抽 出 に 関 する 結 果 を 表 1に 示 す.ベースURLは, 複 数 の 抽 出 候 補 に 対 して 優 先 順 位 をつけて 抽 出 している. 表 1では 抽 出 候 補 の 上 位 3 件 を 優 先 度 順 に 上 位 から 示 してい る. 4.2. 予 備 実 験 により 得 られた 知 見 今 回 の 予 備 実 験 によりベースURLとパラメータ 名 が 本 手 法 によって 取 得 可 能 であることがわかった. 今 回 は 情 報 を2 項 目 しか 抽 出 していないが,パラメータ 名 に 関 しては 表 形 式 で 記 述 されているもの (HTMLのtableタグを 用 いているもの)はその 表 の 中 の 要 素 を 抽 出 することに 成 功 しているので,パ ラメータに 関 する 他 の 情 報 もパラメータ 名 と 同 じように 抽 出 できる 可 能 性 が 高 い. 問 題 としては, 今 回 対 象 としたオンラインドキュメントは 日 本 語 であったため,パラメータ 名 やベースURLとの 区 別 がつき やすかったが, 英 語 のオンラインドキュメントは 区 別 がつきにくい 可 能 性 があることが 挙 げられる.ベ ースURLに 関 しては, 正 解 のURL 以 外 のURLも 誤 って 優 先 度 が 高 いとみなされて 抽 出 されたものもあ ったため,ベースURL 候 補 の 優 先 順 位 の 付 け 方 を 検 討 する 必 要 がある.また 今 回 は 対 象 としたオンライ ンドキュメントの 件 数 が 少 なかったが,より 対 象 件 数 を 増 やした 場 合 には 表 記 のゆれなど 今 回 出 なかっ た 問 題 が 発 生 する 可 能 性 がある. 6

表 1. 予 備 実 験 結 果 (ベースURLの 抽 出 ) 抽 出 対 象 人 手 による 抽 出 ( 正 解 ) 提 案 手 法 による 抽 出 (1) http://search.hatena.ne.jp/keyword http://search.hatena.ne.jp/keyword http://red3.hatena.ne.jp/adframe http://red.st-hatena.com/adframe (2) http://search.hatena.ne.jp/keyword http://search.hatena.ne.jp/keyword http://d.hatena.ne.jp/keyword http://hatenadeveloper.g.hatena.ne.jp/keyword/ja/keywor d/apis/rest (3) http://ci.nii.ac.jp/opensearch/search http://ci.nii.ac.jp/opensearch/search https://register-ci.nii.ac.jp/auth/action/login https://register-ci.nii.ac.jp/userregist/usertypesel.do (4) http://api.postalcode.jp/v1/zipsearch http://api.postalcode.jp/v1/zipsearch http://groovetechnology.jp/sitemap.html http://uchiai.com/ (5) https://kaolabo.com/api/detect https://kaolabo.com/xmlrpc.php https://kaolabo.com/api/detect http://kaolabo.com/feed 5. 関 連 研 究 Web API を 用 いたアプリケーション 開 発 効 率 向 上 に 関 しては 井 上 らの 研 究 [4]がある.この 研 究 では REST 型 と 呼 ばれる Web API においてのサーバ 内 でのデータ 管 理 について,アプリケーションに 求 め られる 共 通 機 能 をそなえたデータベース システムを 開 発 している.この 研 究 は Web アプリケーショ ンの 提 供 者 側 のサーバ 内 の 処 理 機 能 の 効 率 化 であり, 開 発 者 側 のプログラムライブラリについては 言 及 していない.この 他 に 開 発 者 側 の 開 発 効 率 化 として Riabov らの 研 究 [5]や Lu ら [6] の 研 究 がある. 彼 らの 研 究 では 複 数 の Web API を 利 用 したマッシュアップの 効 率 化 について 述 べられており,Web API の 仕 様 は 既 にプログラムとして 実 装 されている 前 提 での 研 究 となっている. 以 上 の 研 究 とは 異 なり, 本 研 究 では Web API の 機 能 を 利 用 するためのプログラムライブラリを 生 成 する. HTML からの 情 報 抽 出 という 観 点 では 片 山 らの 研 究 [7]や 池 田 ら [8] の 研 究 がある.これらの 研 究 では HTML のタグ 構 造 や 類 似 度 を 利 用 し HTML の 解 析 を 行 なっているが, 対 象 となる HTML は Web API のオンラインドキュメントではなく, 広 範 囲 の HTML を 対 象 としている. 本 研 究 の 手 法 は Web API の オンラインドキュメントのみを 対 象 とし,それに 見 られる 規 則 性 を 利 用 して, 特 定 の 情 報 の 抽 出 を 行 な うものである. 6. おわりに 本 研 究 では,Web APIのオンラインドキュメントから 仕 様 の 情 報 を 抽 出 し,Web APIのプログラムラ イブラリを 自 動 で 生 成 する 手 法 を 提 案 した.これによりWebアプリケーション 開 発 者 はプログラムライ ブラリの 作 成 に 関 する 開 発 上 の 手 間 がなくなり, 開 発 効 率 が 向 上 する. 今 後 は 英 語 のWeb APIオンラインドキュメントから 情 報 を 抽 出 できるようにし, 実 際 にどの 程 度 の 情 7

報 が 抽 出 可 能 であるのか 評 価 する. 参 考 文 献 [1] ProgrammableWeb - Mashups, APIs, and the Web as Platform. Programmable Web.com. http://www.programmableweb.com/, ( 参 照 2012-06-27). [2] Twitter Libraries Twitter Developers. Twitter. https://dev.twitter.com/docs/twitter-libraries, ( 参 照 2012-08-08). [3] Sun Microsystems. Web Application Description Language. World Wide Web Consortium (W3C). http://www.w3.org/submission/wadl/, ( 参 照 2012-07-23). [4] 井 上 武, 朝 倉 浩 志, 植 松 幸 生, 佐 藤 浩 史, 高 橋 紀 之. 迅 速 なアプリケーション 開 発 のためのWeb API データべースシステム. 電 子 情 報 通 信 学 会 技 術 研 究 報 告. IN, 情 報 ネットワーク, 2010-01-28, 109(411), p. 97-102. [5] Anton V. Riabov ほか. Wishful Search: Interactive Composition of Data Mashups. WWW. 2008, p. 775-784. [6] Bin Lu ほか. smash: Semantic-based Mashup Navigationfor Data API Network. WWW. 2009, p.1133-1134. [7] 片 山 太 一 ほか. スプログ 検 出 における HTML 構 造 の 類 似 性 の 有 効 性 の 評 価. 情 報 処 理 学 会 研 究 報 告. データベース システム 研 究 会 報 告. 2009-11-13, 2009-DBS-149(19), p. 1-8. [8] 池 田 彰 吾 ほか. 繰 り 返 し 構 造 を 考 慮 した Web ページの 見 出 しの 階 層 構 造 の 解 析. 情 報 処 理 学 会 研 究 報 告. 情 報 学 基 礎 研 究 会 報 告. 2008-03-28, 2008(34), p. 31-38. 8