ファイルシステム - PDF 無料ダウンロード

1 ソフトウェアアークテクチャ第 2 回ファイルシステム環境情報学部萩野達也

オペレーティングシステムの構成要素 2 アプリケーションオペレーティングシステムシステムコール処理ファイルシステムプロセス管理ネットワーク管理メモリ管理ブートストラップスケジューラーデバイス管理ハードウェア

3 ファイルとは情報を外部記憶媒体に記録する単位データセットとも呼ばれたことがあるファイルの特徴ファイル情報は不揮発ファイル情報は presistent( 永続的 ) ファイルシステム外部記憶媒体上のファイルを管理 Windows NTFS MacOS HFS Unix UFS 外部記憶媒体 (SSD, HDD) ファイルファイルファイル関連の取り決めファイル名ファイル構造ファイルの種類ファイルのアクセス方法

4 ファイル名に関する取り決め大文字および小文字の区別がない場合もあるファイル名の文字コードはどうする? ファイル名の文字数には制限があるものもある MS-DOS では 8+3 UNIX では 255 ファイル拡張子 (file extension) によりファイルの種類を表す場合もある Windows では起動されるプログラムが異なる Mac では以前は内部的に保持していた UNIX はアプリケーション任せコンパイラは拡張子によって言語を判断

5 ファイルの構造バイト列ファイルはバイトの並んだものであると考え, 何の構造もないユーザは任意のフィールドを扱うことができるテキストファイルの場合は改行文字で区切るレコード列ファイルは固定長のレコードの集まりとして取り扱われるパンチカード時代には 1 レコード 80 文字としていたレコード単位で読み書きが可能である. 1 行目バイトバイトバイト改行レコード 1 バイトバイトバイトバイトバイトバイト 2 行目バイトバイトバイトバイトバイト改行レコード 2 バイトバイトバイトバイトバイトバイト 3 行目バイトバイトバイトバイト改行レコード 3 バイトバイトバイトバイトバイトバイト 4 行目バイトバイト改行レコード 4 バイトバイトバイトバイトバイトバイト

6 ファイルの種類通常ファイル (regular file) テキストファイルまたはバイナリの 2 種類があるディレクトリ (directory) ファイルを管理するためのファイルフォルダー (folder) とも呼ばれる文字型特殊ファイル (character special file) 入出力関連のデバイスを表す. 端末, プリンタ, ネットワークなどのシリアル型のデバイスブロック型特殊ファイル (block special file) ディスクなどのブロック単位で利用するデバイスファイルシステムを作ることができる

ファイルのアクセス方法逐次アクセス sequential access プロセスはファイルのバイトやレコードを順番に読むことしかできない. スキップしたり, 順序を外れたアクセスはできない. 巻き戻しだけできる場合もある. 直接アクセス random access 順番に関係なく任意の位置のバイトやレコードをアクセスできる. UNIX では seek システムコールで読み書きする位置を指定できる. 7 前から順番に読み書きする順番に関係なく読み書き

8 階層型ファイルシステムとはディレクトリの中にディレクトリを入れることを許すことによって実現ディレクトリの中身 2 種類の方法がある. ファイル名と属性がエントリに入っているファイル名は入っているが, 属性は別に管理され, そこへのポインタがエントリに入っているファイルの指定方法パス名により指定するディレクトリ名とファイル名を / やなどの区切り記号つないだもの UNIX / Windows 旧 Mac :

9 絶対パス名と相対パス名絶対パス名 (absolute path name) ルートディレクトリからディレクトリのたどるサブディレクトリ名を / などで区切ることにより指定相対パス名 (relative path name) 作業ディレクトリ (working directory) からたどる / bin sbin usr var home etc tmp ls bin sbin local root hagino passwd grep bin sa15 01.pptx 02.pptx

10 ファイルの読み書きの仕組み UNIX を例に説明直接システムコールを使ってファイルの読み書きを行なう場合もある通常は標準入出力ライブラリ経由で利用アプリケーション標準入出力ライブラリ OS ファイル関連システムコールバッファ管理デバイスドライバハードウェア HDD SSD

11 ファイル関連のシステムコールデータの読み出しファイル名 ( パス名 ) read データ利用開始 open ファイルディスクリプタデータの書き込み write データ利用終了 close ioctl 設定データ読み書き位置の変更 seek 位置その他の操作

12 ファイルディスクリプタ open で返される小さな数字読み書き操作を行うファイルを表す読み書きの位置を覚えている (read, writeで更新,seekで変更) プロセス毎に管理数字の意味はプロセスごとに異なる一つのプロセスでも同じファイルを 2 回 open すると違うファイルディスクリプタ特別なファイルディスクリプタ標準入力 0 標準出力 1 標準エラー出力 2

13 標準入出力ライブラリシステムコールの問題点行単位でのアクセスはできない小さな単位でアクセスすると効率が悪い標準入出力ライブラリアプリケーションからシステムコールへのアクセスを最適化バッファリングを行うアプリケーション fopen, fclose, fgetc, fputc, fgets, fputs 標準入出力ライブラリバッファ open, close, read, write システムコール

14 標準入出力ライブラリの使い方文字の読み出しファイル名 ( パス名 ) fgetc 1 文字 1 行の読み出し fopen gets 1 行利用開始利用終了 fclose fprintf 値の文字への変換値 FILE 構造体 fputs 1 行 fputc 1 行の書き込み文字から値への変換 fscanf 文字の書き込み 1 文字値

15 標準入出力ライブラリの実装 fopen FILE *fopen(char *path, char *mode) { FILE *fp; fp = (FILE *)malloc(sizeof(struct FILE)); fp->fd = open(path,...); fp->size = 0; fp->counter = 0; return fp; } FILE 構造体 struct FILE { int fd; char buf[bufsize]; int size; int counter; }; typedef struct FILE FILE; FILE 構造体アプリケーション fgetc int fgetc(file *fp) { if (fp->counter >= fp->size) { fp->size = read(fp->fd, fp->buf, BUFSIZE); if (fp->size <= 0) return -1; fp->counter = 0; } return fp->buf[fp->counter++]; } size buf バッファ一時データを保存 counter 次どこから読み書きするかシステムコール

16 ファイルシステムコールの実装プロセス管理構造体ファイルディスクリプタ表 0 1 2 3 4 ファイルディスクリプタファイルディスクリプタファイルディスクリプタファイルディスクリプタアプリケーション ( プロセス ) が利用オープンしたファイル毎に存在ファイルのどこまで読み書きをしたかを記憶 inode ディスクブロック番号 inode ディスクブロック番号 inode (index node) ファイルの管理単位 1 つのファイルには 1 つの inode ファイルの情報を管理所有者サイズファイルを構成しているブロックブロックデバイス

17 open の実装与えられたパス名に対応するファイルディスクリプタを返す namei を呼び出しパス名を inode に変換プロセス構造体の空きファイルディスクリプタに新しいファイルディスクリプタの構造体へのポインタを設定 int open(char *path, int flags,...) { struct inode *ip; int fd; struct file *fp; ip = namei(path); if (ip) { fp = 新しいファイルディスクリプタの構造体を作成 ; fp->inode = ip; fp->offset = 0; fp->refcount = 1; fd = proc の未使用ファイルディスクリプタ ; proc->file[fd] = fp; return fd; } else return -1; } file 構造体 struct file { struct inode *inode; long offset; int refcount; };

18 namei ディレクトリの中に指定された名前のエントリが存在するかどうかを調べその inode を返す struct inode *namei(char *path) { struct inode *dp; if (*path == / ) { dp = proc->root_directory; path++; } else dp = proc->current_working_directory; while (*path) { name = path から次の / までの部分を取り出す ; dp = lookup(dp, name); } return dp; }

19 ファイルの実装方法ファイルはディスク上の複数のブロックから構成ファイル毎に利用しているブロック番号を記録する必要がある UNIX では inode により管理 FAT ファイルシステムでは FAT が管理 inode 構造体ブロックデバイス上のファイルシステム struct inode { short mode; int uid int gid; long size;... int atime; int mtime; int ctime;... int direct[12]; int indirect[3]; }; 所有者サイズ変更日付 inode データブロック直接参照ブロックの番号 (12 個 ) 間接参照ブロック番号 (3 個 ) inode データブロックデータブロック

20 直接参照と間接参照 inode から直接参照できるブロックは 12 個のみ 1 ブロック 512 バイトの場合 512 12=6KB 以下のファイル間接参照ではブロックの配列のブロックを記録 inode 情報直接 1 直接 2 データデータ間接ブロックデータ間接ブロックデータデータデータ直接 12 間接 1 間接 2 間接 3 データ間接ブロック間接ブロックデータデータ

21 ブロック番号の計算ファイルのオフセットからブロック番号を計算 read, write ではオフセットからブロック番号を計算し, そのブロックにアクセスする int balloc(struct inode *ip, long offset) { struct buf *bp; int i; blk = (offset + BLKSIZE - 1) / BLKSIZE; if (blk < 12) return ip->direct[blk]; blk -= 12; blocks = BLKSIZE/sizeof(int); for (i = 0; i < 3; i++) { if (blk < blocks) break; blk -= blocks; blocks *= BLKSIZE/sizeof(int); } bp = getblock(ip->indirect[i]) while (i-- > 0) { blocks /= BLKSIZE/sizeof(int); bp = getblock(bp->buf[blk/blocks]); blk %= blocks; } return bp->buf[blk]; }

22 バッファリング要求がある度にディスクからデータを読み込んでいたのでは効率が悪い一度読み込んだデータはメモリ上でキャッシュとして記憶 2 回目以降はキャッシュから読み込む書き込みもある程度変更がたまってから一挙に書き出すバッファのハッシュ表バッファバッファバッファバッファバッファバッファ buf 構造体 struct buf { struct buf *next, *prev; struct buf *queue_next, *queue_prev; struct inode *inode; int dirty; int blkno; char buf[blksize]; }; struct buf buffers[hash]; 利用頻度

23 ディスクのフォーマット新しいディスクを使うときにはフォーマット ( 初期化する ) ディスク上のファイルシステムスーパーブロック inode 未使用ブロックのリストディスク全体の情報を管理 inode が集められている未使用のブロックの番号をリストあるいはビットマップとして管理データブロック実際のデータが入る

24 まとめファイルシステム UNIX のファイルシステムを例システムコールと標準入出力ライブラリ標準入出力ライブラリの実装ファイルディスクリプタファイルシステムの実装 inode 直接参照ブロックと間接参照ブロック