ファイルフォーマットファイルフォーマット(英: file format、ファイル形式)は情報をファイルへ収納する形式である[1]。 概要コンピュータにおいてメディア(文書、音声、画像、動画)やプログラムはファイルとして保存される。統一された順序・構造でこれらの情報がファイルとして保存されていれば、OSやアプリケーションは一貫した方法でファイルにアクセスし情報を利用できる。これを可能にする、ファイルへの情報格納規格がファイルフォーマット(ファイル形式)である。 通常「ファイルフォーマット」と呼ばれるが、MS-DOSやMicrosoft Windows、UNIX、Unix系などのオペレーティングシステムにおけるファイルはストリーミングデータ(データストリーム)形式であり、正確には「各ファイルに格納されたデータのフォーマット」の事である。 通常ファイルに格納されたデータは、テキストまたはバイナリファイルなので、ファイルの内容だけからはそのファイルフォーマットを知ることが困難な場合がある。このため、ファイル名に拡張子をつけて識別したり、ネットワークでの転送時にはMIMEヘッダ(メディアタイプ)等をあわせて送ったり、といった方法が採られる。このようなメタデータを付与する方法はファイルの内容自体に影響を与えず、またファイルを開くことなく種別を判定できる、という利点がある。しかし、拡張子は簡単に、しかも自由に編集できるため、信頼性は極めて低い。またMIMEタイプはIANAによって正式に登録・標準化されていない独自の文字列をアプリケーションやシステムが勝手に付与することもありうる。そのため、多くのファイルフォーマットは、ファイルの先頭にマジックナンバーと呼ばれる、より確実にファイル形式を識別するための情報を付加する。 さまざまなアプリケーションで扱える標準的なフォーマットもあるが、オペレーティングシステムやアプリケーションによりそのデータ形式は様々である。特定のアプリケーションで扱えるデータ形式に変換するためのファイルコンバータを利用できることがある。 データの区切りの単位に注目した分類
テキストもバイナリの一種であるが、実際のビット列はエンコーディング時に採用する文字セットに左右される。テキストのデータストリームをデコードする際のヒントとして、ファイル先頭付近にバイト順マークや文字セット名を記載するフォーマットもある。 各種プログラミング言語のソースファイルも、構造化されたプレーンテキストファイルの一種である。 汎用性に注目した分類
よく知られたファイルフォーマット一覧→詳細は「ファイルフォーマット一覧」を参照
テキスト、ハイパーテキスト、ドキュメント
オフィススイート 用のフォーマット主なオフィススイート用のフォーマットには以下がある。
データ記述フォーマット
画像・図形→詳細は「画像ファイルフォーマット」を参照
3D
ラスターイメージ→詳細は「ラスターイメージ」を参照
ベクターイメージ→詳細は「ベクターイメージ」を参照
音声→詳細は「音声ファイルフォーマット」を参照
→「コーデック」も参照
楽曲
動画→「コンテナフォーマット」も参照
時間軸を持つもの
ファイルアーカイブ(圧縮など)
オブジェクトファイル→詳細は「オブジェクトファイル」を参照
通信関連その他
ファイルフォーマットと関連づけ特定のファイルフォーマットと、それを開くアプリケーションソフトウェアを登録しておき、操作を行いたいファイルを選択した際にアプリケーションソフトウェアを選ぶ手間を省くための動作を関連づけ (association) という。関連づける手法はオペレーティングシステムなどの環境により異なる。例えばWindowsやOS/2では拡張子によって対応するアプリケーションを選択する(Windowsではレジストリに登録する。OS/2ではWPSの.INIファイルに情報が格納される)。 Mac OSでは、ファイルのメタデータとしてクリエータとタイプというデータがある。ファイルシステムのHFSとHFS+、ファイル転送プロトコルのAFPではこれらは保持されるが、FTP、HTTP、電子メール等を介してファイルをやりとりする場合は、クリエータとタイプを保持するフォーマット(Macバイナリ、AppleSingle、AppleDouble、BinHex等)に変換するか、Mac OS用のアーカイブフォーマット(StuffIt、MacLHA等)を用いる必要がある。 macOSではクリエータとタイプがあればそれを優先するが、なければ拡張子による対応づけが利用される。 脚注
関連項目外部リンク
|