参考資料7 電子文書フォーマット


■SGML(Standard Generalized Markup Language)
 異機種間での文書交換や文書の再利用推進等を目的として、ISO(国際標準化機構)で標準規格とされた文書構造型テキスト文書である。文書構造をDTDとして定義し、文書を階層化、部品化することができる。ただし、SGMLは国における「白書等データベースシステム」や「省庁間電子文書交換システム」の文書形式に採用されたほか、その仕様の難解さ等のいくつかの理由により、期待されたほど普及はしていない。

■XML(EXtensible Markup Language)
 XMLはSGMLのサブセットとしてW3C(World Wide Web Consortium)にて標準化が進められている文書規格。SGMLとHTMLのそれぞれの優れた特徴を兼ね備えた文書構造を記述できる言語である。XMLの登場の背景には、SGMLの文書型定義作成の難解さ(SGML仕様の複雑さ)の解決、そしてインターネットの爆発的普及を受けて、HTMLの限られた機能の拡充(業務系処理への対応など)が挙げられる。XMLでは、SGMLの規格が簡略化され、SGML宣言及び文書型定義の部分を省略することができる。なお、SGMLでは文字コードの再現性の問題があったが、XMLではUnicodeが採用されている。このようにXMLはSGMLの問題点の解決やインターネットでの親和性を深めており、次世代の標準文書規格として注目を集めている。現に著名なWWWブラウザがXMLの表示機能を有していることや、汎用ワープロ等がXMLの作成機能を表明するなど、汎用的なツール類が整備されつつある。

■PDF(Portable Document Format)
 PDF文書は、汎用的なワープロソフト等で作成した電子文書をツールにより変換して作成される。変換に際しては、元の電子文書のオリジナルデザインをほぼ保ったまま再現可能である。異機種間での文書交換が可能な点はSGMLやXMLと共通しているが、文書構造を定義できず、文書のプレゼンテーション面やネットワークによるデータ配信を重視している。




目次
目次