勝手にHTML4.0講座 - 予備知識

1.World Wide Web とは何か?

World Wide Web (WWW,Web) は、情報資源のネットワークです。 Webは、できる限り多くの人々が容易に利用できるようにという意図で考案された、次の3つの機構から成り立っています。

2.URIとは何か?

HTML文書、画像、動画、Perl Script等、Web上で利用できるリソースは全て、固有の住所を持っています。 この住所は、URI(Universal Resource Identifier)と呼ばれる書式で表されます。
※[URI]という言葉は聞き慣れないと思いますが、[URL(Uniform Resource Locator)]よりも上位概念にあります。

URIは通常、次の3つの部分から構成されます。
  1. リソースへのアクセス手段を表す名称。(http)
  2. リソースを管理しているホストコンピュータの名称。(www.w3.org)
  3. リソース自体を指し示すパス名入りの名称。(/TR/REC-html40/)
アクセス手段 : [http](HyperText)の他に、[mailto](E-MAIL)や、[ftp](File)なども利用されます。
部分識別子 : 文書内の特定部分を指し示すもので、その文書自体を示すURIの末尾に[#]を記し、続けてアンカーとして用いた名称を記載します。
相対URI : 基準URI(リンク元のHTML文書、BASE要素等)を元にして、フルURIに変換されます。
(例) http://www.w3.org/TR/REC-html40/
(例) <A HREF="mailto:hepopo@sp.office.ne.jp">
(例) http://somesite.com/html/top.html#section_2
(例) <A HREF="../images/hepopo.gif"> (../は、一つ上のパス)
URIは大文字小文字を区別するので注意してください。Index.htmlとindex.htmlは別物です(サーバー名は区別しないみたいです)。 URIに非アスキー文字(特殊な文字で漢字や空白、その他いろいろ・・)を使うことは禁止されています。

3.HTMLとは何か?

世界中に情報を配布したいという場合、全てのコンピュータが理解可能であるような書き言葉が必要になります。 そしてWorld Wide Webでは、HTML(HyperText Markup Language)という世界共通に近い言語が使われています。

HTMLを用いると、次のようなことが可能になります。
つまりHTMLを利用すると、いろいろな機能を持った世界共通の文書が、手軽に書けるようになります。

3.1.要素とタグ

要素というのは、HTMLの本体部分のことで、段落を表す要素や、ハイパーリンクを表す要素、リストの要素、表の要素、画像の要素、等々があります。 要素は、「開始タグ」「内容」「終了タグ」の3つを1組にして記述されます。 要素の名前は開始タグの部分に<要素名>のように書かれ、また終了タグにも</要素名>のように記されます。
(例)DIV要素の場合
<DIV> : 開始タグ
こんばんわんこそば。 : 内容
</DIV> : 終了タグ
要素の幾つか(例えばBR要素やLI要素など)は終了タグの省略が可能です。更に開始タグまでもが省略可能なものもあります(HEAD要素やBODY要素など)。 要素の中には、内容を持たないものもあります(BR要素等)。このような要素は空要素と呼ばれ、終了タグも存在しません。 要素名の表記には大文字小文字を区別しません。

要素とは、タグのことではありません。タグは、HTML文書中に実際に書かれているものでです。 なかにはタグを書かなくても要素は存在しているものもあります(HEAD要素等・・)。

3.2.属性

要素には、属性と呼ばれるオプションがある場合があり、属性値を指定して要素を多機能にしています。 次の例ではDIV要素に、ALIGN属性が指定されています。
(例)属性値の指定
<DIV ALIGN="CENTER">
これは「ALIGN」属性によってCENTERに揃えられた文です。
</DIV>
全ての属性値は、["]か[']で囲む必要があります。

属性値を書き入れる際に引用符を用いる必要がない場合もあります。 アルファベット、数字、ハイフン「-」、ピリオド「.」のみで記される値の場合です。 でも、省略可能な場合でも引用符で囲んでおくことを推奨します。

属性名は大文字で記しても小文字でも構いません。 属性値の大半も大文字で記しても小文字でも構いませんが、属性値の大文字小文字を区別するときもあります。

3.3.文字参照

特殊な文字などの場合、表現することができなかったり、直接記述できない場合があります。 記述するときは、アンパサンド記号「&」で始まりセミコロン記号「;」で終わる、文字参照という方法を使います。

3.4.コメント

コメントとは、ブラウザ上では表示されない文章です。でもソースを見ると見えます。 HTMLでのコメントの表記法は、次の通りです。
<!-- ここはコメントです。 -->
<!-- これもまたコメントで、
複数の行にまたがっているものです。 -->
マークアップ宣言開始区切り子[<!]とコメント開始区切り子[--]の間には、空白文字の挿入は許されません。 けれどもコメント終了区切り子[--]とマークアップ宣言終了区切り子[>]の間には、空白文字の挿入が許されます。

4.HTML3.2からHTML4.0への変更点 - 要素のみ

新規の要素[非推奨]になった要素廃止された要素
ABBR
ACRONYM
BDO
BUTTON
COL
COLGROUP
DEL
FIELDSET
FRAME
FRAMESET
IFRAME
INS
LABEL
LEGEND
NOFRAMES
NOSCRIPT
OBJECT
OPTGROUP
PARAM
S [非推奨]
SPAN
TBODY
TFOOT
THEAD
Q
APPLET
BASEFONT
CENTER
DIR
FONT
ISINDEX
MENU
STRIKE
U
LISTING
PLAINTEXT
XMP


5.HTMLの歴史

HTMLは最初、当時CERN [ヨーロッパ素粒子物理学研究所] に在籍していたTim Berners-Leeによって開発され、NCSA [全 米スーパーコンピュータ応用研究所] が開発したMosaicというWWWブラウザによって一般化しました。そして1990年代、 WWWの爆発的成長と共に開花していきました。この間、HTMLは様々な流儀での拡張を施されました。WWWの機能は、Webペ ージの書き手とWWWブラウザの供給元とがHTMLに関する共通認識を持つことで成り立っています。このため、HTMLの共通 仕様を定めるための協同作業が始まりました。

HTML2.0(1995年11月版、[RFC1866]を参照のこと)は、Internet Engineering Task Force (IETF)の支援の下、1994年終 盤の一般的慣行を成文化する形でまとめられました。 HTML+(1993年)やHTML3.0(1995年、[HTML30]を参照のこと)は、 HTMLにHTML2.0もより多くの機能を持たせることを提案したものです。幅広い賛同は得られなかったたものの、これらは 多くの新機能を含んでいました。W3CのHTMLワーキンググループによる、1996年時点の一般的慣行を成文化する試みは、 苦労の末に、HTML 3.2として形になりました (1997年1月版、[HTML32]を参照のこと)。HTML3.2から4.0になっての変更点 は、附記Aの前半に要約してあります。

HTML文書の運用に関して、HTML文書は様々なユーザエージェントやハードウエアの違いを越えて読み書きできなければ意 味がないと、ほとんどの人が認めるところでしょう。共通利用可能であるようにしておけば、ただ一種類の文書を作成す ればいいことになるので、コンテンツプロバイダの負担もそれだけ減らせます。もし共通利用への努力がなされなけれ ば、Webは独自規格による囲い込み競争へと巻き込まれていき、ついには全ての関係者にとってのWebの商業的可能性は減 少することになるでしょう。

どの版のHTML規格も、コンテンツプロバイダの投資は無駄にしないよう、また今までに作られてきた文書が短期間で陳腐 化して読めなくなったりすることのないよう、産業界の幅広い賛同を反映するよう企図されてきました。

世の中にある、多種多様な機器がWebに接続されます。例えば、高画質大画面のコンピュータ、携帯電話、モバイル機 器、音声入出力機器など。あるいは、高速回線に繋がったコンピュータの場合もあれば、低速回線に繋がったコンピュー タの場合もあります。HTMLは、どのような接続環境であっても利用できるべきだという理想の下に開発されてきていま す。
(和訳より転載)


★INDEX★