character entity in HTML について
- 概要を理解するためには HTML Entities が良さそう.この中身を抜き出したのが以下.Entity Name と共に Entity Number が定義されている.
Result Description Entity Name Entity Number non-breaking space   & ampersand & & " quotation mark " " ' apostrophe &[http://www.w3.org/TR/REC-html40/sgml/entities.html:title=apos; (does not work in IE) '
これらは代表的な例である.
(ハートマークなど)絵文字に括れるのかもしれないが,それらも
Ӓ
のように entity number で表現されている様子.
W3C が定義する character entity は entity number の何番から何番かを調べないといけない.
- HTML4 で定義されている character entity の(完全な?)一覧が以下に示されている.
http://http://www.cs.tut.fi/~jkorpela/html/guide/entities.html
- W3C による定義は以下にある.
http://www.w3.org/TR/REC-html40/sgml/entities.html
これによると,
- ISO 8859-1 charaters における entity number は 160-255 である.
- symbols, mathematical symbols, and Greek letters における entity number は402, 913-929, 931-937, 945-969, 977, 978, 982, 8226, 8230, ...9830 まで飛び飛びである.
- markup-significant and internationalization characters の場合,34, 38, 60, 62, ..., 8364 まで飛び飛びである.