character entity in HTML について

  • 概要を理解するためには HTML Entities が良さそう.この中身を抜き出したのが以下.Entity Name と共に Entity Number が定義されている.
Result  	Description  	Entity Name  	Entity Number
  	non-breaking space 	  	 
& 	ampersand 	& 	&
" 	quotation mark 	" 	"
' 	apostrophe  	&[http://www.w3.org/TR/REC-html40/sgml/entities.html:title=apos; (does not work in IE) 	'

これらは代表的な例である.
(ハートマークなど)絵文字に括れるのかもしれないが,それらも

Ӓ

のように entity number で表現されている様子.
W3C が定義する character entity は entity number の何番から何番かを調べないといけない.

  • HTML4 で定義されている character entity の(完全な?)一覧が以下に示されている.

http://http://www.cs.tut.fi/~jkorpela/html/guide/entities.html

  • W3C による定義は以下にある.

http://www.w3.org/TR/REC-html40/sgml/entities.html
これによると,

  1. ISO 8859-1 charaters における entity number は 160-255 である.
  2. symbols, mathematical symbols, and Greek letters における entity number は402, 913-929, 931-937, 945-969, 977, 978, 982, 8226, 8230, ...9830 まで飛び飛びである.
  3. markup-significant and internationalization characters の場合,34, 38, 60, 62, ..., 8364 まで飛び飛びである.