end0tknr's kipple - web写経開発

太宰府天満宮の狛犬って、妙にカワイイ

htmlの特殊文字(記号)一覧と、htmlunicodeの変換方法?

http://www.w3.org/TR/1999/REC-html401-19991224/sgml/entities.html

unicodeに対して、htmlの特殊文字の名称もw3cで公開されていますが、文字の形?から探すのであれば、次のurlの方が参考になると思います。

http://e-words.jp/p/r-htmlentity.html
http://rikiy.jp/report/web/20080120.html


また、htmlの特殊文字unicodeの対応は次のurlでの紹介されていますが、簡単に調べる方法はないのだろう?

http://www.fiberbit.net/user/hobbit-t/html/refu.html

例えば、» の場合、次のように » → 187 に変換後、先程のw3cで187の有無を調べている方もいらっしゃるようでしたが、詳細は後日。

#!c:/Perl/bin/perl
use strict;
use warnings;
use Encode;

print ord(decode('utf8', "\xc2\xbb"));

実行結果

$ ./foo.pl 
187