http://www.w3.org/TR/1999/REC-html401-19991224/sgml/entities.html
unicodeに対して、htmlの特殊文字の名称もw3cで公開されていますが、文字の形?から探すのであれば、次のurlの方が参考になると思います。
http://e-words.jp/p/r-htmlentity.html
http://rikiy.jp/report/web/20080120.html
また、htmlの特殊文字とunicodeの対応は次のurlでの紹介されていますが、簡単に調べる方法はないのだろう?
http://www.fiberbit.net/user/hobbit-t/html/refu.html
例えば、» の場合、次のように » → 187 に変換後、先程のw3cで187の有無を調べている方もいらっしゃるようでしたが、詳細は後日。
#!c:/Perl/bin/perl use strict; use warnings; use Encode; print ord(decode('utf8', "\xc2\xbb"));
実行結果
$ ./foo.pl 187