Applications/14x14ja: findUnicode.pl annotate

annotate findUnicode.pl @ 3:0285a01caf93

fix

author	Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date	Sat, 15 Jun 2013 18:23:21 +0900
parents	7f5d4dad9d6b
children	8da43f287516

rev	line source
1 6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	1 #!/usr/bin/perl
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	2
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	3 # find used unicode
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	4 use strict;
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	5 use utf8;
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	6 use open qw(:std :utf8); # input/output default encoding will be UTF-8, it looks like default
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	7
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	8 my %used;
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	9
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	10 while(<>) {
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	11 for my $ch ( /(.)/g ) {
2 7f5d4dad9d6b merge operation Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 1 diff changeset	12 next if (ord($ch)<128);
7f5d4dad9d6b merge operation Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 1 diff changeset	13 next if (ord($ch)>12288); # ignore CJKV
1 6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	14 $used{ord($ch)}++;
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	15 }
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	16 }
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	17
2 7f5d4dad9d6b merge operation Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 1 diff changeset	18 for my $bdf (<[0-9]*.bdf>) {
1 6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	19 open(my $f,"<",$bdf);
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	20 my %has;
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	21 while(<$f>) {
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	22 if (/^ENCODING\s+(\d+)/) {
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	23 my $encoding=$1;
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	24 $has{$encoding} = 1;
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	25 }
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	26 }
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	27 my %no;
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	28 for my $ch ( keys %used ) {
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	29 $no{$ch} ++ if (! defined $has{$ch}) ;
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	30 }
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	31 for my $ch ( sort {$a<=>$b} keys %no ) {
2 7f5d4dad9d6b merge operation Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 1 diff changeset	32 my $hex = sprintf("%x",$ch);
7f5d4dad9d6b merge operation Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 1 diff changeset	33 print chr($ch)," $ch 0x$hex is not in $bdf\n";
1 6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	34 }
6ca82c74bf63 fix Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: diff changeset	35 }

Mercurial > hg > Applications > 14x14ja

annotate findUnicode.pl @ 3:0285a01caf93