元号に使われる文字を調べてみた
もうすぐ元号が発表されるわけですが、なんとなく元号で何の文字が一番使われているか調べたくなりました。
元号の一覧
元号の一覧は、ぐぐって拾って使います。元号部分だけを切り出して、UTF-8でテキストファイルにします。UTF-8の漢字が3バイトなのを良いことに、適当に文字単位に改行を入れます。良い子は真似しないように。
あとはソートして数を数えるだけです。シェル芸で何とか出来るかと思ったら、意外とめんどくさいので手に馴染んだperlで適当にワンライナーで雑になんとかします。
perl -ne 's/(...)/$1\n/g; print' gengou.txt | \
sort | \
perl -ne 'BEGIN{$pre=""; $aa={}}; { next if /^\s+$/; s/[\r\n]+$//; $aa->{$_}+=1 if $_ == $pre; $pre=$_;} END { foreach my $key ( sort{ $aa->{$a} <=> $aa->{$b} } keys( %$aa) ) { printf("%s:%d文字\n", $key, $aa->{$key}) } }'
元号使用文字一覧
結果がこちらになります。「昭」とか「成」が1度しか使われてないのが意外ですね。
亨:1文字
昌:1文字
斉:1文字
祥:1文字
同:1文字
勝:1文字
鳥:1文字
景:1文字
衡:1文字
乾:1文字
吉:1文字
興:1文字
老:1文字
禎:1文字
成:1文字
霊:1文字
武:1文字
朱:1文字
福:1文字
白:1文字
雉:1文字
至:1文字
国:1文字
昭:1文字
字:1文字
授:1文字
祚:1文字
感:1文字
泰:1文字
護:2文字
雲:2文字
銅:2文字
政:3文字
化:3文字
観:3文字
神:3文字
養:3文字
喜:3文字
中:3文字
万:4文字
寿:4文字
亀:5文字
大:6文字
禄:7文字
貞:8文字
享:8文字
明:8文字
弘:8文字
建:10文字
宝:10文字
久:10文字
康:10文字
慶:10文字
平:12文字
嘉:12文字
仁:13文字
承:14文字
寛:15文字
保:15文字
延:17文字
安:17文字
暦:17文字
徳:17文字
文:19文字
応:20文字
長:20文字
和:20文字
正:20文字
治:21文字
天:28文字
元:28文字
永:29文字
ということで、また無駄に技術を使ってしまいました。エイプリルフールで元号詐欺をする方は参考にしてしてくださいw