rcmdnk's blog

JIS漢字字典

何か保存してあるものを見るときに、ファイル名とかでソートされて表示されたときに 日本語があるとどのようなものが最初と最後に来るか問題。

順序を上手く制御したい

GmailのラベルとかEvernoteとかでノートブックを作っていく際、ノートブック名を適当につけていくと 表示順の変更が出来ないので、aとかとかの文字が最初にあればそれが上の方に来ます。

ただ、自分的な優先度はその通りにはなってないことが多いのでなんとかしたいと思います。

そんな時は、

0_重要
1_Todo
2_仕事
3_買い物

とか、最初に数字を付けておくと良い感じに制御できます。(もっと多い場合は123_とか桁数を増やして)

最初と最後に置く

ただ、そこまでしなくても、要らなくなったら一番下に、欲しいものは上に、位でも結構便利に使えます。

最初、というのは比較的簡単で、記号を使ってないのであれば0を先頭につけておけば最初に来ます。

最後は数字アルファベットだけならZを付けておけばよいわけですが、 日本語が入ってくるとそうは行きません。

ひらがな、カタカナ、漢字のような順ですが、漢字はどの様になってるか、という話。

漢字の文字コード

漢字はJIS規格で第一水準、第二水準、などという区画に分かれているということですが、 普段使うのは第二水準くらいまでのものです。

それぞれの文字コードは以下がわかりやすいです。

Unicode対応 文字コード表(JIS第一水準漢字)

Unicode対応 文字コード表(JIS第二水準漢字)

これを見ると、第二水準漢字の(キ)(SJIS: 0xEAA4, UTF-16: 0x7199)が最後になっています。

第一水準だと(SJIS: 0x4F57, UTF-16: 0x8155)。

実際、漢字や平仮名だけを並べてこの文字を最初に持つファイルとかを並べると最後に来てくれます。

記号を含めると

ただちょっと良くわからない文字を使うのもあれなので、他に無いかということで 記号も含めてみます。

ただ、上の文字コード表のJIS第一水準漢字の方には全角記号も含まれていて、 それらは文字コード上は小さい方に入っています。

なので使えないかな、と思ったらそういうわけではなく、OSやアプリによって 記号をどの様に処理するか、は違う模様。

エクスプローラーの名前順

こんな話があって、エクスプローラーだと

  • 全角スペース(SJIS: 0x3000, UTF-16: 0x8140)が数字とかをも抜いて一番上に来る
  • ダッシュ(―, SJIS: 0x815C, UTF-16: 0x2015)が最後に来る。
  • 長音記号ー, SJIS: 0x815B, UTF-16: 0x30FC)がその前。

とのこと。Windows 10のエクスプローラーでみてみましたが、 手元の環境だと確かにこれらは漢字や数字より前や後ろに来てましたが、 長音記号の方がダッシュより後に来ていました。

全角スペースに関しては、通常のハイフン(-, SJIS=UTF-16: 0x002D)の方がさらに上に来ていました。 ビックリマーク(!, SJIS=UTF-16: 0x0021)は全角スペースより下でした。

このハイフンに似通った記号はたくさんありますが良くわからない振る舞いしてます。

ただ、これはあくまでエクスプローラーでの話で、 例えばExcelで見てみると、長音記号がダッシュより下には来ますが、 さらに全角スペースが一番下に来ます。

そもそもExcelだと数字が特別扱いされるので、どの文字よりも一番上に来るようになり、 それと合わせてスペースも少し別の扱いをされてる?みたいです。

似たようなGoogleスライドで見てみると、今度は数字の次に全角スペース、その後に ダッシュ記号、長音記号が来て、その後にアルファベットやひらがな、漢字が来ました。

さらに、ビックリマークはダッシュと長音記号の間に来るようになってました。

どれもUTFな文字コード順ともSJISな順とも言い切れないような形で、 なかなか複雑なようです。。。

どの文字を使えばよいか?

記号だと場所によって違うみたいなのでやはり漢字を使うべきか?

日本語を含む名目を整理したい場合、先頭に持ってきたければ取り敢えず0_で良いかな、とは思います。 他の記号をわざわざ付けてることは通常無いと思うので。

後ろの方に回すにはどうすればよいか、というのが難しいところですが、熙_を付けておけば取り敢えず後ろに回せますが、なんなのか、という感じはします。

JIS第二水準漢字の上の方にとか一部普段も使いそうなものや、人名に使われそうなものはありますが、全体的にそこまで使われてるわけでもないかな、という感じもするので、 なんとなく使いやすそうな文字を探してみると、 (イ、コク, SJIS: 0x9A98, UTF-16: 0x56D7、(クチ)じゃない)がスペース的な感じで良さげかな、と。

Sponsored Links
Sponsored Links

« Vim emulation using Karabiner-Elements (on macOS)でメニューバーに状態表示させたり通知でお知らせしたり AppVeyorで何故か失敗しているのをリモートデスクトップで入って確かめる »

}