降順・昇順の色々と文字コード
データを並べ替える時によく出る昇順・降順。
値が数字なら、小→大が昇順で大→小が降順、と馴染みがありますが、他の代表的な値の順序はこうなっています。
■アルファベット
昇順:a→b→c→d→・・・
降順:z→y→x→w→・・・
■日本語
昇順:あ→い→う→え→・・・
降順:ん→を→わ→よ→・・・
■日時
昇順:古い→新しい
降順:新しい→古い
■漢字
昇順・降順は、漢字変換前の仮名(=ふりがな)を基準に並べ替え
ふりがなの無い場合は文字コードを基に並べ替え
実はこれら並べ替えの基準となっているのが文字コードです。
文字コードとは、コンピューターで文字を扱うために、文字・記号それぞれに割り当てられた番号の事です。
例えばシフトJISでは「あ=82a0」となり、更にコンピューター内の「0」と「1」だけの世界では「1000001010100000」になります。
(文字コードの種類はASCIIやシフトJIS,Unicode,UTF-8などなど多様で複雑!)
いつも何気なく入力している文字や記号は、裏では様々な文字コードによる番号が打ち込まれて処理されています。
世界には様々な言語や記号があるので、それらに対応するための割り当て番号が存在し、その番号順で文字・記号が昇順降順で並べ替えられるようになっている、という、調べてみると実に奥の深いお話でした!(^^)