Java/Unicodeの正規化(normalize)メモ1 (v1)
Java / Unicodeの正規化(normalize)メモ1 (v1)
id: 1361 所有者: msakamoto-sf
作成日: 2015-03-01 22:22:18
カテゴリ: Java
たまたま、はてブで、以下の記事を発見。「は~、Unicodeって色んな記号あるんだな~」と眺めてた。
- Unicodeにあるハイフン/マイナス/長音符/波線/チルダのコレクション | hydrocul のメモ
そしたら、同じblogでこんな記事を見つけた。
- PHPのmb_convert_kanaとUnicodeのNFKC正規化 | hydrocul のメモ
記事はPHPだったが、Javaだとうどうかな?と思ってぐぐったらこんなの見つけた。
- Java技術最前線 - 「Java SE 6完全攻略」第56回 文字列の正規化:ITpro
- Normalizing Text (The Java™ Tutorials > Internationalization > Working with Text)
- Java SE 6 じゃじゃ馬ならし Unicode の正規化
- Java6にはUnicode正規化の機能がいるそうな : mwSoft blog
JDK6から正規化が使えるようになったみたい。
このへんで、ちゃんと「Unicode 正規化」でぐぐったら以下の記事を発見。スゴイ。
Javaの正規化で、本当に上の記事のようになるか、確認してみた練習:
https://github.com/msakamoto-sf/javasnack/commit/5853d88d0e043e85decf37272e07b1e5ce076ac1
プレーンテキスト形式でダウンロード
現在のバージョン : 1
更新者: msakamoto-sf
更新日: 2015-03-01 22:24:44
md5:2a9ce33cd9f0a3d61ec956016896691a
sha1:d86cb6b9fb3d998d012de7a536b4352973a54b5a