2011-08-01から1ヶ月間の記事一覧

KDDI (AU)携帯電話のUTF-8絵文字の仕様

AU携帯電話の絵文字のUTF-8はよくわからない。KDDI/AUでutf-8のHTMLフォームから送られてくる絵文字コード - Bulknews::Subtech - subtechと同じテスト(Shift_JISでF641の字を表示)をしてみたが、私の携帯電話(W61P: 6.2.0.13.2) では以下の結果となった。 (…

Shift_JIS-2004 (JIS X0213:2004) のサポートを libmbfl に追加

JIS X0213-2004 のサポート 夏休みの課題として、最後の大物の JIS X0213-2004 をlibmbfl に追加してみました。 実装面では、メモリのフットプリントを気にしてJIS X0213のテーブルをJIS X0208 に関する差分で作成することも検討しましたが、非常に見難くな…

mbstring/libmbflへのgb18030サポート追加

GB18030 のサポート 大国中国のオフィシャルな文字コードということで以前から気にはなっていたのですが、夏休みということでトライしてみました。 なにしろ、Unicodeのコードポイントを超える150万字をサポートする世界最大と言っても良いかもしれない文字…

mbstring/libmbfl モバイル用UTF-8

Unicode 6.0 モバイル用UTF-8の相互変換を可能としました。実際のコードをテストするには、github.com のlibmbfl のレポジトリか、svn.php.netからPHP 5.4または5.5の開発用ソースコードを取得ください。以下、仕様等について記述します。 UTF-8-Mobileの必…

mbstring/libmbfl 正しいUTF-8チェックの強化

非最短形式UTF-8などのmbstringでUTF-8のチェックが甘いという指摘がでてからかなり立ちますが、PHP 5.4に向けて、対策を考えてみました。libmbfl 1.3.1 からは、UTF-8の変換や検出時に行われる文字コード範囲検出において整形式であることを確認するチェッ…

** libmlfl(mbstring)への絵文字のサポート追加

Unicode 6.0に携帯電話の絵文字が正式に組み込まれ、Mac OS Lion等でもサポートされるなど、使う機会も増えてきたということで、mbstringに携帯電話のShift_JIS絵文字コードのサポートを組み込んでみました。現時点で、githubのlibmbfl開発コード、PHPのHEAD…