Gauche > Archives > 2011/05/23

2011/05/23 02:47:40 UTCとおる。
#
Chrome の JavaScript コンソールで試してみたら "χαος." になりました。
2011/05/23 02:53:00 UTCとおる。
#
"ΣΙΓΜΑ".toLowerCase()
"σιγμα"
#
おもしろいですねぇ。ミステリーのダイイングメッセージとかに使えそう。
2011/05/23 03:57:48 UTCshiro
#
おもしろいけど、実装者泣かせだなあ。コンテキストによってlowercaseが変化するのってΣだけなんすよ。(言語依存で他にもちょいとあるけど、R6RSとかで求められている言語非依存な変換ではΣのみ)。それだけのために、単語境界をきちんと判別する必要があって、そのためには多分UAX#29のWord Boundaryアルゴリズムを実装する必要がある。
#
既にWord Boundaryが実装されてるのなら、lowercaseはΣだけ特別扱いすればいいんでtrivialなんですけどね。
2011/05/23 04:39:53 UTCshiro
#
らむ太がgoogleで検索したがるのでアルファベットを覚えるのに良いなと思ってたんだけど最近は検索のヒントが出たらそこから選ぶことを覚えてしまった。
2011/05/23 14:24:24 UTChigepon
#
もう忘れてしまいました。> final sigma
#
R6RS の unicode normalize 周りは実装していて不毛な感じがしました。そして全く使ってない。
#
Unicode 対応を実装する英語圏の人の気持ちがちょっぴり分かった気がする。
2011/05/23 18:19:20 UTCshiro
#
英語圏というか、自分の知らない言語については「なんでこんな手間かけんだめんどくせ」ってなるのでしょう。マルチバイトの日本語文を文字の途中でぶった切って文字化けしてるのを見て「だっせぇ」と我々が思っていたように、ギリシャの人は"ΧΑΟΣ."をtolowerして"χαοσ."になったら「だっせぇ」と思うんじゃなかろうか。