Gauche > Archives > 2011/04/17

2011/04/17 04:24:06 UTCとおる。
#
2ch のスレしか見てないですが、R5RS からの差分が載ってるそうですね。Scheme も偶数リビジョンはうまくいかないみたいなジンクスができたりして。
2011/04/17 04:29:13 UTCshiro
#
r5rsにモジュールとunicode対応とblobといくつかのポピュラーなsrfiを加えた感じかな。セマンティクスに大きな変更を加えてないので自然な拡張に見える。r6rsは機能拡張とセマンティクスの変更を同時にやろうとしたのが混乱のもとだったのかもしれん。
2011/04/17 07:34:39 UTChigepon
#
さくっと R7RS に対応したいところだ。
2011/04/17 07:39:32 UTCshiro
#
R5RSを基本としてインクリメンタルな追加で実現できそうなので、R6RSよりうんとハードルが低そうですね。
#
ただ、これはdraftなんで、あせって対応してもfinalで変わる可能性が。
2011/04/17 07:54:41 UTChigepon
#
Ikarus が R6RS のときにすぐに対応(というか Draft 時から対応)してたのがずるいなと思ったので。採用見込みが高そうなところはやっておいても良いかなと。
#
まだ一行も読んでないですが。
2011/04/17 07:57:21 UTCokuoku
#
こんなこともあろうかとchibi-schemeのsyntax-rulesを移植しておいたので、nmoshは(やる気になれば)対応出来る見込み。
#
モジュール周りはドラフトで結構かわったのでやり直すけど。。
2011/04/17 07:57:55 UTCshiro
#
srfiから持ち越しているようなやつは多分素直に行くんじゃないですかね。とそう言ったらほとんどかなあ。r6rs draftの時の「え、ちょ、ちょっと待ってなにこれ」感がない。
2011/04/17 07:57:56 UTChigepon
#
nmosh と言わず mosh でも。
#
nmosh はメモリフットプリントが気になるくらいであとは psyntax mosh より良い気がする。
#
chibi-scheme の位置づけがやっと理解できた。
2011/04/17 07:59:36 UTCokuoku
#
psyntax-moshはマクロ展開がlazyなので、パフォーマンスを犠牲にせずにしようとするとちゃんとsyntax-rulesを実装しないと。。
2011/04/17 08:00:22 UTChigepon
#
mosh/nmosh は hashtable に数万件のデータとか大きな文字列などで GC が異常に遅くなるのだよな。きちんと調べてないけど。
#
chibi-scheme の syntax-rules は C? Scheme?
2011/04/17 08:00:43 UTCokuoku
#
Scheme。
#
https://github.com/okuoku/mosh/commit/1f40677cfab7c2b67f299e37ed09fa851a5ca0fa#diff-3
2011/04/17 08:01:16 UTChigepon
#
0.2.7 だしたら nmosh を mosh に rename 作戦やってしまうか。
2011/04/17 08:01:21 UTCshiro
#
やばそうな気配はマクロの厳密な仕様くらいかなあ。今 => などの補助シンボルとモジュールの相互作用について議論になってるけど。厳密に突き詰めようとするとr6rsみたいになっちゃうんで、うまくダークコーナーを残したまま妥協できるかがポイントかなあ。
2011/04/17 08:02:40 UTCokuoku
#
いまはnmoshのfree-identifier=?がR7RSのセマンティクスと合わないので、そこを直さないと動かない。
#
R7RSは => とか elseはunboundにしようということになってるけど、nmoshはunboundなシンボルはfree-identifier=?で比較するときにモジュールを超えられない。
2011/04/17 08:04:26 UTCshiro
#
moshってgcはboehmだっけ? Gaucheではhashtableの実装でfalse pointerが多発して問題になったことはあったけど。ILP32で。
2011/04/17 08:04:53 UTChigepon
#
boehm です。amd64 でも起きているので別の問題かと思っています。
2011/04/17 08:05:18 UTCokuoku
#
nmoshのweak-pointerは通常のシチュエーションでもGaucheほど消えないんで、何か間違ってる感触は有る。。
2011/04/17 08:05:24 UTChigepon
#
PRINT_GC_STATS でみると mark&sweep で 100msec 以上かかってひどいパフォーマンスです。
2011/04/17 08:09:27 UTChigepon
#
reader labels 入るのか。
#
record シンプルになったな。良い。R6RS の構文は全然覚えられなかった。
2011/04/17 08:11:24 UTCokuoku
#
ああR6RSから仕様が変わった部分を入れてなかったな。。
#
syntax-rules、error、define-record-typeあたりは変わった。
2011/04/17 08:12:29 UTChigepon
#
blob 識別子短くていいな。blob-copy もやっと入ったか。
2011/04/17 08:12:53 UTCokuoku
#
Readerででかいのは |hoge fuga|で(string->symbol "hoge fuga")になったことかな。。またひとつ予約シンボルが消えた
2011/04/17 08:13:20 UTChigepon
#
以前入れていたので対応するのは簡単かな。Gaucheにもありますよね。
#
endian はなかったことになったのかな<blob
2011/04/17 08:13:35 UTCokuoku
#
まぁ#"hoge fuga"にしようという提案もあるけど。
#
blobはWG1ではbyteだけです。なのでendianを気にする必要はない。
2011/04/17 08:14:56 UTChigepon
#
(current-jiffy) の唐突感が半端じゃないw
2011/04/17 08:15:19 UTCokuoku
#
time周りは個人的には微妙だなぁと思ってる。
2011/04/17 08:16:29 UTChigepon
#
そうですね。何でこんなことに。
2011/04/17 08:17:04 UTCokuoku
#
たぶん詳しい人がWGに居ないんじゃないかなぁと。。 POSIXじゃなくてPosixだし。
2011/04/17 08:18:55 UTChigepon
#
transcoder に相当すうるものはないのかな。良い仕組みだと思うのだけど。
2011/04/17 08:18:56 UTCshiro
#
define-record-typeは変わったというよりsrfi-9じゃないですか? 「r6rsがdisruptiveに変えた」って印象だなあ。
2011/04/17 08:19:32 UTCokuoku
#
そういういみではerrorとかrecordは単に戻っただけですね
2011/04/17 08:19:35 UTCshiro
#
trancoderは入れると仕様がふくらむでしょう。srfiで良いのでは。r6rsのportまわりはよくできてるとおもうけれど、srfiでまずい理由も思い浮かばない
2011/04/17 08:19:59 UTCokuoku
#
transcoderとか国際化はWG2行きのはず
#
正規表現もWG2だったかな。。
#
でもなぜかSRFI-98はWG1に入った。。
2011/04/17 08:21:13 UTCshiro
#
シンボルの |hoge fuga| は現状追認では。Lispの伝統ですし。ただ、CLでは |foo|bar|baz| はひとつのシンボルとして読まれるけど、そこをどうすべきかな。
2011/04/17 08:21:13 UTChigepon
#
transcoder も正規表現もよくあるテキスト処理に使われるので RnRS でサポートして欲しいなと。そういう意味では Socket も(無理だけど)
2011/04/17 08:21:46 UTCshiro
#
それ言い始めるとまとまりませんよ。srfiで良いじゃないですか。
#
正規表現なんて、ひとつの正しい仕様に合意が取れるとは到底思えない。
2011/04/17 08:23:00 UTCokuoku
#
WG2の位置づけはどうなんだろうなぁ  RFCとSTDの関係で良いんだろうか。
2011/04/17 08:23:57 UTChigepon
#
たしかに<正規表現。
#
正規表現仕様はどこかの言語もしくは処理系の正規表現の仕様に準ずる。細かいことは気にするな。は許されないだろうしなあ。
#
リテラルだけでも決めてもらえると助かるのだけど。
#
そういえば R6RS の Unicode 周り(normalize とか)はやり過ぎ感があったな。
2011/04/17 08:27:57 UTCokuoku
#
今回(scheme base)以外のライブラリは全部オプショナルなので、unicodeの事を一切知らない処理系も一応可能。
2011/04/17 08:28:41 UTCshiro
#
あれも「完全な仕様」を追い求めたせいかと>やり過ぎ感。「こういうエッジケースはどうするの?」とか言い始めるとどんどん肥大化する。「完全に互換性のあるライブラリ書きたいじゃん」と言い出すとそうならざるを得ないんだけど。それをrnrsでやろうとするのが間違いなんじゃないかなあ。
2011/04/17 08:29:40 UTChigepon
#
そういうのは仕様ありきの言語の難しさでもありますよね。本当に必要だと思うものから実装される言語とはちょっと違う。
2011/04/17 08:30:14 UTCshiro
#
穴があったら誰かがsrfi書いて、それをなるべくたくさんの処理系がサポートするようにロビーすればいいんで、先回りして全部穴を塞ごうとするのは多分無理。
2011/04/17 08:30:50 UTChigepon
#
srfi はもっと出したいですね。ちょっと敷居が高いけど。
2011/04/17 08:37:00 UTChigepon
#
list 周りが良い感じだな。
#
list-ref, list-set! 。あと帰ってきた set-car!/set-cdr!
2011/04/17 08:38:13 UTCokuoku
#
stringとpairは最初からmutableになった。
#
ああevalもR5RS仕様に戻ったな。。
2011/04/17 08:39:05 UTCshiro
#
うーmutable stringは複雑。string portではだめな、mutable stringがあると嬉しい応用って何?
2011/04/17 08:39:57 UTCokuoku
#
vectorやblobとの統一感。。
2011/04/17 08:40:23 UTChigepon
#
個人的には string は immutable の方が好きかな。
2011/04/17 08:40:34 UTCokuoku
#
ECMAScriptとかもimmutable stringだったと思うから、世間的にstringがmutableなのってマイナーなのかね。。
2011/04/17 08:42:06 UTCshiro
#
「統一感」は弱いと思うな。vector-carやvector-cdrが無いのは相応の理由があるわけで。
2011/04/17 08:43:16 UTCokuoku
#
あとは正規表現のreplaceが等長のときくらいかなぁ。。
2011/04/17 08:44:01 UTCshiro
#
それってものすごく特殊ケースじゃない?
2011/04/17 08:45:03 UTCokuoku
#
Uppercase→lowercaseとかは比較的頻出だと思う。。
#
string-map!があるわけじゃないから、基本的にmutable-stringでなければ実装が非効率な操作ってWG1の中には無いよなぁ
2011/04/17 08:46:09 UTCshiro
#
case conversionも結構特殊ケースだと思う。言語限定だし。
2011/04/17 08:46:12 UTCokuoku
#
moshのライブラリだとirregexがmutable-stringを使ってるようだ。
2011/04/17 08:47:09 UTCとおる。
#
Objective-C には NSMutableString っていうのがありますね。
2011/04/17 08:47:25 UTChigepon
#
irregex は pure R6RS なのは良いのだけど結局遅いので使い物にならなかったなあ。
#
Gauche no
2011/04/17 08:47:53 UTCokuoku
#
毎回正規表現を生成すると病的に遅くなる>irregex
#
たぶん正規表現は構文が必要。。
2011/04/17 08:48:41 UTChigepon
#
そういえば Gauche の copy-on-write string は初期リリース時からあったのでしょうか。それともアプリケーションの性能要求から後づけ?
2011/04/17 08:48:55 UTCshiro
#
SREみたいにマクロドメインになってればいいんじゃない? (rx "....") で rxがマクロならコンパイル時に一回生成すればいい。
#
Gaucheの文字列本体は最初からimmutableです。multibyte encodingを採用しようと決めた時点で、string-set!の性能は捨てました。
2011/04/17 08:50:22 UTChigepon
#
なるほど。
2011/04/17 08:50:27 UTCokuoku
#
multibyte encodingにしたときってO(1)アクセスにしてますか?
2011/04/17 08:52:04 UTCshiro
#
今はO(N)です。single byteの場合は特別扱いしてO(1)。問題が出たら補助構造をつけようと思ってますが、今までひっかかったことはない。Gauche内部では文字列をインデックスでアクセスすること自体があんまりないし。
2011/04/17 08:52:39 UTCs10d
#
はじめまして。Smalltalk処理系のSqueakのStringはmutableです。商用Smalltalk処理系のVisualWorksだとimmutableですが、インスタンスのisImmutableをfalseにすると mutableに変身しちゃいます。
2011/04/17 08:53:21 UTCshiro
#
それで嬉しいことってどんなことがありますか?
#
文字列の構築には別にプリミティブがあるとして。
2011/04/17 08:54:01 UTCs10d
#
どうなんでしょう(^^;
#
Squeakの場合、単にStringがCollectionクラスの子クラスだからだと思うのですけど。
2011/04/17 08:55:55 UTCとおる。
#
長い文字列のうちの頭の 1 文字を消したい時とか?
2011/04/17 08:56:19 UTCshiro
#
少なくともSchemeのmutable stringは長さを変えられないですよ>1文字消す
2011/04/17 08:56:28 UTCokuoku
#
それはsubstringでいいような。。>1文字けす
#
あ、Schemeのsubstringはコピーするのか
2011/04/17 08:57:11 UTCshiro
#
mutable stringだからコピーしなくちゃならないんですね。immutableなら本体共有できる。
2011/04/17 08:57:15 UTCとおる。
#
長さが変えられないと意味ないですねぇ。
2011/04/17 08:58:32 UTChigepon
#
Are Perl strings immutable? - Stack Overflow http://stackoverflow.com/questions/3395117/are-perl-strings-immutable
#
Perl の文字列は mutable だそうだ。
2011/04/17 08:59:17 UTCとおる。
#
そうそう、ぼくも Perl の文字列があたまにありました。
2011/04/17 08:59:23 UTChigepon
#
それで十分性能が出ているのか。
2011/04/17 09:01:27 UTCとおる。
#
Perl は内部ではマルチバイトじゃないから、まだやりようがあるのかも。
2011/04/17 09:03:26 UTCshiro
#
内部表現まで決める気ならそれでもいいんですけどね。Common Lispの文字列は要素の型に制約がある配列だから、当然mutable。それはひとつの割り切り。
2011/04/17 09:04:47 UTCとおる。
#
Perl だと長い文字列に対して $str =~ s/^.// みたいにして頭から 1 文字ずつ処理するとかやっても遅くならないんですが、長さ固定だとこれが出来ないですね。
2011/04/17 09:12:04 UTCshiro
#
まあでも内部表現をツリーにしちゃえばmutableかつ部分共有はできるし、それほど強硬にimmutable stringを主張するつもりはない。case sensitivityと同じで、次第にmutable stringがオプショナルな感じになってきてスイッチが起きてくれるならそれが望ましいんじゃないかと思う。