Gauche > Archives > 2009/05/22

2009/05/22 00:47:58 UTCとおる。
#
ありがとうございます。js.scm で十分かも。
2009/05/22 03:15:26 UTC(び)
#
DNFに懲りずに100kmのトレイルレースに申し込んでしまった
#
がんばってトレーニングしないと絶対完走できないな...
2009/05/22 03:58:31 UTCはやみず
#
Gaucheって __FILE__ 的なものってあるんでしょうか。探してみたけどみつからなかった、、、
2009/05/22 04:01:35 UTCshiro
#
それは昔ちょっと要望が出たことがあるんですが、Cプリプロセッサとセマンティクスが違うのでうまくいかないんです。
#
ソースコード上の位置はextended pairに記録されているのでそれを取ることはできます。
#
で、自分自身のソース名と行番号を取れるマクロ (例えば (__FILE__)) も書ける。
#
ところが、この__FILE__の使用を隠すためにもう一段マクロをかますと
#
例えば (define-macro (MALLOC x) `(debug-malloc ,x (__FILE__) (__LINE__)))
#
Cプリプロセッサ的にはMALLOCを実際に使った場所の__FILE__, __LINE__を取れることを期待するわけですが
#
「ソース上の」__FILE__, __LINE__の位置はMALLOCマクロの定義された位置であって、MALLOCマクロがどこで使われるかとは関係ない
#
わけなので、役に立たなかったと。
#
もしGaucheで書くのなら、「マクロに渡されたフォームのソースコード情報を抜き出して使う」ようなマクロにする必要がありますね。
2009/05/22 04:09:33 UTCはやみず
#
たしかに、↑のdebug-mallocの例だとそうですね
2009/05/22 04:09:49 UTCshiro
#
gosh> (define-macro (with-srcinfo form) `(,(car form) ,@(cdr form) (debug-source-info ',form)))
#<undef>
gosh> (define (test lis srcinfo) (print lis "@" srcinfo))
test
gosh> (begin (with-srcinfo (test '(1 2 3)))
(with-srcinfo (test '(4 5 6)))
(with-srcinfo (test '(7 8 9))))
(1 2 3)@((stdin) 31)
(4 5 6)@((stdin) 32)
(7 8 9)@((stdin) 33)
#<undef>
#
こんな方向でなんとかできるかもしれない。
2009/05/22 04:11:34 UTCはやみず
#
今やりたいことはもっと単純で、あるscmファイルAからloadしたいファイルBがあって、AからBへの相対パスだけはわかっていると。
#
__FILE__的なものがあれば、Aの中から簡単にBのパスを計算できるかなと思ったんです。
2009/05/22 04:13:40 UTCshiro
#
あ、それならそういうのがあります。
#
どれだったかな。
2009/05/22 04:14:29 UTCはやみず
#
やっぱりありますか。絶対あるだろうとは思って探したんですけどみつからなくて。
2009/05/22 04:15:50 UTCshiro
#
直接は取れないんですが、(port-name (current-load-port)) で(ファイルからロードされていれば) そのファイル名が取れます。
#
ただし、ファイルからロードされてなかった場合にそうでないことを簡単に検出できないんですが
#
文字列かどうか調べて、さらにそのファイルの存在を調べればほぼ大丈夫でしょう。
2009/05/22 04:20:23 UTCはやみず
#
おおお。これでいけそうです。ありがとうございます。
2009/05/22 04:36:47 UTCshiro
#
そういえばこういう話の流れでload-relativeっていうのを作ろうかどうしようか考えたことがあったのを思い出した。
#
結局どうしたんだっけな。loadのkeyword argumentでサポートするか、別関数にするか決めかねている段階で止まっていたような気がする。
2009/05/22 04:57:52 UTCとおる。
#
http://blogs.wankuma.com/episteme/archive/2009/05/21/173311.aspx
#
C++0x のラムダ式。
2009/05/22 04:59:41 UTCshiro
#
構文は慣れの問題だろうけれど、lambda式の嬉しさのひとつは簡潔性だろうから、型を全部書かなきゃいけないとなると嬉しさ半減だなあ。型推論は入ってくれないのかなあ。
2009/05/22 05:01:54 UTCとおる。
#
型推論は一応 auto っていうのがはいるんですよね。
#
あとは、template かな。
#
http://www.nntp.perl.org/group/perl.perl6.compiler/2009/05/msg4240.html
#
Perl6 の演算子すごいですねぇ。
#
非 ASCII 文字だけでプログラムかけそう。
2009/05/22 05:05:14 UTCshiro
#
化けちゃってるっぽいんだけどutf-8で見れた?
2009/05/22 05:05:51 UTCとおる。
#
あ、はい。
#
>>O”<< みたいな記号です。
#
sub infix:<ö>($x, $y) { say "flyyy" }; (1,2,3) »ö« (4,5,6)
#
お。貼れた。
2009/05/22 05:07:46 UTCshiro
#
あれ、こっちだとちゃんと見える。
#
これで絵文字もunicodeに入ったらカオスだな。
2009/05/22 05:21:26 UTC(び)
#
化けているのかどうかの判断に、文化的背景が響いて来るかも
#
でも、APLもそういうんじゃなかったけ? あと、初期のSmalltalkとか
2009/05/22 05:23:26 UTCshiro
#
APLは一応文字セットは決まってたからなあ (そんなに多くない)
#
タイプの「重ね打ち」でもって組み合わせができたから種類がたくさんに見えるけど
2009/05/22 07:10:37 UTCとおる。
#
たしかに、ちゃんと表示されていても文字化けに見える :D
#
( ・ิω・ิ)これの眉毛とかも重ねうちですよね。
2009/05/22 07:14:38 UTC(び)
#
Carbon Emacsに貼付けると化ける...
2009/05/22 07:16:33 UTCとおる。
#
Carbon Emacs はフランス語の ç とかは大丈夫なのかな?
2009/05/22 07:17:12 UTCshiro
#
ああ、いやとおるさんのリンクの先をfirefoxで見ると、<Aの上ににょろっとした記号> <パラグラフ記号> のように見えるのですよ、演算子の部分が。
#
utf-8にしてるんだけどなあ。
#
sub infix:<ö>($x, $y) { say "flyyy" }; (1,2,3) »ö« (4,5,6)
#
貼ってみた。こっちからだとやっぱり化けてる。
2009/05/22 07:20:10 UTC(び)
#
Safari3でも化けて見えますね
2009/05/22 07:20:13 UTCとおる。
#
ああ、ぼくも、Google Reader でみるとそう見えます。
#
sub infix:<ö>($x, $y) { say "flyyy" }; (1,2,3) »ö« (4,5,6)
#
同じページにあるほかの文字に影響をうけるのかも。
2009/05/22 07:21:02 UTC(び)
#
いけますね >ç
2009/05/22 07:22:48 UTCとおる。
#
UTF-8 でも、どの言語かの判断をまちがえると、正しいフォントが選ばれないんですよね。
2009/05/22 07:24:26 UTCshiro
#
むー、でも上の化け方は本来1文字が2文字の扱いになってるので、フォントの問題ともちょっと違うような。とおるさんが貼ったオーウムラウトの方は一文字扱いになってる。
#
http-getしてみたがちゃんとオーウムラウトで来てるなあ。
#
Firefoxが何かしくじってるのかな。
2009/05/22 07:27:13 UTCとおる。
#
たしかに、Shift JIS みたいな化け方ですもんねぇ。
#
ö
#
öö
#
öö
#
あーでも、フォントによっては合字として実際には 2 字で表されることがあるのかも。
2009/05/22 07:58:43 UTCとおる。
#
lucille% echo -n "ö" | od -t x1
0000000    c3  b6                                                        
0000002
lucille% echo -n "ö" | od -t x1
0000000    c3  83  c2  b6                                                
0000004
#
メモリアクセスのバグかな?
2009/05/22 08:04:11 UTCshiro
#
いや
#
オーウムラウトをLatin-1として解釈してる。
#
(Latin-1のc3 = Ã 、 b6 = ¶ )
#
でもencodingはutf-8にしてるし、Page Infoでもそう出てるのにな。
2009/05/22 08:31:18 UTC(び)
#
既出の話かもしれませんが
#
あるファイルをuseした時はライブラリとして、gosh ファイル名 で起動した時にはコマンドとして機能するように書きたい時
#
どうするのが一番オーソドックスなのでしょう?
2009/05/22 08:32:33 UTCshiro
#
ああ、個人的にあんまりそういうニーズが無いのでちゃんと考えてなかったですね。
2009/05/22 08:32:52 UTC(び)
#
kahua-server.scmがそれに近いことをしてるんだと思うんですが
2009/05/22 08:33:34 UTCshiro
#
*program-name*を調べればいいかな。
2009/05/22 08:34:03 UTC(び)
#
define-moduleして、select-moduleして、ライブラリの中身を書き、provideして(kahua-serverではやっていない)、(select-module user)してからmainを定義してる
#
でもこれだと、useした時に、モジュールuserにmain関数が定義されちゃいますよね
2009/05/22 08:34:41 UTCshiro
#
ああ、最後に(select-module user)してmainを定義する、っていうのは自分もよくやります。
2009/05/22 08:35:06 UTC(び)
#
どうせ他のプログラムで使ったときはそいつのmainで上書きされるから無問題?
2009/05/22 08:35:17 UTCshiro
#
useされるケースを想定してるわけじゃなくて、define-moduleしとくとtest-moduleでテストされるから便利というだけ
2009/05/22 08:35:28 UTC(び)
#
ああなるほど
2009/05/22 08:35:59 UTCshiro
#
userモジュールにmainを定義しちゃうと、ただloadしたいだけでも実行されちゃうからまずいんじゃないかな。
#
< 他にuseされた場合、の話。
2009/05/22 08:36:25 UTC(び)
#
ふむ
#
useした時だけある関数定義を無効にするようなプラグマはある?
2009/05/22 08:37:38 UTCshiro
#
いや、今のところ自分がuseで呼ばれたのかどうかってのはわからないですね。内部的にuseはloadを呼んでるし、コマンドラインでスクリプトファイルとして指定された場合もloadを呼んでるわけで。
2009/05/22 08:37:51 UTC(び)
#
なるほどね
2009/05/22 08:39:01 UTCshiro
#
*program-name*を調べるのも必ずしも安全ではないな。たまたまbasenameが同じ名前のスクリプトからuseされる可能性もある。
#
current-load-historyを調べれば、自分が他のファイルを経由してloadされたのか、システムから直接loadされたのかはわかるけど
#
-uオプションとかでuseされた場合は他のファイルを経由してないので、スクリプトファイルとしてロードされたのと区別できない
2009/05/22 08:40:43 UTC(び)
#
ふむ
#
案外一筋縄ではいかないですね
2009/05/22 08:41:08 UTCshiro
#
[
#
「スクリプトとして読んでますよ」フラグがあるのが一番すっきりするかなあ。
#
mainを定義することはできないけれど、mainを定義しなくてもトップレベル式は評価されるので、
#
(when (load-as-script?) スクリプト時の処理) と書いてしまうことはできる
2009/05/22 08:42:53 UTC(び)
#
その場合、コマンドライン引数は *argv* 経由で処理?
2009/05/22 08:45:06 UTCshiro
#
そうなりますね。mainの方が綺麗なんですけどね。
#
もしくはcond-expandのfeatureとして見せてしまうか。
#
スクリプトとして読まれたファイルのロード時のみ、gauche.script というfeatureが真になる。
#
そしたら (cond-expand [gauche.script (define (main args) ...)] [else]) とか書ける。
#
ロードの仕方によってfeatureが変わるのは微妙だけど。
2009/05/22 08:52:06 UTC(び)
#
確かに、featureとするのは微妙な感じはしますね
#
でもそれが一番すっきりする気もする
2009/05/22 09:20:24 UTC(び)
#
最近、Gaucheの日本語infoのIndexだけ化けるなぁと思っていたら、昔/usr/local/binに野良ビルドして入れていたmakeinfoが悪さをした模様
#
思わぬところに地雷がorz
2009/05/22 09:21:36 UTCshiro
#
ありがち
2009/05/22 09:24:25 UTC(び)
#
よし直った
2009/05/22 09:44:05 UTC(び)
#
gauche.listener同士で会話させることを考えた場合、出力もバッファリングしてやるようにしないと、デッドロックする可能性ありますよね?
2009/05/22 09:44:22 UTCshiro
#
そう。うー、頭の痛い問題だ。
#
直接writeするのではなく、一度バッファに書き出した上で、
2009/05/22 09:48:07 UTC(び)
#
with-output-to-stringでいったんプリンタの出力を受けて、write-blockか何かで出せるだけ出していく、って感じかな
2009/05/22 09:48:26 UTCshiro
#
writableな時に一度だけ書くってのは出来たっけな。
#
何か面倒な問題がどっかにあったような気がするんだけど
2009/05/22 09:51:52 UTC(び)
#
今、gauche.listenerをつらつら眺めているんですが、string-append使ってたり、プログラム間で巨大なS式をやり取りするにはちょっと効率悪いかも?
2009/05/22 09:52:09 UTCshiro
#
ああそうだ。flushは確実に全部のデータがwriteされるまで戻ってこない
2009/05/22 09:52:28 UTC(び)
#
おお
#
write-blockできたと思ってflushすると刺さっちゃうかも、か
2009/05/22 09:52:52 UTCshiro
#
そうそう。
2009/05/22 09:52:57 UTC(び)
#
bufferingをnoneにすればOK?
#
ポートの
2009/05/22 09:53:09 UTCshiro
#
いや、bufferingは途中のflushのタイミングを決めるだけで、
2009/05/22 09:53:16 UTC(び)
#
ああそうか
2009/05/22 09:53:28 UTCshiro
#
途中のimplicitなflushのタイミングを決めるだけで、明示的なflushは…
2009/05/22 09:53:30 UTC(び)
#
うーん、それはまずいかも
2009/05/22 09:54:06 UTCshiro
#
partial flushというか、「書けるだけ書いて、残りがあるかどうかの値を返してくれる」というapiがあるといいのかな。
2009/05/22 09:54:32 UTC(び)
#
そうですね
2009/05/22 09:54:56 UTCshiro
#
> string-append使ってたり: もともとプログラムにちょろっとREPLをつけて人間が使うような用途を考えてたんで、そこは手を抜いてあります。
2009/05/22 09:55:05 UTC(び)
#
なるほど
2009/05/22 09:55:43 UTCshiro
#
本格的にプログラム間の通信につかうなら、汎用的なバッファ構造を実装することになるでしょう。この機会にやっちゃってもいいかも。
2009/05/22 09:55:46 UTC(び)
#
最初はgauche.listenerを使ってプロトタイプを書いて、パフォーマンスに問題が出るようなら根っこから書き直すという感じがいいかな
#
S式の読み書きを安全にやりたいというのは、Kahuaに関わり始めてからずっと考えてました
2009/05/22 09:56:34 UTCshiro
#
そうですね。その過程で現在のgaucheの足りない点を洗い出してもらえれば、対応します。
2009/05/22 09:57:59 UTC(び)
#
partial flushはあると嬉しいかも
#
listenerをうまく使うと、普通のインターネットアプリケーションが簡単に書けるなぁ、と考えているので
#
例えばHTTPdとか
#
パイプライニングのないものならたいてい書けちゃう
#
もだんなHTTPdだとだめか orz
#
fingerdとか(笑)
2009/05/22 10:01:08 UTCshiro
#
ふーむ、listenerをそういうふうに考えたことはなかったなあ。
2009/05/22 10:01:45 UTC(び)
#
sendmailとかpop3dにtelnetでつないでインタラクティブに使ったりすると、それがREPLに見えてきません?
2009/05/22 10:01:48 UTCshiro
#
readとprintの部分が自動的にコルーチン化されて並行実行されるのがアドバンテージか…でもevalの部分はシングルスレッドになっちゃうよね。
#
確かに>REPL
2009/05/22 10:02:02 UTC(び)
#
そうなんですよね
2009/05/22 10:02:13 UTCshiro
#
今までS式の発想しかなかった。
#
ふむー、するとevalの部分もうまい具合にコルーチン化するか、あるいはスレッドプールと組み合わせられるようになってると
2009/05/22 10:02:46 UTC(び)
#
だから、本格的なものを作ろうとすると、evalの部分まで多重化する必要が出てくるのだけど
2009/05/22 10:02:54 UTCshiro
#
request-reply型のサービスがみんなlistenerでサポートできちゃうのかな。
2009/05/22 10:03:06 UTC(び)
#
じゃないかな、と思ってます
#
パフォーマンスとか並列実行性をサポートするとなると、listenerの枠組みからはみ出るかもしれませんが
2009/05/22 10:04:16 UTCshiro
#
いや、これは方向としてとっても筋がいいと思う。
#
request/reply handlingのところがフレームワークやアプリケーションで書かれていると、テストする時にどうしてもフレームワークやアプリケーションを全部ロードしないとならないってことになりがちで、腰が重くなるなあと感じてたんですよ。
#
もちろん綺麗に分離して書いとけばいいんだけど。さくっと書くとついつい密結合になっちゃう。
#
標準モジュールでそこが綺麗に分離されて共通部分がサポートされてると、テストはevalの部分に集中できる
#
listenerはモデルとしてシンプルなんで、裏で性能のためにごちゃごちゃやったとしても、開発者の精神的な「重さ」が無いんじゃないか、という気がする。
2009/05/22 10:07:49 UTC(び)
#
その手のアプリを書いてると、read-printの部分は毎回同じようなものを書くじゃないですか
2009/05/22 10:07:55 UTCshiro
#
そうそう。
#
chatonでもなんだか似たようなことやってるなと思いながら書いてた。
2009/05/22 10:08:58 UTC(び)
#
性能と手軽さのバランスが難しそうだけど、とっつきとしてはやりやすいんじゃないかと思ってます >listener
2009/05/22 10:37:27 UTCshiro
#
http://www.math.ohio-state.edu/~nevai/ERDOS/erdos_washington_post.html ポール・エルデシュについての記事。とても良い。hacker news経由で。
2009/05/22 10:56:21 UTCとおる。
#
Perl に POE っていうモジュールがあるんですが、
#
これは、非同期のネットワーク通信のフレームワークで、
#
(び)さんがいっているのにもしかしたらちかいかも。
#
アプリケーションをイベントドリブンでかける。
#
POE 自体は、ネットワークとは関係ないかな。汎用のイベント駆動フレームワーク。
#
http://poe.perl.org/
#
ぼくはつかったことないんですけど。
2009/05/22 11:18:08 UTC(び)
#
RubyにもFiberとの連携で同じようなことをするライブラリがあったと思う(名前忘れた)
#
あと、PythonのTwistedにもあったような
#
でも、そこまで大規模なものが欲しいわけじゃないのだよね
2009/05/22 11:21:31 UTCshiro
#
フレームワークを書こうとすると大掛かりになっちゃうから
#
listenerに毛を生やすところからはじめてけばいいと私も思う。
2009/05/22 11:24:35 UTC(び)
#
ただ、現状のlistnerはS式縛りになってるんですね
#
だから、Kahuaに使うのは問題ないけど、一般的なrequest/responseアプリに使うには、complete-sexp? をカスタマイズ可能にしなきゃいけないのかな
2009/05/22 11:25:27 UTCshiro
#
ですね。
2009/05/22 11:26:05 UTC(び)
#
それと書き込みのバッファリングをするところまでやったら骨組みができるから、そこからどうチューニングしていくかを考えればいいんじゃないかな
#
とlistener-read-handlerの実装を見ながら考えております
2009/05/22 13:36:06 UTCkiyoka
#
スクリプトを書いて、Lingrの過去ログのニックネームが取得できたっぽいです。
#
sxpathをもっと使いこなせるようになりたい...
#
wgetで取得したHTMLからhtmlpragでS式に変換して sxpathで抜き出ししました。
#
といっても、sxpathだけで綺麗に書けたわけではなく...
#
後日、ニックネームのデータもあわせて公開します。
2009/05/22 14:25:07 UTCえんどう
#
乙です>kiyoka
#
wgetしたHTMLを公開するというのはどうだろう。
2009/05/22 14:31:44 UTCkiyoka
#
wgetしたHTMLってどう見えるんでしょうか。まだ試してみてないです。CSSとかアイコン画像とかどんな風になるんだろう。
2009/05/22 14:36:54 UTCkiyoka
#
どうやら、wgetしたhtml中のURLはlingr.com上のURLになってますね。wgetのオプションでローカルに置換できるかな。
#
今私がwgetしたデータだとlingr.comがシャットダウンしてしまったら、レイアウトがくずれたりアイコンが出なくなったりしますねぇ。
#
wgetのオプションにはURL置換機能は無さそうですね。
#
あっ、--convert-links これか。
2009/05/22 14:43:34 UTCえんどう
#
そんなオプションが>wget
2009/05/22 15:01:01 UTCkiyoka
#
--convert-links オプション付けて取得したデータと、付けないで取得したデータをdiff取ったが、URLの置換は行われてなかった。
#
wgetって、HTMLの改ざんなんか本当にするのかなぁ。
2009/05/22 15:06:25 UTCkiyoka
#
wget -p --convert-links -m -np -x http://www.lingr.com/room/gauche/archives/
#
これでやってみたけど、置換が行われないよ。
#
まあいいや。OldTypeに置換してみるのも一興かな。
2009/05/22 15:10:19 UTCえんどう
#
cssやjsは変換してくれないみたい>--convert-links
2009/05/22 15:10:55 UTCkiyoka
#
そうですね。wgetごときに完璧なHTMLパースを求めてはだめかな。
#
Firefoxの「別名でページほ保存」というメニューでは完璧にローカル化してくれるんだけど、リンクのクローリングはしてくれない。
#
その両方を満たすソフトは、ありそうな気もしますね。
2009/05/22 15:13:05 UTCえんどう
#
Spydering Hacks?
#
Spideringか
2009/05/22 15:15:23 UTCkiyoka
#
http://amb.vis.ne.jp/mozilla/scrapbook/feature1.php?lang=ja
#
ScrapBookというプラグインがあるようです。
#
掘り下げ取り込み機能という、直訳的な名前の機能があるようですね。
2009/05/22 15:30:28 UTCkiyoka
#
いま、ScrapBookを試しに使ってみてます。使い物になればいいな。
2009/05/22 15:55:35 UTCkiyoka
#
ScrapBookでうまく全データ取れたっぽいです。
2009/05/22 20:56:28 UTCとおる。
#
listener の input-port に ssax:xml->sxml を噛ますと XML が読めるようになったりします?
#
ぼくがいまつくってる webchat も、あとで下層の CGI 部分を切り離して、別の入出力モジュールに取り替えられるようにしようと思っているんですが、
#
そこが listener に
#
置き換えられると楽かも。
2009/05/22 20:58:15 UTCshiro
#
それだとXMLが完結するまでポートから読み出せない=readが帰って来ないので、listenerのメリットが半減するんじゃないかなあ
2009/05/22 20:58:39 UTCとおる。
#
ああ、そこでブロックしちゃうんですね。
#
じゃあ読めるだけ読んで、整形式の XML かどうかを確かめて、整形式じゃなければ、バッファにためるっていうのを作ればいいのかな。
#
むかしそういうのを C++ で作ったことがありますが、めんどくさかった……。
#
あ、昔作ったのは Flash の XMLSocket 用で、これはなぜか XML 文書の最後をヌル終端するという決まりがあったので、比較的やりやすかったんでした。