Gauche > Archives > 2012/06/29

2012/06/29 02:56:10 UTCとおる。
#
open-with-input-files-or-standard-input とかいう名前にするとか。
2012/06/29 03:00:18 UTCとおる。
#
あるいは、open-with-input-files のなかでは () は特別扱いせず、(open-with-input-ports (and (null? (cdr files)) (list current-input-port))) みたいにすると混乱が少ないかも?
2012/06/29 03:52:08 UTCshiro
#
その後者のやつをもうちょっと短く書けたら採用なのになあと言う感じです。CLだと「引数はファイルまたはポート、もしくはそれらのリストでもいいよ」みたいないい加減さがあって、nilの性質とも相まって (or (cdr files) *standard-input*) でいけるんですよね。この位短いと、毎回書いても負担でないし、何やってるかはっきりわかるのでむしろ好ましい。
2012/06/29 04:05:48 UTCとおる。
#
or でつなげると意味が分かりやすいんですよね。あ、(or (pair? (cdr files))) ... でもいいのか。
2012/06/29 07:56:51 UTCyamasushi
#
(define (open-with-input-files files proc)
  (cond
    [ (input-port? files) (proc files ) ]
    [ (list? files)
     (for-each 
       (lambda (f)
         (call-with-input-file f proc))
       files) ] 
    [else (error "error")]
    ))

(define (main args)
  (if (null? (cdr args))
    (usage)
    (let ((rx (string->regexp (cadr args))))
      (open-with-input-files 
        (match (cddr args)
          [() (current-input-port)] [x x] )
        (cut grep rx <>))))
  0)
#
matchをつかってみました。
#
文字列ならglobとみなしてしまうとダイヤモンド演算子っぽくなりそうですね。
2012/06/29 08:06:24 UTCshiro
#
ふむ。コマンドラインツール用ユーティリティと割り切るならglob展開も「()ならstdin」もアリだと思う。
2012/06/29 08:20:48 UTCyamasushi
#
もしくは、文字列ならファイル名ということにすれば、open-with-input-fileを拡張してポートとリストを受け入れるようにしたという解釈もできないことはない・・・・?
#
このあたりは文化の問題になりますか。
2012/06/29 08:28:32 UTCyamasushi
#
(define (call-with-input-files files proc)
  (cond
    [ (input-port? files) (proc files ) ]
    [ (string? files) (call-with-input-file files proc) ]
    [ (list? files)
     (for-each 
       (lambda (f)
         (call-with-input-file f proc))
       files) ] 
    [else (error "error")]
    ))

(define (main args)
  (if (null? (cdr args))
    (usage)
    (let ((rx (string->regexp (cadr args))))
      (call-with-input-files 
        (match (cddr args)
          [() (current-input-port)] [x x] )
        (cut grep rx <>))))
  0)
#
名前を間違えていました。(汗
2012/06/29 11:53:05 UTCkoguro
#
コマンドラインツールを簡単に作るのが目的なら、いっそのこと、ここまで簡略化したらどうでしょう。
#
(define-command-line-tool tool-name
  [(var option-spec description ...)
   ...]
  ;; ツール本体の処理
  )
#
よくあるオプション(-h / --helpとか)は決め打ちにしてしまえば、usageは自動生成できるはず。
2012/06/29 12:17:01 UTCshiro
#
それも一理あります。ただ、色々暗黙のルールを組み込んだ特定用途マクロって、錆びつくのが速いというか、しばらく使わない→使い方忘れる→マニュアルをひっくり返してルールを頭にロードするのが億劫→ますます使わなくなる、っていうパターンに落ちそうなのがちと怖い。
2012/06/29 12:20:20 UTCkoguro
#
たしかにそうですね。でも、ダイヤモンド演算子のような引数の扱い方って、コマンドライン以外では使いにくいので、思い切って特化しちゃったほうがいいんじゃないかなと思いました。
#
個人的にはダイヤモンド演算子が持つ「コマンドライン引数にファイル名が指定されていたら、そこから読む/なければ標準入力」という機能が便利さが、いまいちピンと来ないのですが。
#
標準入力から読むように作っておいて、必要ならコマンドラインで "cat file1 file2 | gosh cmd.scm" で渡せばいいと思ってしまうので。
#
よく使い込むなら、ちゃんと作りこみますし。
2012/06/29 12:26:30 UTCshiro
#
まあ自分で使うだけならそれでもいいけれど、周辺のツールと使いでを合わせたのをちゃちゃっと作りたいとかいう時もあるんですよね。
2012/06/29 12:38:45 UTCyamasushi
#
ポートについての処理だけすげ替えて使いまわすということをやってしまうので、書き換えるポイントが少ないほうがいいなあと思ったのでした。
#
マニュアルのcat,grepだと書き換えるポイントが複数ある。そこで変更するホットスポットを絞り込む、といった狙いでした。
#
そのためには、ファイル名のリストとポートの処理を統合した手続きがあると都合がいいということです。
2012/06/29 12:46:58 UTCshiro
#
それはわかります。Gaucheとしてサポートするとしたら特定化と一般化のバランス点を決めないとならなくて、私の感触では「catやgrep的なものを簡単に書ける」のに特化するのはちょっと特定化の方に触れすぎてるなって感じがしてるだけで。
2012/06/29 12:48:04 UTCyamasushi
#
なるほど。
2012/06/29 12:49:30 UTCshiro
#
でもコマンドラインツールをばりばり書いている人にとっては、それでも十分に汎用的と言えるかもしれず、そのへん色々意見を聞きながら見極めたいところです。
2012/06/29 12:51:20 UTCyamasushi
#
ファイル名のリストから仮想的なポートを生成する、という方向での一般化が筋なのかもしれないですね。あたかも一つのファイルを読んでいるように見えて、じつは数珠つなぎになっているというようなポート。
#
そういうポートができたとすれば、また違った表現になってくるのかなあと思いました。
2012/06/29 12:54:53 UTCshiro
#
port-concatenateの方向ですね。これは有用だと思います。今読んでる入力元をメタデータで取れるようになってばなおよし。
2012/06/29 12:56:23 UTCkoguro
#
すみません、ちゃんと議論を追っていないんですが、複数のファイル名があったときにそれを1つのポートにまとめられると、どんなときにうれしいんでしょうか?
#
(for-each (cut call-with-input-file <> proc) file-list)
#
こんなんだと困るケースがある?
2012/06/29 12:58:33 UTCshiro
#
「ファイルを次々読むor標準入力から読む」という動作と、「一連の入力に対して何かする」という動作を別個に書いて組み合わせやすい、という方向の良さなんじゃないかな、という感触。
2012/06/29 13:00:58 UTCkoguro
#
「一連の入力に対して何かする」というのは、内部状態を変更しつつ、処理を行うというイメージでしょうか?
2012/06/29 13:02:07 UTCshiro
#
「catやgrepのような処理」って感じですね。今の文脈では。
2012/06/29 13:02:51 UTCkoguro
#
catやgrepなら、先のfor-eachでいいような気がする。
2012/06/29 13:04:09 UTCyamasushi
#
再帰的にディレクトリを巡回しつつ「連結ポート」をつむいでいくようなこともできるのだろうか?とか思いました。
2012/06/29 13:04:13 UTCkoguro
#
ああ、catだと行番号表示があったか
2012/06/29 13:04:34 UTCshiro
#
「catやgrepのようなコマンド」をあと10個書かないとならないとすれば、(if (null? arglist) (proc (current-input-port)) (for-each ...))) の繰り返しパターンを抽象化したくなりませんか? 「あと10個書く」が一般的かどうかってとこに議論がありますが。
2012/06/29 13:05:43 UTCkoguro
#
うーん、それを言ってしまうと先の define-command-line-tool まで抽象化したほうがいいんじゃないでしょうか。
2012/06/29 13:05:54 UTCyamasushi
#
ファイル名のジェネレータから連結ポートをつくるということになるかな?とか。
2012/06/29 13:06:52 UTCkoguro
#
そのユースケースってコマンドラインツールを作る以外の箇所でよく出てきたりするんでしょうか?
2012/06/29 13:08:25 UTCshiro
#
それをここずーっと話してるわけですよ。私としては、コマンドラインツールはそこまでたくさん書くものじゃないから、何かつくるとしたらもう少し一般的なパターンとして取り出したい。とすればどういうパターンがあり得るか。これかなあれかな、ってぐるぐるやってるのです。
#
連結ポートだとファイルごとに行番号を管理するようなやつがやりにくいか。とするとそれほど汎用的ではないかもしれない。
2012/06/29 13:15:05 UTCとおる。
#
ちょっとずれますけど、個人的には、ワンライナーが書きやすいとコマンドラインツールとして使いやすそう。$ つかえばいいのかな。
2012/06/29 13:17:46 UTCkoguro
#
個人的にはコマンドラインツールを作るときに一番面倒なのが、引数の処理で、あんまり port の方で面倒と思うことは少ないような気がする。
2012/06/29 13:19:25 UTCyamasushi
#
perlの-n,-pのようなものがあればいいですね。(そこでダイヤモンド演算子が(略)
2012/06/29 13:20:43 UTCとおる。
#
perl -ape みたいな感じがやりたくて、むかし ape.scm っていうのつくりました(笑)。 http://torus.jp/memo/x200810/ape-scm.html
#
標準入力しかうけつけないけど。
2012/06/29 13:22:45 UTCshiro
#
gosh自体に機能を増やすことはしないけど、そういう感じの「ワンライナー向け便利ライブラリ」はあってもいいかもね。
2012/06/29 13:28:30 UTCとおる。
#
ただそうなると、Perl や awk のBEGIN ブロックに相当する物が欲しくなったりするので、ちょっと見方を変えた方がいいと思うんですよね。