Gauche > Archives > 2010/07/02

2010/07/02 00:00:41 UTCnobsun
#
「ソースから演繹できる情報を全て使って...」< それが静的解析ってもんです。♪り、り、りすばーこい、こっちのみーずはあーまいぞ :)
2010/07/02 00:05:08 UTCshiro
#
そうなんだけど、動的言語だってコンパイラは静的解析やってるわけで、言語として動的静的って話じゃないってこと。
2010/07/02 00:24:25 UTCnobsun
#
それはそうなんだけど、どこまで静的解析ができるかは言語の性質にかなり依存するのではということ。
2010/07/02 00:32:20 UTCshiro
#
どういった情報を、いつまでに確定させておくか、という見方をすると、動的/静的というのは0/1ではなく、連続したスペクトルと考えた方が自然だよね。
#
静的型というのは、「コンパイル時までにこういうフレームワークで情報を確定させておくといろんな性質が解析しやすい」っていう体系
#
そう観るとHaskellは面白いな。メタ情報については早めに確定、実行時の情報についてはできるだけ確定を遅らせる、というアプローチか。
2010/07/02 00:35:32 UTCnobsun
#
もし実行というフェーズがはっきりとあるなら、その前後で。
#
かぶった。
2010/07/02 00:37:02 UTCshiro
#
LispのREPLセマンティクスでは、ある式の定義/評価はそれまで積み上げられた環境に対して行われるわけだけど、その環境にある情報は(メタ情報であろうと、実行時データであろうと)利用できる。
#
たとえばGaucheのtrunkで、
#
(use srfi-1)
(define-constant ones (circular-list 1))

(define-inline (foo x) (if (pair? x) (car x) #f))

(define (boo) (foo ones))
2010/07/02 00:40:04 UTCnobsun
#
Lispには定義と実行が混在するので
2010/07/02 00:40:17 UTCshiro
#
こんな定義をすると、booのコンパイル時にはfooもonesも値が確定しているので、booは単なる定数関数になる。
#
gosh> (disasm boo)
CLOSURE #<closure boo>
main_code (name=boo, code=0xab83a0, size=2, const=0, stack=0):
args: #f
     0 CONSTI(1) 
     1 RET
#
これは型情報を使ってないけれど、静的解析ではあるよね。
2010/07/02 00:42:01 UTCnobsun
#
「動的/静的というのは0/1ではなく、連続したスペクトルと考えた方が自然」ということかな。
2010/07/02 00:44:44 UTCshiro
#
Haskellでさ、メタ情報に関する遅延計算っていうのはあるの? つまりコンパイル時には型が完全に確定しなくて、実行時に与えれる情報を見て初めて確定するような。
#
s/与えれる/与えられる/
2010/07/02 00:48:22 UTCnobsun
#
型に関してはないと思う。unsafeCoerceとか変なの以外は
2010/07/02 00:50:20 UTCshiro
#
あ、問いの立てかたが変か。「型情報」は「実行前までに確定できる情報」なんだとすれば、by definitionでそういう計算はない。でも、少しでも多くの情報をメタの方に押し込められるように「型情報」の仕組み自体がどんどん拡張されている。そんな感じ?
2010/07/02 00:56:30 UTCnobsun
#
個人的な感覚では、実行時にきまるものは外界からの入力で、それ以外はすべて静的に定まるもの。「型情報」そのものは静的なものとして扱う。「型情報」の仕組みの進化は、「型」をどれだけ抽象的に扱えるかという方向に拡張されているという感じ。
2010/07/02 00:58:01 UTCshiro
#
依存型みたいなものは型を拡張して少しでも実行時の情報を実行前に移す試み、と見れない?
2010/07/02 01:03:08 UTCnobsun
#
うーん。入力が絡めばそうみなせるけど、そうでなければbooの例と同じで最初から確定しているとも見なせますよね。
2010/07/02 01:04:49 UTCshiro
#
例えばユーザ入力値がvalidateされて非負であることが確定してる、とかさ。booの例だって(define-constant x (read)) ってすればユーザ入力値になるよ。
2010/07/02 01:05:49 UTCnobsun
#
「入力があれば」もちろん、そうです。
2010/07/02 01:07:19 UTCshiro
#
そこで入力をとりたてて区別する必要とは? Haskellが、区別した方が都合が良いって立場を取ってるから区別するってのはわかるんだけれど。
2010/07/02 01:07:30 UTCnobsun
#
これも個人的感覚ですが、評価すれば決まるものは静的情報で、実行しなければきまらないのが動的情報
2010/07/02 01:08:00 UTCshiro
#
その感覚はわかるけれど、それ
#
それは「そう決めたからそうなんだ」以上のことを言ってない気がする。
#
ソースコードもユーザ入力も全部インクリメンタルに与えられる情報の一片であって、処理系がひたすらそれまでの情報を総合してpartial evaluationをやっている、というありかたもありで、本質的に優劣があるわけじゃなく、「どういう立場を取ったらどっちの方が都合が良いか」という話になりそうな。
2010/07/02 01:09:42 UTCnobsun
#
うーむ。そう決めた理由ということですよね。
2010/07/02 01:10:41 UTCshiro
#
ごめんちょっと出かけます。
2010/07/02 01:11:00 UTCnobsun
#
たぶん、Haskellでは参照透明な記述を堅持するということです。
#
了解
#
私も出掛けます
2010/07/02 01:43:04 UTCshiro
#
ユーザ入力だと話がわかりにくいけど、例えば、アプリケーションのユーザ設定ファイルなんてどうだろう。そこに書かれた式は静的情報か動的情報か、っていうのは、実行という線をどこに引こうと決めたか、って差にすぎないのでは。
2010/07/02 02:02:34 UTCnobsun
#
もちろん実行という線をどこに引くかという問題なんですが、私としてはプログラム(算譜)にはない情報を与えるのが実行という感覚でいます。ここに固定するのがブレがなくてよいと思います。(移動中なので、返事が中途半端にとぎれます)
2010/07/02 02:05:50 UTCshiro
#
しかし、ユーザ設定ファイルの例のように「どこまでがプログラムか」という線は曖昧であって、むしろ「ここから先の情報は今はわからない」と判断した時点までの情報がプログラムである、としか定義できない。とすれば「プログラムに無い情報を与えるのが実行」というのはトートロジーになってしまう。
2010/07/02 02:26:31 UTCnobsun
#
プログラムの境界については,プログラムの正しさというものを考えれば自ずと境界ははっきりすると思います.特定の設定ファイルを含めて正しいといいたいのなら,設定を含めてプログラムでしょう.
2010/07/02 02:27:36 UTCshiro
#
プログラムの「正しさ」の定義は? それが静的なチェックをパスすること、であればやっぱりトートロジーのような。
2010/07/02 02:31:34 UTCnobsun
#
正しさの定義は重要です。静的チェックを通ることが正しいというなら、静的チェックを通る条件を満たすことが正しさの条件になります。もちろん、これを正しさの必要条件になっていなければなりませんが。
#
ああでも循環しているか。
#
静的云々を抜きにして、プログラムの正しさというのはどのようなものと考えますか?
#
それはどのように確かめられるものなんでしょうか?
2010/07/02 02:36:29 UTCshiro
#
プログラムの外に何らかの制約が必要だよねぇ。プログラムは(バグも含めて)書かれた通りに動くわけだから、それが不正なプログラムであるということは、外にある基準に照らして不正だということだよなあ。
#
操作的な見方としては、ある計算モデルを考えて、それに食わせた場合にモデルの状態が「正常である」と定義された状態以外を取らない、とか?
2010/07/02 02:44:44 UTCshiro
#
んー、計算モデルとしてTMを考えたら、不正な状態というのはあり得ない (せいぜい止まらないのを不正とするくらい?) から、当然ここで考えてるモデルというのはより高度な、もしくは制約のきついモデルということになる。
#
静的検査というのは、その高度なモデルの定義と、与えられたTMプログラムだけから、そのTMプログラムが高度なモデルの状態をはみ出ないことを調べるもの…とか? あれ、やっぱりなんだか同じところをぐるぐる回ってる気がしてきた。
2010/07/02 02:52:24 UTCとおる。
#
それは、表明とかの形で人間が与えてあげないといけないんじゃないでしょうか?
2010/07/02 02:54:22 UTCshiro
#
その一つの方法が型宣言だよね>表明とかの形
2010/07/02 02:55:12 UTCとおる。
#
はい。あとは、契約とかですかね。
2010/07/02 02:58:38 UTCshiro
#
この「何に照らして正しさを考えるか」っていうモデルのところに、型システムを持ってくるのは、それが扱いやすくてかつ有効性が高いからだと思う。それはそれでいいんだけど、他の形もあり得るだろうなと妄想する。
2010/07/02 03:00:17 UTCとおる。
#
不変表明を書いておくと静的に解析してくれるシステムみたいなのありませんでしたっけ?
2010/07/02 03:00:46 UTCshiro
#
私が学生の頃、いやもうちょっと前かな。知識処理界隈では、ある程度矛盾を許容する知識ベースの作り方ってのをやってた。エキスパートシステムとか関連なんだけど、どんどん知識を追加していった時に、矛盾を許さないと現実のデータではあんまりスケールしない (早々に破綻する)。
2010/07/02 03:01:52 UTCとおる。
#
人によって言うことが違いますからね(笑)。
2010/07/02 03:02:36 UTCshiro
#
Lispみたいに実行と解析がぐちゃぐちゃになってて、実行イメージ中の泥団子をこねるような言語の場合、「それまでに与えられた情報」の総体が一種の知識ベースになってて、正しいモデルが何なのかなんてわからないけれど新しい定義を加えたらそれまでの知識を元に解析して、「まあいいんじゃないの」とか「これはまずくないか」みたいな答えが返ってくる、なんてのはありだろうか。
2010/07/02 03:06:06 UTCとおる。
#
ぼくはむしろ、これまでのことは忘れてほしいんですよね。だから、REPL で開発するのってなじめないです。
2010/07/02 03:07:24 UTCshiro
#
忘れて欲しいこともあるけど。でも、デバッガっていうのは実行状態の中にいるのが基本じゃない? REPLってずっとデバッガの中にいるようなものだと思えば。
#
まあでも、Common Lispで開発してて、REPLでちゃんと動いてテストも通ったのにクリーンコンパイルしたら動かなかった (実は古い定義を参照してた) なんて罠はあるからなあ。
2010/07/02 03:09:16 UTCとおる。
#
あーそれはそうですね。<デバッガ
2010/07/02 04:33:12 UTCenami
#
clang で gauche build してみました。warning の出方も違いますね。
#
diff --git a/ext/zlib/gauche-zlib.c b/ext/zlib/gauche-zlib.c
index 7cd8e0f..1893f3e 100644
--- a/ext/zlib/gauche-zlib.c
+++ b/ext/zlib/gauche-zlib.c
@@ -240 +240 @@ static int deflate_flusher(ScmPort *port, int cnt, int forcep)
-        info->flush == Z_SYNC_FLUSH;
+        info->flush = Z_SYNC_FLUSH;
diff --git a/src/bignum.c b/src/bignum.c
index 37c167d..4055e63 100644
--- a/src/bignum.c
+++ b/src/bignum.c
@@ -432 +432 @@ double Scm_BignumToDouble(ScmBignum *b)
-        && (dst[0]&1 == 1
+        && ((dst[0]&1) == 1
diff --git a/src/regexp.c b/src/regexp.c
index a899baa..311b92f 100644
--- a/src/regexp.c
+++ b/src/regexp.c
@@ -260 +260 @@ static int regexp_compare(ScmObj x, ScmObj y, int equalp)
-        for (i=0; i++; i<rx->numCodes) {
+        for (i=0; i<rx->numCodes; i++) {
@@ -263 +263 @@ static int regexp_compare(ScmObj x, ScmObj y, int equalp)
-        for (i=0; i++; i<rx->numSets) {
+        for (i=0; i<rx->numSets; i++) {
diff --git a/ext/net/net.c b/ext/net/net.c
index a625082..bd7b369 100644
--- a/ext/net/net.c
+++ b/ext/net/net.c
@@ -534 +534 @@ ScmObj Scm_SocketBuildMsg(ScmSockAddr *name, ScmVector *iov,
-            (void*)get_message_body(SCM_CAR(SCM_CDDR(c)), &clen);
+            (void)get_message_body(SCM_CAR(SCM_CDDR(c)), &clen);
2010/07/02 04:34:41 UTCenami
#
このあたりは直したほうが良さそうですかね。
2010/07/02 04:38:55 UTCshiro
#
こりゃありがたい。regexpのは、つまり今までループを回ってなかったわけか。
2010/07/02 04:48:22 UTCenami
#
そういうことになりますね。他にも Scm_Init_rfc__zlib が Scm_Obj 返すことになっているとか、/* がコメントの中にあるとかいわれてます。
2010/07/02 04:49:31 UTCshiro
#
/*がコメントの中に、というのは生成されたコードでですか?
2010/07/02 04:52:11 UTCenami
#
一つはこれだからそうですね。
2010/07/02 04:52:18 UTCenami
#
compile.scm:6415:118: warning: '/*' within block comment [-Wcomment]
  ...Scm_MakeClosure(SCM_OBJ(&scm__rc.d996[108]), NULL)); /* subst-lvars/* */
2010/07/02 04:53:04 UTCshiro
#
cgenの方をいじって出ないようにしておこう
2010/07/02 04:53:16 UTCenami
#
ndbm-makedb.c:7:9: warning: '/*' within block comment [-Wcomment]
   *.dir/*.pag from the original dbm, while BSD-traits uses *.db (they
2010/07/02 04:53:42 UTCshiro
#
'*/' が生成されちゃうともっとまずいな
2010/07/02 04:54:14 UTCenami
#
これがもうひとつ。
2010/07/02 04:55:34 UTCshiro
#
ちゃんとcgen-safe-commentって用意してあった。MakeClosureを出す部分だけ入れ忘れ。
2010/07/02 06:34:38 UTCnobsun
#
TMをモデルにして考えれば,初期状態がプログラムで,特定の初期状態からはじめれば,望んだ結果を表す終了状態で停止するというのが,そのプログラムの正当性ということになる.プログラムを初期状態から停止状態への関数と見なせば,その正当性は望む停止状態がでるかで決定的に判断できる.これは言語にかかわらず同じかな?とはいうものの,これは計算途中で系の外側からの影響(入力)がないという前提なので,現実的ではない.入力のがおこったときその系を観測していれば,それは予期せぬ副作用のように見える.どのような入力あるかは実行前には(値としては)確定できない.静的チェックのしようがない.逆に,入力に直接かかわらない部分については切り出せれば静的にチェックできるだろうという希望はある.
2010/07/02 07:54:15 UTCとおる。
#
でも入力にかかわらないのなら、はじめから定数で置き換えちゃえばいいんじゃないですかね?
2010/07/02 08:34:54 UTCnobsun@twitter
#
答がわかっているなら書く必要はないし、そうでなければ一度うごかせば捨てるものかもです。でも、関数適用としては一回かぎりでしょうけど、関数抽象は使いまわしが効くかもしれませんね。
2010/07/02 08:54:04 UTCnobsun
#
定数というのは確定済ということにすぎないので、それが関数抽象の可能性もあるということです
2010/07/02 08:57:15 UTCとおる。
#
関数抽象って、たとえば、静的な関数のインライン展開みたいな?
2010/07/02 09:28:09 UTCnobsun@twitter
#
ジャンプ先の番地とかなんでもいいとおもいます
2010/07/02 17:31:45 UTCshiro
#
計算結果が関数抽象である場合、それを「使いまわす」っていうのは、将来何らかの引数にそれを適用するってことですよね。その何らかの引数って、今はまだわからない。外部入力というのも実行前には確定してないという意味で同じじゃないですか。
2010/07/02 18:35:03 UTCshiro
#
あーもちろんHaskellで入力とプログラムを区別するのはわかるんだけど。Lispみたいにプログラムとデータの境界が曖昧な立場では、「プログラムが動作して入力を受け取る」のと、「途中でプログラムが追加されて全体が再構成される」のは外部から観測していて同じじゃないか、とも言えるので。
#
これはどちらが正しいかというのではなく、どう見ると都合が良いかという違いだと思いますが。
2010/07/02 21:54:28 UTCとおる。
#
プログラムを入力としてみとめるなら、ここでは、そのプログラムを処理・実行するメタプログラムみたいなものを問題にしないといけないんじゃないでしょうか? ただ、Lisp の場合は、そのメタプログラムも通常のプログラムと見分けがつかないので、話がややこしくなるんだと思うんですが。
#
なので、入力、それを処理するプログラム、入力としてのプログラム、プログラムを入力としてとるメタプログラム、みたいなそれぞれのレイヤーに対して個別になら、ある程度の正しさのチェックはできそうな気がします。
2010/07/02 21:56:24 UTCshiro
#
そうそう。そこで、メタプログラムとプログラムをはっきりわけるかわけないかって話になるんだけれど、その分類は単に「都合がよい」からそうしているだけなんではないか、ということです。
#
そんで、きっちり分けて分け方を工夫すれば個別のレイヤに閉じた中で言えることは増えるんだけど、分けないという立場をとると実行時に情報がわかればわかるほどさらに言えることが増える、とも考えられます。
2010/07/02 22:58:49 UTCnobsun
#
はい、同意です > 「都合がよい」からそうしているだけ
#
これも同意 > 実行時に情報がわかればわかるほど言えることが増える
2010/07/02 23:04:54 UTCnobsun
#
ただ、実行時の情報をどう使うかという情報は、やっぱり実行前に組みこまれていて、情報について実行まえになんらかの判断ができるといいだろうなぁ。と思うのでした。
2010/07/02 23:13:31 UTCnobsun
#
もちろん、言語の性格上、実行時前の情報では有用な判断はできないということがあるでしょう。Haskellでは静的型付けと参照透明な記述と非正格な意味とを確保することで実行前に判断できることを増やしていると見ることができます。
2010/07/02 23:29:33 UTCshiro
#
Haskellの選択が実行前にチェックできることをなるべく増やすものだって点には異存はないんですが、それによって「プログラムの正しさ」がどれだけ検証できるかというと、結局は「与えられた情報の中では矛盾はない」というところまでしか言えない。「与えられた情報の中で矛盾が無い」ことを「正しい」のだ、と言ってしまうと定義が循環しちゃう。なので正しさについては別途議論が必要、って感じかな。
2010/07/02 23:58:57 UTCとおる。
#
仕様記述言語とかの話につながるんですかね。人間の意図をいかにしてプログラムと結びつけるかですよね。
2010/07/02 23:59:13 UTCnobsun
#
たしかに「正しさ」を曖昧にしか考えてませんでした。> shiro