#byflow、ちょっとデータを増やしたらおもしろいものがリコメンドされないかな、と思って隙間時間にちくちく登録してたんだけど、なかなか賢くならない。まだデータが足らないのかなあ。そう思ってた。ところがさっき見てたら、おすすめアイテムのところに持ってるけど未登録の本が連続して出てきた。お、何かの閾値を越えたのかな、と思ってちくちく「持ってる」をクリックしてたんだけど、あまりに連続して自分の持ってる本が続くので少々気味が悪くなってきた。それも、今まであまり教えたことのないジャンルの本がぽんと出てきたりする。
#いったいどういう脈絡でこれらがリコメンドされるんだろう、と個々のアイテムを見てみると、どれも自分以外に共通して「持っている」人がいた。"shiro"とある。おや偶然だなあ。そう思ってプロフィールページを見たら、何のことはいない、本棚.orgの私のアカウントから自動でインポートされたデータだった。そりゃ持ってる本ばかりなわけだ。
#s/何のことはいない/何のことはない/
#『走ってるプロセスがファイル見てるからうかつに触れない、なんてことがよくあって。』 : テストスクリプトが自分でGIT_DIRを設定してチェックアウトするようにしてます。。UNIXならcloneしてもhardlink使うのでもったいなくないんですが、Windowsだと丸コピーになってもったいないので。
#以前clangとlibgit2を改造してgitリポジトリのtreeを直接読むようにしてたけど、本家の追従が大変でやめてしまった。
#うーん、その場合は、テストすべきコードが既にコミットされてるってことですよね>テストスクリプトが自分でチェックアウト
#まぁコミットがテストのトリガなので。。
#まあどうせローカルなんだからまめにコミットすればいいってだけか。
#むしろ、10分以上かかるようなテストは自分が触ってるディレクトリの中では流さない、と割り切ればいいかも。
#いまうちの会社でも Subversion から分散リポジトリ型に変えようとしてるんですが、バイナリデータが大量にありすぎて、一筋縄ではいかないみたいです。数年前まで大手ゲームパブリッシャーでリリースエンジニアリングやってた人でもいろいろ悩んでいて、端から見てると面白いです。
#分散リポジトリでバイナリデータをがんがん突っ込むと大変なことになりそう。バイナリだけ別扱いにしてメタデータを管理するとかやるの?
#バイナリデータもバージョン管理しないといけないので、別にはしない予定です。で、Mercurial はバイナリ diff が良く出来ているらしいんですけど、なんかそれでも、全部突っ込むと大変な事になるみたいですねぇ。ゲームエンジンの開発元は Perforce でやってたみたいですが、あれは完全な中央集権型だからバイナリにはいいのかもしれないですね。コミットするたびにサイズが倍々にふえますけど。