haskell-ja > Archives > 2012/02/23

2012/02/23 06:44:24 UTCshelarcy@twitter
#
.ついに、GHC HEAD の bytestring に builder が入りました。 http://t.co/8ILnEg1B http://t.co/QWFQFKpi http://t.co/uzmwCCIn
2012/02/23 06:49:25 UTCshelarcy@twitter
#
次は vector 化ですね。(その前に、今回の変更で生じた bytestirng と vector-bytestring の間の API のギャップを埋める必要がありますが。)
2012/02/23 06:59:42 UTCkazu
#
作者の Simon 自身が言っていましたが、Handle のバッファーに直接書き込めるようになるようです。
#
vector 化というのがイマイチ分かっていないんですが、Vector 上に ByteString を実装するという話でしょうか? もしそうなら、何が嬉しいのですか?
2012/02/23 07:30:39 UTCshelarcy@twitter
#
はい、そうです。 http://t.co/BiO46Bg7 http://t.co/iRAXkkgO http://t.co/dgVQgZa9
#
Vector 化で目的としているのは、(Lazy Bytestirng に対する)Builder と同じく、Bytestirng に対する処理のコストを減らすことです。
#
Vector で ByteString の実装を置き換えれば、ByteString の参照透過な配列としての性質を保ったまま、融合変換によって更新コストを減らすことができるはずなので。 http://t.co/0nMuTFpF
2012/02/23 07:39:41 UTCshelarcy@twitter
#
(ただし、現在の Vector の実装にはまだまだ改良の余地があるようですが。)
2012/02/23 07:41:30 UTCkazu
#
なるほど! ありがとうございます。
2012/02/23 07:46:39 UTCkazu
#
Text は Array を使ってますが、Vector は使ってませんよね。独自に fusion を書いているってことですかね? Vector の上に、ByteString と Text が実装され、Vector を鍛えれば、ByteString と Text も速くなるという世界が美しいのかな?
#
なんか、曖昧な文章だった。Text は Vector ではなく Array を使ってますよね。と、いいたかったのです。
2012/02/23 08:34:48 UTCkazu
#
foo [] = undefined
#
foo [x] = undefined
#
foo xs = undefined
#
これを、ByteString で書き直すと、length が O(1) なので
#
foo bs
 | BS.null bs           = undefined
 | BS.length bs == 1 && = undefined
 | otherwise            = undefined
#
と書けるんですが、Text の場合はどうすればいいですか?
#
length が O(n) なんですが。
#
上の && はゴミです。すいません。
2012/02/23 08:49:58 UTCshelarcy@twitter
#
はい。text は vector とは別に独自に fusion (Recycling は持たず Stream Fusion のみ)を書いています。
#
Array といっても array パッケージのものではなく、ByteArray# や MutableByteArray# の上に独自に定義した Array 型を text では使っていますね。
http://t.co/m1FaCdk3
2012/02/23 08:49:59 UTCsnak
#
null . tailでは?
2012/02/23 08:50:59 UTCshelarcy@twitter
#
text の開発を始めた頃はまだ vector も少しずつ実装を進めている段階で、そもそも vector をバックエンドとして使うという選択肢を考慮する状況ではなかった、という歴史的な理由で vector を使わない実装になっているのだと思います。
2012/02/23 08:51:24 UTCshelarcy@twitter
#
そうですね。 > ByteString と Text が実装され、Vector を鍛えれば、ByteString と Text も速くなるという世界が美しいのかな?
2012/02/23 08:51:59 UTCshelarcy@twitter
#
ただ、text は内部表現に UTF-16 を使っている関係で vector の Recycling を使う旨みがなさそうなので、Recycling に伴うオーバーヘッドを減らすのが text を vector 化する時の課題になりそうですね。
#
あと、単純に ByteString と Text を Vector の上に実装するだけではなく、List の融合変換も Stream Fusion 化して [http://t.co/S2H5Ttnu ]、
#
Stream Fusion や Recycling のためのフレームワークを base で提供できたりすると良いかもしれません。
2012/02/23 08:55:15 UTCkazu
#
すると、[x,y] とかになると、null、null.tail、null.tail.tail を書き連ねるんですか? View パターンを使うと、奇麗に書けますか?
2012/02/23 08:56:15 UTCshelarcy@twitter
#
あっ、 s/ByteString と Text が実装され/Vector の上に、ByteString と Text が実装され/
2012/02/23 08:57:38 UTCkazu
#
説明ありがとうございます。 > shelarcy さん
2012/02/23 09:00:16 UTCshelarcy@twitter
#
どういたしまして。
#
あっ、リンク間違えてました。List の Stream Fusion 化はこっちの Ticket です。 http://t.co/d0gWOhtQ