Wiiバランスボードをパクるには時間がなくて間に合わなかったんだねえ。ハードが絡むとパクるにも時間が掛かるみたい。
それぞれのハードのセンサーバーやカメラを干渉しあわずに設置することってできるのかな。周辺機器メーカーに期待。
素晴らしい。
という誰もが一度は抱く妄想を具現化したGPGPUに関して調べていました。NVIDIA と AMD どっちに投資した方が将来リターンが大きいかとか。
まとめると
AMD は倍精度が速くてアセンブラが提供されているという、いかにも科学者が好きそうなシステムですね。でも上のN体問題の例だと
というわけで、CUDA みたいな高級言語で loop unrolling をがんばるだけで理論値の6割出せるというのは驚きです。カジュアルプログラマにとっては非常に魅力的です。
で、GPGPU で性能出そうと思ったら loop unrolling をしなくちゃいけなくて、関連してレジスタの数が気になるわけですが、探した限り AMD の GPGPU のレジスタ数ってドキュメントに書いてないんですよねえ。ここにもはてなマークで書いてありますし。アセンブラ提供しておいて、レジスタの数を教えないってどうなのという気がします。いろいろ検索して
NVIDIA GT200 | AMD RV770 | |
Registers per SM/SIMD Core | 16K x 32-bit | 16K x 128-bit |
Registers on Chip | 491,520 (1.875MB) | 163,840 (2.5MB) |
というのを見つけました。レジスタ総数50万個と15万個、総容量1.9MBと2.5MBって、これ本当にレジスタの数字なのか。で、AMD の正確な数字は 128-bit レジスタが1024個/Stream Processor ということらしいです。 1024*16*10=163840個。
あと AMD だと並列実行可能な異なるコードは10までだけど、NVIDIAは30という違いがあったりするらしいです。この点でも NVIDIA の方が柔軟性は高いといえます。
AMD は将来的にBrook+をどうするのかが不透明で、OpenCLがんがりますと言いつつまだOpenCL対応のSDKを配布できていないというのが。
「オープンソース」という言葉を使わずに、「マスコラボレーション」みたいな言葉を使えばよかったのでは。ソースコードのライセンスではなくて人々の協業の形態に興味があるわけでしょ?
リファレンスにとって一番重要なのは「全部そろっている」ことであって、それ以外は細かいことだと思っています。
例えるなら桜が丘高校軽音部にはバンドをやるために4人そろっている必要があるけど、4人目が琴吹紬であるかどうかはさして重要でない、みたいな。
クラス名とパブリックメソッドのシグネチャ一覧がチートシート代わりにならないなら、それは単にそのライブラリの設計がダメなんだと、個人的には思います。
4人でバンド組んで使徒と対バンするという事前情報はガセでした。
それはともかく、「白衣を着ながらたくさんのモニタの前で『そんな』『ありえない』と驚く」というのは、一度でいいからやってみたいです。
カミオカンデの制御室で破損した光センサーを映すモニター(あるかどうか知らないけど)を前に振り返って「パターン青、使徒です」とか言ったらたぶんクビなんだろうな。いまだとLHCでやってみたい。
最近のコメント