効果が出ない

ousttrue2008-12-24

レイの発射部分をtbb経由に置き換えたのだが
どうしても速度が出ない。
tbbでマルチスレッドにした方がだいたい2倍から2.5倍遅い。
その間CPU負荷は2つともほぼ100%になるので待ち合わせが
原因ではないように見える。
そこでgoogle performance toolsでプロファイルを取ってみた。
tbbがあるからといって極端に時間を取っているところは無くて
マルチスレッドにすると
UniformedGridのトラバースが遅まっているように見えた。
tbbのサンプルのレイトレースは2倍にスケールしていたのだが。
しかし、あのサンプルは再帰的に球を配置しているだけのシーンなので
データがキャッシュに乗りっぱなしなのではないかという疑惑はある。
キャッシュヒット率を上げるような工夫をしたら早くなるのだろうか。
その前に、
キャッシュヒット率を調べる方法ってあるのかしら。