こんにちは、爆速のGPU量子コンピュータシミュレータのベンチマークを取ってみました。最近は本格的にデータセンターを運営をちょっとずつ構築しており、コンシューマ機を管理はできないのですが興味本位で最新のGPUを購入してみました。
使うのは、
https://blueqat.com/yuichiro_minato2/f1942bc4-cd43-4e25-bd82-cf0dd7d05372
以前はベンチマークをいくつかやってみました。今後はもっと本格的なものを導入しますがとりあえず手作りのもので。
NVIDIA cuQuantum / cuStateVecを各種GPUで実行
https://blueqat.com/yuichiro_minato2/8a139056-98d2-4df2-8124-22924dfb2160
GPU量子コンピュータシミュレータcuQuantum / cuTensorNet 1,000量子ビットRY+CX回路のベンチマーク / NVIDIA V100, A100, T4
https://blueqat.com/yuichiro_minato2/3423f23f-628d-4d93-ae91-f26ae83688bc
今回は市場から新鮮なRTX4090というモンスターマシンが手に入りましたので実行してみます。ちなみに規約でサーバールーム提供は禁止されている上、消費電力効率がプロ向けマシンのように最適化されていないのでサーバー提供の予定はありません。
まずはcuStateVecでQAOAを実行してみました。同じコードです。結果は、
1.9144411087036133 sec
これはA100の
2.413858652114868 sec
よりも高速となりました。ちなみにCPUだと
293.0213541984558 sec
比較になりませんね。
次にcuTensorNetでHE-VQEを1000量子ビットでやってみます。1000量子ビットに1量子ビットゲートと2量子ビットゲートをいくつか層にして計算します。超伝導と合わせるように結合は限定的です。
103.03314733505249 sec
となりました。これはA100よりは少し遅いです。すみません、CPUは時間かかりすぎてまた今度で。
RTX4090のビデオメモリは24Gなので、TNの計算はA100の80Gには到底及びませんが、24Gまでの問題サイズであれば十分な速度で計算できました。弊社としてはコンシューマのお客さんにSDKを提供し、プロユースではH100などの最新GPUを活用して提供をしてまいります。以上です。