common.title

Docs
Quantum Circuit
TYTAN CLOUD

QUANTUM GAMING


Desktop RAG

Overview
Terms of service

Privacy policy

Contact
Research

Sign in
Sign up
common.title

NVIDIA RTX 4090の量子コンピュータシミュレータcuQuantum + blueqatのベンチマーク結果。V100 / A100 / CPU比較。

Yuichiro Minato

2023/02/06 01:42

こんにちは、爆速のGPU量子コンピュータシミュレータのベンチマークを取ってみました。最近は本格的にデータセンターを運営をちょっとずつ構築しており、コンシューマ機を管理はできないのですが興味本位で最新のGPUを購入してみました。

使うのは、

https://blueqat.com/yuichiro_minato2/f1942bc4-cd43-4e25-bd82-cf0dd7d05372

以前はベンチマークをいくつかやってみました。今後はもっと本格的なものを導入しますがとりあえず手作りのもので。

NVIDIA cuQuantum / cuStateVecを各種GPUで実行

https://blueqat.com/yuichiro_minato2/8a139056-98d2-4df2-8124-22924dfb2160

GPU量子コンピュータシミュレータcuQuantum / cuTensorNet 1,000量子ビットRY+CX回路のベンチマーク / NVIDIA V100, A100, T4

https://blueqat.com/yuichiro_minato2/3423f23f-628d-4d93-ae91-f26ae83688bc

今回は市場から新鮮なRTX4090というモンスターマシンが手に入りましたので実行してみます。ちなみに規約でサーバールーム提供は禁止されている上、消費電力効率がプロ向けマシンのように最適化されていないのでサーバー提供の予定はありません。

まずはcuStateVecでQAOAを実行してみました。同じコードです。結果は、

1.9144411087036133 sec

これはA100の

2.413858652114868 sec

よりも高速となりました。ちなみにCPUだと

293.0213541984558 sec

比較になりませんね。

次にcuTensorNetでHE-VQEを1000量子ビットでやってみます。1000量子ビットに1量子ビットゲートと2量子ビットゲートをいくつか層にして計算します。超伝導と合わせるように結合は限定的です。

103.03314733505249 sec

となりました。これはA100よりは少し遅いです。すみません、CPUは時間かかりすぎてまた今度で。

RTX4090のビデオメモリは24Gなので、TNの計算はA100の80Gには到底及びませんが、24Gまでの問題サイズであれば十分な速度で計算できました。弊社としてはコンシューマのお客さんにSDKを提供し、プロユースではH100などの最新GPUを活用して提供をしてまいります。以上です。

© 2025, blueqat Inc. All rights reserved