こんにちは、最近では全国で量子コンピューティングや生成AIの計算をしたいという需要が高まっています。一方で、生成AIにかかるセットアップや量子コンピューティングにかかるセットアップは不明なことが多く、ネットワークやマシンのセットアップは多少の知識と経験が必要です。
今回はそうした全国どこでも使える計算リソースは重要なのですが、居室やオフィスにこうしたマシンを置くことはお勧めしていません。なぜなら音や騒音がすごいからです。計算用のマシンは現在GPUを利用することが多いですが1枚あたりの消費電力が300W前後です。そのため複数の計算マシンをおくと暖房を年中置いておくようなものです。また高性能になる程熱の密度が高くなるので、排熱の機構が大きくなり音などの問題が出ます。
居室にそうした設備を置くのが厳しい場合、大体は倉庫などの空いてるところにサーバーが突っ込まれ、埃にまみれて熱がすごいことになりますが、最近の計算ノードは昔のネットワークマシンよりも格段に熱を排出するため、排熱がしっかりしていないとマシンが壊れてしまいます。昨今の断熱性が高いオフィスや住宅でこのような環境を用意するのは至難の業です。
そこで、より簡単に課題を解決するため、コンテナやプレハブ、物置などの設備を利用した計算ノードの独立サーバールームを開発しました。置いた場合、さまざまな問題もありますが、電力とネットワークが取れれば解決します。電力については現在は安定してとっていただくためには電力を何とか引き込んでもらう必要があります。ネットワークも重要ですが、生成AIや量子計算の場合にはちょっと事情が変わります。
通常のネットワークやウェブサーバーは外部からのリクエストと言って応答が重要になります。ウェブサイトはしょっちゅうページを変更したりするのでその度に処理が入りますので、通信などが重要です。(もちろんSPAなどのクライアント側が進んでいますがそれでもAPIの頻度は高いです)
生成AIや量子計算では使い方にもよりますが、計算が主体で、一つの計算に対して大体10秒から数時間オーダーでの処理を行います。そうなると相対的にリクエストを受ける頻度が減るため、計算を投げる時と受ける時の数十秒で2回ほどのリクエストを捌けば良いことになります。もちろん課題はあり、AIや量子計算ではデータのダウンロードアップロードに莫大な通信を行うことがあります。ただ、学習をしなければ(推論のみなら)この通信量もかなり減ります。
生成AIでは主にテキストを受けてテキストを返したり、画像やテキストを受けて画像を返すなど、比較的数十秒の処理にしてはやり取りをするデータ量や頻度が少ないです。量子計算でも同様で、量子回路やネットワークグラフを受けて計算結果を返しますが、かなり計算の頻度は低いですしデータ量も少ないです。
今回は、5Gのセルラーネットワーク(携帯回線)を利用してこのような生成AIや量子計算のサーバーの運用を行いました。今後はスターリンクを使った衛星回線でのトライアルを予定しており、その予備として行いました。日本全国セルラーネットワークがカバーする範囲ですと、セルラーに対応したルーターなどのモジュールがあれば対応できます。
今回はglobal IPを取得し、DDNSで運用しました。現在のところ安定してサービス提供ができており、社内での計算リソース活用もより柔軟になり、クラウドからの移行を果たすことができました。今後はシステム全体を冗長化し、分散して管理を進めてまいりたいのと、スターリンクを活用した、人工衛星経由での計算リソースの活用を推進していきたいと思います。
以上です。