TranSIESTA-C 1.3異なるプラットフォームによるTranSIESTA-C 1.3の計算速度比較

プラットフォームの違い、特にOpteronマシンの評価のために、以下の通りベンチマークテストを実施しました。

テスト環境

マシン1

Hardware ビジュアルテクノロジー株式会社製 VT64 Advanced Workstation 4000 Opteron
CPU AMD Opteron 848(2.2GHz) x 4CPUs(注1)
Memory 16GB
OS SUSE LINUX Enterprise Server9 for AMD64 & Intel EM64T
Software Atomistix Virtual NanoLab1.1.1(注2)
TranSIESTA-C 1.3.0.4-2005-02-24 (for 64bit Linux on Opteron)

注1)Virtual NanoLab 1.1.1及びTranSIESTA-C 1.3.0.4はマルチスレッド化されていないため、実質的に1CPUのみ使用。OSプロセスやバックグラウンドプロセス等は他のCPUを使用していると考えられるが、使用率は数%程度。
注2)計算エンジンのTranSIESTA-Cを32bit版から64bit版に変更。

マシン2

Hardware Dell Inc.製 Dell Precision Workstation 670
CPU インテルXeon3.6GHz x 1CPU
Memory 2GB
OS Microsoft Windows XP Professional ServicePack1
Software Atomistix Virtual NanoLab 1.1.1
TranSIESTA-C 1.3.0.4-2004-10-20 (for MS Windows on i686-compatiblePC)

マシン3

Hardware Dell Inc.製 Dell OptiPlex GX270 SFF
CPU インテルPentium4 3.0GHz x 1CPU
Memory 2GB
OS Microsoft Windows XP Professional ServicePack1
Software Atomistix Virtual NanoLab 1.1.1
TranSIESTA-C 1.3.0.4-2004-10-20 (for MS Windows on i686-compatiblePC)

マシン4

Hardware Dell Inc.製 Dell OptiPlex GX270 SFF
CPU インテルPentium4 2.8GHz x 1CPU
Memory 2GB
OS RedHat Enterprise Linux ES4
Software Virtual NanoLab 1.1.1
TranSIESTA-C 1.3.0.4-2004-10-20 (for Linux on i686-compatiblePC)

テスト1:Alq3(分子系)の計算

S/W
Virtual NanoLab 1.1.1

モデル
examplesとして含まれているAlq3のVNLファイルをインポートして計算

計算時間
マシン1(Opteron) 28分34秒
マシン2(Xeon,Win) 56分07秒
マシン3(Pen4,Win) 1時間06分25秒
マシン4(Pen4,Linux) 40分09秒

テスト2:カーボンハット(分子系)の計算

S/W
Virtual NanoLab 1.1.1

モデル
examplesとして含まれているカーボンハットのVNLファイルをインポートして計算

計算時間
マシン1(Opteron) 7分01秒
マシン2(Xeon,Win) 12分16秒
マシン3(Pen4,Win) 14分29秒
マシン4(Pen4,Linux) 9分28秒

テスト3:Aviram-Ratnerダイオード(2プローブ系)の計算

S/W
TranSIESTA-C1.3.0.4

モデル
examplesとして含まれているATK入力ファイルに1Vのバイアスを設定して計算

計算時間
マシン1(Opteron) 28時間08分38秒
マシン2(Xeon,Win) 40時間34分34秒
マシン3(Pen4,Win) 44時間18分36秒
マシン4(Pen4,Linux) 57時間28分26秒
※計算時間は中心領域のみ

まとめ

一見して分かるように、テスト1〜テスト3のいずれの結果も、OpteronマシンがXeonやPentium4のマシンに比べて計算時間が短いことが分かります。
もちろん、OSやチップセット等が異なるため、以上の結果をもって単純にOpteron、Xeon、Pentium4の差とするのは早計ですが、OpteronとVirtual NanoLab(TranSIESTA-C)の組み合わせは非常に高い性能を発揮することが確認できました。

なお、テスト3でPentium4、Linuxのマシンが極端に時間がかかっていますが、これはコンパイラの違い等による誤差の影響のため、SCFループの収束の仕方が他の環境と異なってしまったためだと考えられます。

また、本レポートでの結果はあくまでも一例であり様々な要因で変化しますので、ここで挙げた数値はご参考程度とお考え下さい。


お問い合わせ

Copyright © 2011 QuantumWise Japan KK All rights reserved.