Atomistix ToolKit 2008.10大規模並列環境におけるATK 2008.10の並列性能およびATK 2008.02との比較

Atomistix ToolKit 2008.10(以下ATK 2008.10)では、旧バージョンと比較して大幅な計算速度の高速化とメモリ使用量の軽減が実現されました。このATK 2008.10を使用したベンチマークテストが、東京工業大学 理工学研究科 電子物理工学専攻 小田・内田研究室の増渕様と、同専攻の水田博連携教授(英サザンプトン大学教授)によって実施されましたので、その結果を報告します。

テスト環境

本ベンチマークテストは、東京工業大学 学術国際情報センターのスーパーコンピューティング・グリッド・システム「TSUBAME」で実行されました。計算環境のスペックとATKのバージョンを表1に示します。

表1 マシンスペック及びATKバージョン
CPU デュアルコアAMD Opteron 880 2.4GHz、
1ノードあたり8CPU(16コア)
Memory 1ノードあたり32GB
Network InfiniBand
OS SuSE Linux Enterprise Server 9 Service Pack 3
ATKのバージョン ATK 2008.02.1(64bit Linux版)
ATK 2008.10.0(64bit Linux版)

計算モデル

SiナノワイヤーをAu(100)電極間に架橋した2プローブ系(図 1)を計算対象のモデルとしました。主要な計算パラメータは表2のとおりです。

表2 計算モデル及び主要なパラメータ
基底関数 DZP
交換相関汎関数 LDA-PZ
mesh cutoff 150 Ry
k点サンプリング数(SCF) 5×5×500
k点サンプリング
(DOS、透過スペクトル)
10×10


図 1 計算に用いたAu-Siナノワイヤー-Au構造の模式図

結果

(1)ATK 2008.10のスケーラビリティ

表3に全計算時間とスピードアップ、図 2に全計算時間 vs. 並列数のグラフ、図 3にスピードアップ vs.並列数のグラフを示します。この結果から、128並列という非常に大規模な並列環境を用意することで、全計算時間を大幅に短縮できることがわかります。

表3 全計算時間及びスピードアップ
並列数 全計算時間 スピードアップ
1 174時間43分 1
4 46時間56分 3.7227
8 22時間56分 7.6185
16 14時間09分 12.3475
32 8時間32分 20.4746
64 5時間59分 29.2006
128 4時間41分 37.3060


図 2 全計算時間 vs. 並列数


図 3 スピードアップ vs. 並列数
(全計算時間)

次に、上記の結果をSCF計算に要する時間と物理量(透過スペクトルやDOSなど)の計算に要する時間に分けて示します。表4がそれぞれの計算時間とスピードアップ、図 4がSCF計算のスピードアップ vs. 並列数のグラフ、そして図 5が物理量の計算のスピードアップ vs. 並列数のグラフです。

表4 SCF計算と物理量の計算に要する計算時間及びスピードアップ
並列数 計算時間 スピードアップ
SCF 物理量 SCF 物理量
1 67時間52分 106時間51分 1 1
4 19時間27分 27時間29分 3.4893 3.8878
8 8時間24分 14時間32分 8.0794 7.3521
16 6時間19分 7時間50分 10.7441 13.6404
32 4時間37分 3時間55分 14.7004 27.2809
64 4時間00分 1時間59分 16.9667 53.8739
128 3時間37分 1時間04分 18.7650 100.1719


図 4 スピードアップ vs. 並列数 (SCF計算)


図 5 スピードアップ vs. 並列数
(物理量の計算

SCF計算では32〜64並列程度で速度向上が飽和していますが、物理量の計算では、本ベンチマークテストで行った最大の128並列まで高いスケーラビリティが実現されています。

(2)ATK 2008.02とATK 2008.10の比較

上述したベンチマークテストはATK 2008.02でも実行されました。ここでは、その計算時間の比較を行います。
表5には両バージョンによる全計算時間を、図 6にはそれをグラフ化したものを示します。

表5 ATK 2008.02とATK 2008.10の計算時間の比較
並列数 全計算時間 短縮率
ATK 2008.02 ATK 2008.10
4 144時間04分 46時間56分 32.6%
8 104時間52分 22時間56分 21.9%
16 84時間12分 14時間09分 16.8%
32 62時間22分 8時間32分 13.7%
64 34時間47分 5時間59分 17.2%
128 30時間03分 4時間41分 15.6%


図 6 ATK 2008.02とATK 2008.10の計算時間の比較

このように、ATK 2008.10の全計算時間はATK 2008.02の約1/3〜1/6となり、計算速度の大幅な改善が確認できました。

まとめ

ATK 2008.10を使用して128並列まで並列計算を行い、並列数を増やすことによって計算時間を短縮できることがわかりました。特に物理量の計算で非常に高いスケーラビリティが示されましたので、物理量の計算に掛かる時間の割合が高いモデルの場合には、大規模な並列計算の有効性はより顕著になると考えられます。

さらに、ATK 2008.02とATK 2008.10の計算時間の比較を行い、計算スピードの大幅な改善が達成されていることが分かりました。

なお、計算時間や並列化効率は計算対象やパラメータの取り方、計算環境など様々な要因で変化しますので、ここで挙げた数値はご参考程度とお考え下さい。


お問い合わせ

Copyright © 2011 QuantumWise Japan KK All rights reserved.