Atomistix ToolKit 2.2Atomistix ToolKit 2.2とAtomistix ToolKit2.0.4の計算時間・並列性能の比較

2007年7月にリリースされたAtomistix ToolKit(以下ATK)のバージョン2.2では、コードのクリーンアップが行われ、いくつかの計算系において計算時間の短縮が達成されています。ここでは、ATK2.2とATK2.0.4での計算時間の比較、及び並列計算におけるスケーラビリティの比較を行いましたので報告いたします。

テスト環境

計算を行ったマシンスペックとATKバージョンを表1に示します。

表1 マシンスペック及びATKバージョン
CPU Intel社製 PentiumD 3.73GHz×4CPU×2Core:計8コア
Memory 4GB×4:計16GB
Network 1000Base-T
OS RedHat Enterprise Linux WS release3
ATKのバージョン ATK-2.0.4 Linux-x86_64
ATK2.2.0 linux-x86_64-gcc-3.3.6

Fe/MgO/Fe素子のSCF計算

(1)計算モデル

TMR素子のモデル構造であるFe/MgO/Feなる2プローブ系(図1)のSCF収束にかかる計算時間を比較しました。計算モデル及び主要な計算パラメータを表2に示します。

表2 計算モデル及び主要なパラメータ
計算モデル 電極 左右電極 Fe(001)面なるFe電極(Fe原子6個)
中央領域 表面原子としてFe層+
インシュレータ層としてMgO5層を挿入したもの
基底関数 DZP
相関交換汎関数 SGGA-PBE
k点分割 a方向×b方向×c方向=6×6×100
meshcutoff 150Ry
SCFTolerance 10E-4


図1 計算に用いたFe/MgO/Fe構造の模式図

(2)結果と考察

図2にCPUコア数と計算時間の関係を示したグラフを示します。どのコア数においても、計算時間はATK2.2の方がATK2.0.4よりも2割程度早くなっており、計算速度の向上が確認できました。


図2 Fe/MgO/FeのSCF計算に要する時間

図3に並列計算におけるスケーラビリティ性能を示します。本計算におけるスケーラビリティはATK2.2、ATK2.0.4共に、4コアの並列計算で3.5倍のスピードアップ、8コア並列計算で約5倍のスピードアップが達成され、並列コア数に応じて高い性能を示すことがわかりました。


図3 Fe/MgO/FeのSCF計算におけるスケーラビリティ性能

k点依存透過係数の計算

(1)k点依存透過係数の計算について

Fe/MgO/Fe系のようなTMR素子構造の電気伝導特性を解析するためには、図4に示すようなk点依存の透過係数を求める必要があります。この計算は2次元逆格子空間内の多数のk点において透過係数を計算するため、非常に計算負荷の高いものになります。ここでは、このようなk点依存の透過係数の計算における計算時間とスケーラビリティ性能をATK2.0.4とATK2.2で比較しました。


図4 Fe/MgO/Fe系におけるk点依存の透過係数

(2)結果と考察

図5にCPUコア数と計算時間の関係を示したグラフを示します。どのコア数においても、計算時間はATK2.2の方がATK2.0.4よりも4割〜8割程度スピードアップしており、特にコア数が多くなるほどスピードアップの度合いは顕著です。


図5 Fe/MgO/Feのk点依存透過計算に要する時間

図6にk点依存透過係数の計算における並列計算のスケーラビリティ性能を示します。ATK2.0.4ではコア数増加に伴う計算スピードアップは飽和傾向にありますが、ATK2.2ではほぼCPUコア数に比例して計算速度が向上しており、非常に高いスケーラビリティが実現されていることが分かります。


図6 k点依存透過係数の計算におけるスケーラビリティ性能

まとめ

ATK2.0.4とATK2.2の計算速度の比較およびスケーラビリティの比較を行い、ATK2.2では、2プローブ系のSCF計算や、k点依存の透過係数の計算において、計算スピードの改善が達成されていることが分かりました。

なお、計算対象やパラメータの取り方、計算環境など様々な要因で計算時間は変わりますので、ここで挙げた数値はご参考程度とお考え下さい。


お問い合わせ

Copyright © 2011 QuantumWise Japan KK All rights reserved.