【試験研究】第一原理計算セットアップ(4):VASP.6.4.2のコンパイル(Intel Fortran版), (4) VASP 6.4.2 compile by Intel oneAPI

概要

 VASP ver.6.4.2をインストールしていきます。 方法は、Vaspwikiの Installing VASP.6.X.X - Vaspwiki を参考に進めていけばいいことになっているが、うまくビルドするためには、typoも含めていろいろありました。

  • make testでvasp_ncl版の部分がすべてエラーになる。
  • ISIF=3の構造緩和計算がsegmentation faultになる。
  • mpirun -np 4で実行すると、やたらと遅い。
  • serial版のみがまともか?と思ってmake testしたらフリーズする。

という、どうにもならない状態がしばらく続きました。 それがある時からなぜかうまく動くようになりました。やったことは…sudo apt upgradeと、sudo apt autoremove。ubuntuの問題だったのか !? libc++あたりの問題だったのか? 原因は良く分からないのですが、Validation Testsは問題なくパスするようになったので、コンパイル方法を紹介します。ただし、test_allはすべてパスしていませんので念のため。

コンパイル環境と方針

  • vasp 6.4.2
  • Compilers and MKL: Intel oneAPI 2023.2
  • arch/makefile.include.intel を使用。
  • /usr/local/vaspにvasp関係のプログラムを入れる。/usr/local/vaspのownerはrootではなく、私(ユーザー)にする。
  • /usr/local/vasp/vasp642mpibinに、mpiバージョンのVASPを入れる。
  • /usr/local/vasp/potpawLDA64, /usr/local/vasp/potpawPBE64にポテンシャルファイルを入れる。
  • wannier90などのVASP関連で使うツールは、/usr/local/vasp/tools/lib に入れておく。

VASPコンパイル

ソースファイル展開

 tarコマンドで行う。vasp.6.4.2というディレクトリができて、その下にソースファイル一式が入る。

tar zxvf vasp.6.4.2.tgz

とりあえずのVASPコンパイル

archディレクトリの下から適切なものを選んで、makefile.includeとし、コンパイルする。 どれを選ぶかは、Vaspwikiの makefile.include を見る。

いま、vasp.6.4.2ディレクトリにいると仮定して、

cd vasp.6.4.2
cp arch/makefile.include.intel makefile.include

とする。makefile.includeに手を入れるのは、下のほうにあるHDF5, wannier90, libxcのところのみ。 makefile.include全体は下記のとおり。

# Default precompiler options
CPP_OPTIONS = -DHOST=\"LinuxIFC\" \
              -DMPI -DMPI_BLOCK=8000 -Duse_collective \
              -DscaLAPACK \
              -DCACHE_SIZE=4000 \
              -Davoidalloc \
              -Dvasp6 \
              -Duse_bse_te \
              -Dtbdyn \
              -Dfock_dblbuf

CPP         = fpp -f_com=no -free -w0  $*$(FUFFIX) $*$(SUFFIX) $(CPP_OPTIONS)

FC          = mpiifort
FCL         = mpiifort

FREE        = -free -names lowercase

FFLAGS      = -assume byterecl -w

OFLAG       = -O2
OFLAG_IN    = $(OFLAG)
DEBUG       = -O0

OBJECTS     = fftmpiw.o fftmpi_map.o fftw3d.o fft3dlib.o
OBJECTS_O1 += fftw3d.o fftmpi.o fftmpiw.o
OBJECTS_O2 += fft3dlib.o

# For what used to be vasp.5.lib
CPP_LIB     = $(CPP)
FC_LIB      = $(FC)
CC_LIB      = icc
CFLAGS_LIB  = -O
FFLAGS_LIB  = -O1
FREE_LIB    = $(FREE)

OBJECTS_LIB = linpack_double.o

# For the parser library
CXX_PARS    = icpc
LLIBS       = -lstdc++

##
## Customize as of this point! Of course you may change the preceding
## part of this file as well if you like, but it should rarely be
## necessary ...
##

# When compiling on the target machine itself, change this to the
# relevant target when cross-compiling for another architecture
VASP_TARGET_CPU ?= -xHOST
FFLAGS     += $(VASP_TARGET_CPU)

# Intel MKL (FFTW, BLAS, LAPACK, and scaLAPACK)
# (Note: for Intel Parallel Studio's MKL use -mkl instead of -qmkl)
FCL        += -qmkl=sequential
MKLROOT    ?= /path/to/your/mkl/installation
LLIBS      += -L$(MKLROOT)/lib/intel64 -lmkl_scalapack_lp64 -lmkl_blacs_intelmpi_lp64
INCS        =-I$(MKLROOT)/include/fftw

# HDF5-support (optional but strongly recommended)
CPP_OPTIONS+= -DVASP_HDF5
HDF5_ROOT  ?= /usr/local/hdf5-1.14.2
LLIBS      += -L$(HDF5_ROOT)/lib -lhdf5_fortran
INCS       += -I$(HDF5_ROOT)/include

# For the VASP-2-Wannier90 interface (optional)
CPP_OPTIONS    += -DVASP2WANNIER90
WANNIER90_ROOT ?= /usr/local/vasp/tools
LLIBS          += -L$(WANNIER90_ROOT)/lib -lwannier

# Libxc
CPP_OPTIONS += -DUSELIBXC
LIBXC_ROOT  += /usr/local/vasp/tools
INCS        += -I$(LIBXC_ROOT)/include
LLIBS       += -L$(LIBXC_ROOT) -lxcf03 -lxc

# Libbeef
CPP_OPTIONS  += -Dlibbeef
LIBBEEF_ROOT ?= /usr/local/vasp/tools
LLIBS        += -L$(LIBBEEF_ROOT)/lib -lbeef

makeする。最初のmake verycleanは初回は必要ない。 makeの-j4オプションは、4並列でmakeを実行するという指定。-j8が使ったCPUの最大だが、これぐらいやると速さを実感できる。

make veryclean
make DEPS=1 -j4

VASPのテスト (Validation Test)

VASPにはその後、テストを行う。まずは

make test

として、テストを走らせてみる。バイナリに不具合があれば、この時点でエラーがいろいろ出て来る。 出てこなければ、[Ctrl]+[c]でテストを中断し、

nohup make test &

としてあとは放置する。画面出力は、nohup.outとtestsuit/testsuite.logにも格納されている。 make testのデフォルトは、mpirun -np 4での実行で、4並列である。

Validation Testの補足

2回目以降のmake testは、実行する前に

cd testsuite; make cleantest; cd ..

をしたほうがいい。これまでのテスト結果を消去して、新たにテストを行う処理である。

make testでは、特定のテストのみを行ったり、スキップすることができる。 たとえば、ncl版を除いて実行する。下記のようにする。

export VASP_TESTSUITE_SKIP_NCL=Y
nohup make test &

特定のテストをしたいときや、特定のテストを省きたいときは、下記の環境変数をexportする。

export VASP_TESTSUITE_TESTS="bulk_GaAs_ACFDT"
export VASP_TESTSUITE_SKIP_TESTS="bulk_GaAs_ACFDT"

下記の表示が出てくれば成功。

==================================================================
SUCCESS: ALL SELECTED TESTS PASSED
==================================================================
  • 画面出力の69行目に実行開始時間が記録されている。それとnohup.outのタイムスタンプの差をとると、テストにかかった時間が分かる。
  • make testのIntel Core i7-13700Fでの実行時間は25分、Core i7-9700Kでの実行時間は40分、Xeon E5-1650 v3 @3.5GHzでの実行時間は50分だった。
  • make test_allのCore i7-13700Fでの実行時間は1時間50分(110分)。ただし、エラーが2箇所で出た。Core i7-9700Kでの実行時間は2時間50分(170分)でエラーは1つだけだった。どうして?Xeon E5-1650での実行時間は3時間48分(228分)でした。こちらはエラーなし。
    • bulk_BN_SCAN_Libxc mlwf_lif_scdm_optics でFAILが出た。libxcの再インストールや、libbeefを入れても無駄だった。
  • Core i7-13700FはCore i7-9700Kの約1.5倍の速度というところ。この速度比を反映しているベンチマーク指標はCinebench R23 (Single-Core) です。Core i7-13700Fが2107で、Core i7-9700Kが1336なので、比は1.58です。VASPの速度を見積もるときはCinebench R23 (Single-Core) で速度比較すればいいのかもしれません。VASPの処理は浮動小数点演算が主なので、ハイパースレッディングの恩恵が薄いのかもしれません。ただし、この比較にはメモリアクセス速度が反映されていませんので、あくまで目安です。