<div dir="ltr"><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt;mso-bidi-font-size:
12.0pt;mso-font-kerning:0pt">Dear  cp2k  users and developers, <o:p></o:p></span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt;mso-bidi-font-size:
12.0pt">I am trying to run ab initio molecular dynamics on the system including
1008 Ni atoms with PBE functional. The 1*24 mpi task is too slow, around 80
steps per day on average; the 3*24 mpi task is slower, 38 steps per day on
average.<o:p></o:p></span></p><p class="MsoNormal"><span style="font-size: 11pt;">Any help is highly appreciated.</span><br></p><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt;mso-bidi-font-size:
12.0pt;mso-font-kerning:0pt"><o:p> </o:p></span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt;mso-bidi-font-size:
12.0pt;mso-font-kerning:0pt">Best regards,<o:p></o:p></span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt;mso-bidi-font-size:
12.0pt;mso-font-kerning:0pt"><o:p> </o:p></span><span style="font-size: 11pt;">Huang</span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt;mso-bidi-font-size:
12.0pt;mso-font-kerning:0pt"><br></span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:12.0pt;mso-font-kerning:
0pt">CP2K version 4.1<o:p></o:p></span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:12.0pt;mso-font-kerning:
0pt"> SVN source code revision svn:17462<o:p></o:p></span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:12.0pt;mso-font-kerning:
0pt"> cp2kflags: fftw3 parallel mpi2
scalapack<o:p></o:p></span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:12.0pt;mso-font-kerning:
0pt">composer_xe_2015.2.164<o:p></o:p></span></p><p class="MsoNormal"><span lang="EN-US" style="font-size: 11pt;">







</span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:12.0pt;mso-font-kerning:
0pt">Intel(R) Xeon(R) CPU E5-2680 v3 @ 2.50GHz Haswell<o:p></o:p></span></p><p class="MsoNormal"><br></p><p class="MsoNormal"># Step Nr. Time[fs] Kin.[a.u.] Temp[K] Pot.[a.u.] Cons Qty[a.u.] UsedTime[s]</p><p class="MsoNormal"> 0 0.000000 9.566949152 2000.000000000 -170544.785566084 -170535.208832257 0.000000000</p><p class="MsoNormal"> 1 1.000000 9.646234174 2016.574776405 -170554.174550500 -170544.519479220 13708.945765018</p><p class="MsoNormal"> 2 2.000000 9.903391164 2070.334232377 -170556.710812560 -170546.798982374 1826.637025118</p><p class="MsoNormal"> 3 3.000000 10.258759808 2144.625134870 -170557.585906167 -170547.318873932 748.965154886</p><p class="MsoNormal"> 4 4.000000 10.622230399 2220.609774417 -170557.531726730 -170546.901213604 856.725823164</p><p class="MsoNormal"><br></p><p class="MsoNormal">&GLOBAL</p><p class="MsoNormal">  ! limit the runs to 5min</p><p class="MsoNormal">  ! WALLTIME 1000</p><p class="MsoNormal">  ! reduce the amount of IO</p><p class="MsoNormal">  IOLEVEL  LOW</p><p class="MsoNormal">  ! the project name is made part of most output files... useful to keep order </p><p class="MsoNormal">  PROJECT Ni-1008-2k</p><p class="MsoNormal">  ! various runtypes (energy, geo_opt, etc.) available.</p><p class="MsoNormal">  RUN_TYPE MD             </p><p class="MsoNormal">&END GLOBAL</p><p class="MsoNormal"><br></p><p class="MsoNormal">&FORCE_EVAL</p><p class="MsoNormal">  STRESS_TENSOR ANALYTICAL</p><p class="MsoNormal">  ! the electronic structure part of CP2K is named Quickstep</p><p class="MsoNormal">  METHOD Quickstep</p><p class="MsoNormal">  &DFT</p><p class="MsoNormal">    ! basis sets and pseudopotential files can be found in cp2k/data</p><p class="MsoNormal">    BASIS_SET_FILE_NAME BASIS_SET</p><p class="MsoNormal">    POTENTIAL_FILE_NAME GTH_POTENTIALS            </p><p class="MsoNormal"><br></p><p class="MsoNormal">    ! Charge and multiplicity</p><p class="MsoNormal">    CHARGE 0</p><p class="MsoNormal">    MULTIPLICITY 1</p><p class="MsoNormal"><br></p><p class="MsoNormal">    &MGRID</p><p class="MsoNormal">       ! PW cutoff ... depends on the element (basis) too small cutoffs lead to the eggbox effect.</p><p class="MsoNormal">       ! certain calculations (e.g. geometry optimization, vibrational frequencies,</p><p class="MsoNormal">       ! NPT and cell optimizations, need higher cutoffs)</p><p class="MsoNormal">       CUTOFF [Ry] 300 !500 </p><p class="MsoNormal">    &END</p><p class="MsoNormal"><br></p><p class="MsoNormal">    &QS</p><p class="MsoNormal">       ! use the GPW method (i.e. pseudopotential based calculations with the Gaussian and Plane Waves scheme).</p><p class="MsoNormal">       METHOD GPW </p><p class="MsoNormal">       ! default threshold for numerics ~ roughly numerical accuracy of the total energy per electron,</p><p class="MsoNormal">       ! sets reasonable values for all other thresholds.</p><p class="MsoNormal">       EPS_DEFAULT 1.0E-7 !10 </p><p class="MsoNormal">       ! used for MD, the method used to generate the initial guess.</p><p class="MsoNormal">       EXTRAPOLATION ASPC </p><p class="MsoNormal">    &END</p><p class="MsoNormal"><br></p><p class="MsoNormal">    &POISSON</p><p class="MsoNormal">       PERIODIC XYZ ! the default, gas phase systems should have 'NONE' and a wavelet solver</p><p class="MsoNormal">    &END</p><p class="MsoNormal"><br></p><p class="MsoNormal">!    &PRINT</p><p class="MsoNormal">!       ! at the end of the SCF procedure generate cube files of the density</p><p class="MsoNormal">!       &E_DENSITY_CUBE OFF</p><p class="MsoNormal">!       &END E_DENSITY_CUBE</p><p class="MsoNormal">!       ! compute eigenvalues and homo-lumo gap each 20nd MD step</p><p class="MsoNormal">!       &MO_CUBES</p><p class="MsoNormal">!          ! compute 4 unoccupied orbital energies</p><p class="MsoNormal">!          NLUMO 4</p><p class="MsoNormal">!          NHOMO 4</p><p class="MsoNormal">!          ! but don't write the cube files</p><p class="MsoNormal">!          WRITE_CUBE .FALSE.</p><p class="MsoNormal">!          ! do this every 10th MD step.</p><p class="MsoNormal">!          &EACH</p><p class="MsoNormal">!            MD 20</p><p class="MsoNormal">!          &END</p><p class="MsoNormal">!       &END</p><p class="MsoNormal">!    &END</p><p class="MsoNormal"><br></p><p class="MsoNormal">    ! use the OT METHOD for robust and efficient SCF, suitable for all non-metallic systems.</p><p class="MsoNormal">    &SCF                              </p><p class="MsoNormal">      SCF_GUESS ATOMIC ! can be used to RESTART an interrupted calculation</p><p class="MsoNormal">      MAX_SCF 50</p><p class="MsoNormal">      EPS_SCF 1.0E-4 ! accuracy of the SCF procedure typically 1.0E-6 - 1.0E-7</p><p class="MsoNormal">      ! do not store the wfn during MD</p><p class="MsoNormal">      &PRINT</p><p class="MsoNormal">        &RESTART OFF</p><p class="MsoNormal">        &END</p><p class="MsoNormal">      &END</p><p class="MsoNormal">      </p><p class="MsoNormal">      &OT</p><p class="MsoNormal">        ! an accurate preconditioner suitable also for larger systems</p><p class="MsoNormal">        PRECONDITIONER FULL_SINGLE_INVERSE</p><p class="MsoNormal">        ! the most robust choice (DIIS might sometimes be faster, but not as stable).</p><p class="MsoNormal">        MINIMIZER DIIS</p><p class="MsoNormal">      &END OT</p><p class="MsoNormal">      &OUTER_SCF ! repeat the inner SCF cycle 10 times</p><p class="MsoNormal">        MAX_SCF 20</p><p class="MsoNormal">        EPS_SCF 1.0E-4 ! must match the above</p><p class="MsoNormal">      &END</p><p class="MsoNormal">    &END SCF</p><p class="MsoNormal"><br></p><p class="MsoNormal">    ! specify the exchange and correlation treatment</p><p class="MsoNormal">    &XC</p><p class="MsoNormal">      ! use a PBE functional </p><p class="MsoNormal">      &XC_FUNCTIONAL </p><p class="MsoNormal">         &PBE</p><p class="MsoNormal">         &END</p><p class="MsoNormal">      &END XC_FUNCTIONAL</p><p class="MsoNormal">    &END XC</p><p class="MsoNormal">  &END DFT</p><p class="MsoNormal"> </p><p class="MsoNormal">  ! description of the system</p><p class="MsoNormal">  &SUBSYS</p><p class="MsoNormal">    &CELL </p><p class="MsoNormal">      ! unit cells that are orthorhombic are more efficient with CP2K</p><p class="MsoNormal">      ABC [angstrom] 21.98167992 21.98167992 25.64529419</p><p class="MsoNormal">    &END CELL</p><p class="MsoNormal"><br></p><p class="MsoNormal">    ! atom coordinates can be in the &COORD section,</p><p class="MsoNormal">    ! or provided as an external file.</p><p class="MsoNormal">    &TOPOLOGY</p><p class="MsoNormal">      COORD_FILE_NAME Ni-1008-2k.xyz</p><p class="MsoNormal">      COORD_FILE_FORMAT XYZ</p><p class="MsoNormal">    &END</p><p class="MsoNormal"><br></p><p class="MsoNormal">    ! MOLOPT basis sets are fairly costly,</p><p class="MsoNormal">    ! but in the 'DZVP-MOLOPT-SR-GTH' available for all elements</p><p class="MsoNormal">    ! their contracted nature makes them suitable</p><p class="MsoNormal">    ! for condensed and gas phase systems alike.</p><p class="MsoNormal">    &KIND Ni                              </p><p class="MsoNormal">      BASIS_SET DZV-GTH-PADE        </p><p class="MsoNormal">      POTENTIAL GTH-PBE-q18             </p><p class="MsoNormal">    &END KIND</p><p class="MsoNormal">  &END SUBSYS</p><p class="MsoNormal">&END FORCE_EVAL</p><p class="MsoNormal"><br></p><p class="MsoNormal">! how to propagate the system, selection via RUN_TYPE in the &GLOBAL section</p><p class="MsoNormal">&MOTION</p><p class="MsoNormal">! &GEO_OPT</p><p class="MsoNormal">!   OPTIMIZER LBFGS ! Good choice for 'small' systems (use LBFGS for large systems)</p><p class="MsoNormal">!   MAX_ITER  100</p><p class="MsoNormal">!   MAX_DR    [bohr] 0.003 ! adjust target as needed</p><p class="MsoNormal">!   &BFGS</p><p class="MsoNormal">!   &END</p><p class="MsoNormal">!  &END</p><p class="MsoNormal"> &MD</p><p class="MsoNormal">   ENSEMBLE NPT_I  ! sampling the canonical ensemble, accurate properties might need NVE</p><p class="MsoNormal">   TEMPERATURE [K] 2000</p><p class="MsoNormal">   TIMESTEP [fs] 1</p><p class="MsoNormal">   STEPS 1000000</p><p class="MsoNormal">   # GLE thermostat as generated at http://epfl-cosmo.github.io/gle4md </p><p class="MsoNormal">   # GLE provides an effective NVT sampling.</p><p class="MsoNormal">   &BAROSTAT</p><p class="MsoNormal">       PRESSURE 1.0</p><p class="MsoNormal">   &END BAROSTAT</p><p class="MsoNormal">   &THERMOSTAT</p><p class="MsoNormal">      &NOSE</p><p class="MsoNormal">      &END NOSE</p><p class="MsoNormal">   &END THERMOSTAT</p><p class="MsoNormal"> &END MD</p><p class="MsoNormal"> &PRINT</p><p class="MsoNormal">   &TRAJECTORY</p><p class="MsoNormal">     &EACH</p><p class="MsoNormal">       MD 100</p><p class="MsoNormal">     &END EACH</p><p class="MsoNormal">   &END TRAJECTORY</p><p class="MsoNormal">   &VELOCITIES OFF</p><p class="MsoNormal">   &END VELOCITIES</p><p class="MsoNormal">   &FORCES OFF</p><p class="MsoNormal">   &END FORCES</p><p class="MsoNormal">   &RESTART_HISTORY</p><p class="MsoNormal">     &EACH</p><p class="MsoNormal">       MD 200</p><p class="MsoNormal">     &END EACH</p><p class="MsoNormal">   &END RESTART_HISTORY</p><p class="MsoNormal">   &RESTART</p><p class="MsoNormal">     BACKUP_COPIES 3</p><p class="MsoNormal">     &EACH</p><p class="MsoNormal">       MD 200</p><p class="MsoNormal">     &END EACH</p><p class="MsoNormal">   &END RESTART</p><p class="MsoNormal">  &END PRINT</p><p class="MsoNormal">&END</p></div>