<div dir="ltr">Dear <span lang="EN-US" style="font-size: 11pt;"> </span><span style="font-size: 11pt;">Huang,</span><div><span style="font-size: 14.666666984558105px;"><br></span></div><div><span style="font-size: 14.666666984558105px;">As already pointed out, you have to improve the computational settings and provide enough computational resources.</span></div><div><span style="font-size: 14.666666984558105px;">If the system is metallic, you need to use a standard diagonalization as optimisation scheme, including the smearing of the occupation numbers and a proper mixing. </span></div><div><span style="font-size: 14.666666984558105px;">The ELPA library for the diagonalisation, which replaces the corresponding function of the ScaLapack, is to be preferred because of the significantly better performance. </span></div><div><span style="font-size: 14.666666984558105px;">The orbital transformation method is not going to work for metallic systems. In any case, when the SCF is not well converged, the electronic structure and the forces are going to be wrong. What happens then is totally out of control. </span></div><div><span style="font-size: 14.666666984558105px;">Kind regards</span></div><div><span style="font-size: 14.666666984558105px;">Marcella</span></div><div><br>On Monday, April 10, 2017 at 10:45:34 AM UTC+2, yel...@gmail.com wrote:<blockquote class="gmail_quote" style="margin: 0;margin-left: 0.8ex;border-left: 1px #ccc solid;padding-left: 1ex;"><div dir="ltr"><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt">Dear  cp2k  users and developers, </span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt">I am trying to run ab initio molecular dynamics on the system including
1008 Ni atoms with PBE functional. The 1*24 mpi task is too slow, around 80
steps per day on average; the 3*24 mpi task is slower, 38 steps per day on
average.</span></p><p class="MsoNormal"><span style="font-size:11pt">Any help is highly appreciated.</span><br></p><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt"> </span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt">Best regards,</span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt"> </span><span style="font-size:11pt">Huang</span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt"><br></span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:12.0pt">CP2K version 4.1</span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:12.0pt"> SVN source code revision svn:17462</span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:12.0pt"> cp2kflags: fftw3 parallel mpi2
scalapack</span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:12.0pt">composer_xe_2015.2.164</span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:11pt">







</span></p><p class="MsoNormal"><span lang="EN-US" style="font-size:12.0pt">Intel(R) Xeon(R) CPU E5-2680 v3 @ 2.50GHz Haswell</span></p><p class="MsoNormal"><br></p><p class="MsoNormal"># Step Nr. Time[fs] Kin.[a.u.] Temp[K] Pot.[a.u.] Cons Qty[a.u.] UsedTime[s]</p><p class="MsoNormal"> 0 0.000000 9.566949152 2000.000000000 -170544.785566084 -170535.208832257 0.000000000</p><p class="MsoNormal"> 1 1.000000 9.646234174 2016.574776405 -170554.174550500 -170544.519479220 13708.945765018</p><p class="MsoNormal"> 2 2.000000 9.903391164 2070.334232377 -170556.710812560 -170546.798982374 1826.637025118</p><p class="MsoNormal"> 3 3.000000 10.258759808 2144.625134870 -170557.585906167 -170547.318873932 748.965154886</p><p class="MsoNormal"> 4 4.000000 10.622230399 2220.609774417 -170557.531726730 -170546.901213604 856.725823164</p><p class="MsoNormal"><br></p><p class="MsoNormal">&GLOBAL</p><p class="MsoNormal">  ! limit the runs to 5min</p><p class="MsoNormal">  ! WALLTIME 1000</p><p class="MsoNormal">  ! reduce the amount of IO</p><p class="MsoNormal">  IOLEVEL  LOW</p><p class="MsoNormal">  ! the project name is made part of most output files... useful to keep order </p><p class="MsoNormal">  PROJECT Ni-1008-2k</p><p class="MsoNormal">  ! various runtypes (energy, geo_opt, etc.) available.</p><p class="MsoNormal">  RUN_TYPE MD             </p><p class="MsoNormal">&END GLOBAL</p><p class="MsoNormal"><br></p><p class="MsoNormal">&FORCE_EVAL</p><p class="MsoNormal">  STRESS_TENSOR ANALYTICAL</p><p class="MsoNormal">  ! the electronic structure part of CP2K is named Quickstep</p><p class="MsoNormal">  METHOD Quickstep</p><p class="MsoNormal">  &DFT</p><p class="MsoNormal">    ! basis sets and pseudopotential files can be found in cp2k/data</p><p class="MsoNormal">    BASIS_SET_FILE_NAME BASIS_SET</p><p class="MsoNormal">    POTENTIAL_FILE_NAME GTH_POTENTIALS            </p><p class="MsoNormal"><br></p><p class="MsoNormal">    ! Charge and multiplicity</p><p class="MsoNormal">    CHARGE 0</p><p class="MsoNormal">    MULTIPLICITY 1</p><p class="MsoNormal"><br></p><p class="MsoNormal">    &MGRID</p><p class="MsoNormal">       ! PW cutoff ... depends on the element (basis) too small cutoffs lead to the eggbox effect.</p><p class="MsoNormal">       ! certain calculations (e.g. geometry optimization, vibrational frequencies,</p><p class="MsoNormal">       ! NPT and cell optimizations, need higher cutoffs)</p><p class="MsoNormal">       CUTOFF [Ry] 300 !500 </p><p class="MsoNormal">    &END</p><p class="MsoNormal"><br></p><p class="MsoNormal">    &QS</p><p class="MsoNormal">       ! use the GPW method (i.e. pseudopotential based calculations with the Gaussian and Plane Waves scheme).</p><p class="MsoNormal">       METHOD GPW </p><p class="MsoNormal">       ! default threshold for numerics ~ roughly numerical accuracy of the total energy per electron,</p><p class="MsoNormal">       ! sets reasonable values for all other thresholds.</p><p class="MsoNormal">       EPS_DEFAULT 1.0E-7 !10 </p><p class="MsoNormal">       ! used for MD, the method used to generate the initial guess.</p><p class="MsoNormal">       EXTRAPOLATION ASPC </p><p class="MsoNormal">    &END</p><p class="MsoNormal"><br></p><p class="MsoNormal">    &POISSON</p><p class="MsoNormal">       PERIODIC XYZ ! the default, gas phase systems should have 'NONE' and a wavelet solver</p><p class="MsoNormal">    &END</p><p class="MsoNormal"><br></p><p class="MsoNormal">!    &PRINT</p><p class="MsoNormal">!       ! at the end of the SCF procedure generate cube files of the density</p><p class="MsoNormal">!       &E_DENSITY_CUBE OFF</p><p class="MsoNormal">!       &END E_DENSITY_CUBE</p><p class="MsoNormal">!       ! compute eigenvalues and homo-lumo gap each 20nd MD step</p><p class="MsoNormal">!       &MO_CUBES</p><p class="MsoNormal">!          ! compute 4 unoccupied orbital energies</p><p class="MsoNormal">!          NLUMO 4</p><p class="MsoNormal">!          NHOMO 4</p><p class="MsoNormal">!          ! but don't write the cube files</p><p class="MsoNormal">!          WRITE_CUBE .FALSE.</p><p class="MsoNormal">!          ! do this every 10th MD step.</p><p class="MsoNormal">!          &EACH</p><p class="MsoNormal">!            MD 20</p><p class="MsoNormal">!          &END</p><p class="MsoNormal">!       &END</p><p class="MsoNormal">!    &END</p><p class="MsoNormal"><br></p><p class="MsoNormal">    ! use the OT METHOD for robust and efficient SCF, suitable for all non-metallic systems.</p><p class="MsoNormal">    &SCF                              </p><p class="MsoNormal">      SCF_GUESS ATOMIC ! can be used to RESTART an interrupted calculation</p><p class="MsoNormal">      MAX_SCF 50</p><p class="MsoNormal">      EPS_SCF 1.0E-4 ! accuracy of the SCF procedure typically 1.0E-6 - 1.0E-7</p><p class="MsoNormal">      ! do not store the wfn during MD</p><p class="MsoNormal">      &PRINT</p><p class="MsoNormal">        &RESTART OFF</p><p class="MsoNormal">        &END</p><p class="MsoNormal">      &END</p><p class="MsoNormal">      </p><p class="MsoNormal">      &OT</p><p class="MsoNormal">        ! an accurate preconditioner suitable also for larger systems</p><p class="MsoNormal">        PRECONDITIONER FULL_SINGLE_INVERSE</p><p class="MsoNormal">        ! the most robust choice (DIIS might sometimes be faster, but not as stable).</p><p class="MsoNormal">        MINIMIZER DIIS</p><p class="MsoNormal">      &END OT</p><p class="MsoNormal">      &OUTER_SCF ! repeat the inner SCF cycle 10 times</p><p class="MsoNormal">        MAX_SCF 20</p><p class="MsoNormal">        EPS_SCF 1.0E-4 ! must match the above</p><p class="MsoNormal">      &END</p><p class="MsoNormal">    &END SCF</p><p class="MsoNormal"><br></p><p class="MsoNormal">    ! specify the exchange and correlation treatment</p><p class="MsoNormal">    &XC</p><p class="MsoNormal">      ! use a PBE functional </p><p class="MsoNormal">      &XC_FUNCTIONAL </p><p class="MsoNormal">         &PBE</p><p class="MsoNormal">         &END</p><p class="MsoNormal">      &END XC_FUNCTIONAL</p><p class="MsoNormal">    &END XC</p><p class="MsoNormal">  &END DFT</p><p class="MsoNormal"> </p><p class="MsoNormal">  ! description of the system</p><p class="MsoNormal">  &SUBSYS</p><p class="MsoNormal">    &CELL </p><p class="MsoNormal">      ! unit cells that are orthorhombic are more efficient with CP2K</p><p class="MsoNormal">      ABC [angstrom] 21.98167992 21.98167992 25.64529419</p><p class="MsoNormal">    &END CELL</p><p class="MsoNormal"><br></p><p class="MsoNormal">    ! atom coordinates can be in the &COORD section,</p><p class="MsoNormal">    ! or provided as an external file.</p><p class="MsoNormal">    &TOPOLOGY</p><p class="MsoNormal">      COORD_FILE_NAME Ni-1008-2k.xyz</p><p class="MsoNormal">      COORD_FILE_FORMAT XYZ</p><p class="MsoNormal">    &END</p><p class="MsoNormal"><br></p><p class="MsoNormal">    ! MOLOPT basis sets are fairly costly,</p><p class="MsoNormal">    ! but in the 'DZVP-MOLOPT-SR-GTH' available for all elements</p><p class="MsoNormal">    ! their contracted nature makes them suitable</p><p class="MsoNormal">    ! for condensed and gas phase systems alike.</p><p class="MsoNormal">    &KIND Ni                              </p><p class="MsoNormal">      BASIS_SET DZV-GTH-PADE        </p><p class="MsoNormal">      POTENTIAL GTH-PBE-q18             </p><p class="MsoNormal">    &END KIND</p><p class="MsoNormal">  &END SUBSYS</p><p class="MsoNormal">&END FORCE_EVAL</p><p class="MsoNormal"><br></p><p class="MsoNormal">! how to propagate the system, selection via RUN_TYPE in the &GLOBAL section</p><p class="MsoNormal">&MOTION</p><p class="MsoNormal">! &GEO_OPT</p><p class="MsoNormal">!   OPTIMIZER LBFGS ! Good choice for 'small' systems (use LBFGS for large systems)</p><p class="MsoNormal">!   MAX_ITER  100</p><p class="MsoNormal">!   MAX_DR    [bohr] 0.003 ! adjust target as needed</p><p class="MsoNormal">!   &BFGS</p><p class="MsoNormal">!   &END</p><p class="MsoNormal">!  &END</p><p class="MsoNormal"> &MD</p><p class="MsoNormal">   ENSEMBLE NPT_I  ! sampling the canonical ensemble, accurate properties might need NVE</p><p class="MsoNormal">   TEMPERATURE [K] 2000</p><p class="MsoNormal">   TIMESTEP [fs] 1</p><p class="MsoNormal">   STEPS 1000000</p><p class="MsoNormal">   # GLE thermostat as generated at <a href="http://epfl-cosmo.github.io/gle4md" target="_blank" rel="nofollow" onmousedown="this.href='http://www.google.com/url?q\x3dhttp%3A%2F%2Fepfl-cosmo.github.io%2Fgle4md\x26sa\x3dD\x26sntz\x3d1\x26usg\x3dAFQjCNFTPPvBlKuANngeLG-fs7SSHzZUtQ';return true;" onclick="this.href='http://www.google.com/url?q\x3dhttp%3A%2F%2Fepfl-cosmo.github.io%2Fgle4md\x26sa\x3dD\x26sntz\x3d1\x26usg\x3dAFQjCNFTPPvBlKuANngeLG-fs7SSHzZUtQ';return true;">http://epfl-cosmo.github.io/<wbr>gle4md</a> </p><p class="MsoNormal">   # GLE provides an effective NVT sampling.</p><p class="MsoNormal">   &BAROSTAT</p><p class="MsoNormal">       PRESSURE 1.0</p><p class="MsoNormal">   &END BAROSTAT</p><p class="MsoNormal">   &THERMOSTAT</p><p class="MsoNormal">      &NOSE</p><p class="MsoNormal">      &END NOSE</p><p class="MsoNormal">   &END THERMOSTAT</p><p class="MsoNormal"> &END MD</p><p class="MsoNormal"> &PRINT</p><p class="MsoNormal">   &TRAJECTORY</p><p class="MsoNormal">     &EACH</p><p class="MsoNormal">       MD 100</p><p class="MsoNormal">     &END EACH</p><p class="MsoNormal">   &END TRAJECTORY</p><p class="MsoNormal">   &VELOCITIES OFF</p><p class="MsoNormal">   &END VELOCITIES</p><p class="MsoNormal">   &FORCES OFF</p><p class="MsoNormal">   &END FORCES</p><p class="MsoNormal">   &RESTART_HISTORY</p><p class="MsoNormal">     &EACH</p><p class="MsoNormal">       MD 200</p><p class="MsoNormal">     &END EACH</p><p class="MsoNormal">   &END RESTART_HISTORY</p><p class="MsoNormal">   &RESTART</p><p class="MsoNormal">     BACKUP_COPIES 3</p><p class="MsoNormal">     &EACH</p><p class="MsoNormal">       MD 200</p><p class="MsoNormal">     &END EACH</p><p class="MsoNormal">   &END RESTART</p><p class="MsoNormal">  &END PRINT</p><p class="MsoNormal">&END</p></div></blockquote></div></div>