<div dir="ltr">Hello everyone,<div><br></div><div>I seem to have stumbled on something. I noticed some funny scaling (or rather, a lack of scaling) when performing AIMD simulations with DFT-D3. I've tracked the problem to the calculation of the C9 term, when I have that set to be calculated the simulation doesn't scale at all and it takes a long time versus when I have it set to not be calculated, in which case I do get linear scaling. Below is a timing report for the same exact INPUT file, with the only difference being the calculation of the C9 term being set to T and F, respectively. Something interesting is how different they are. Again, these are from the exact same INPUT file, with the exact same number of processors, and the only difference is the CALCULATE_C9_TERM Â is set to T in the first case and F in the second. </div><div><br></div><div>timing with C9 calculation:</div><div><br></div><div><div><font face="courier new, monospace"> -------------------------------------------------------------------------------</font></div><div><font face="courier new, monospace"> - Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  -</font></div><div><font face="courier new, monospace"> - Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â T I M I N G Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â -</font></div><div><font face="courier new, monospace"> - Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  -</font></div><div><font face="courier new, monospace"> -------------------------------------------------------------------------------</font></div><div><font face="courier new, monospace"> SUBROUTINE Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  CALLS Â ASD Â  Â  Â  Â  SELF TIME Â  Â  Â  Â TOTAL TIME</font></div><div><font face="courier new, monospace">  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  MAXIMUM Â  Â  Â  AVERAGE Â MAXIMUM Â AVERAGE Â MAXIMUM</font></div><div><font face="courier new, monospace"> CP2K Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  1 Â 1.0 Â  Â 0.008 Â  Â 0.019 Â 772.815 Â 772.821</font></div><div><font face="courier new, monospace"> qs_mol_dyn_low Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  1 Â 2.0 Â  Â 0.002 Â  Â 0.003 Â 772.503 Â 772.517</font></div><div><font face="courier new, monospace"> qs_forces Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  11 Â 3.9 Â  Â 0.002 Â  Â 0.002 Â 771.252 Â 771.258</font></div><div><font face="courier new, monospace"> qs_energies Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  11 Â 4.9 Â  Â 0.001 Â  Â 0.001 Â 765.300 Â 765.307</font></div><div><font face="courier new, monospace"> velocity_verlet Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  10 Â 3.0 Â  Â 0.002 Â  Â 0.002 Â 686.306 Â 686.323</font></div><div><font face="courier new, monospace"> qs_energies_init_hamiltonians Â  Â  Â  11 Â 5.9 Â  Â 0.000 Â  Â 0.000 Â 686.298 Â 686.303</font></div><div><font face="courier new, monospace"> mp_sum_d Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 4362 11.6 Â 619.789 Â 685.783 Â 619.789 Â 685.783</font></div><div><font face="courier new, monospace"> calculate_dispersion_pairpot Â  Â  Â  Â 11 Â 6.9 Â  65.911 Â 685.372 Â 685.486 Â 685.491</font></div><div><font face="courier new, monospace"> scf_env_do_scf Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 11 Â 5.9 Â  Â 0.000 Â  Â 0.001 Â  76.654 Â  76.655</font></div><div><font face="courier new, monospace"> scf_env_do_scf_inner_loop Â  Â  Â  Â  Â 139 Â 6.7 Â  Â 0.004 Â  Â 0.030 Â  71.107 Â  71.468</font></div><div><font face="courier new, monospace"> rebuild_ks_matrix Â  Â  Â  Â  Â  Â  Â  Â  Â 150 Â 8.5 Â  Â 0.000 Â  Â 0.001 Â  52.308 Â  52.341</font></div><div><font face="courier new, monospace"> qs_ks_build_kohn_sham_matrix Â  Â  Â  150 Â 9.5 Â  Â 0.017 Â  Â 0.021 Â  52.307 Â  52.340</font></div><div><font face="courier new, monospace"> qs_ks_update_qs_env Â  Â  Â  Â  Â  Â  Â  Â 151 Â 7.7 Â  Â 0.001 Â  Â 0.001 Â  47.661 Â  47.693</font></div><div><font face="courier new, monospace"> pw_transfer Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  4061 12.2 Â  Â 0.239 Â  Â 0.267 Â  35.026 Â  35.154</font></div><div><font face="courier new, monospace"> fft_wrap_pw1pw2 Â  Â  Â  Â  Â  Â  Â  Â  Â  3761 13.2 Â  Â 0.028 Â  Â 0.031 Â  34.447 Â  34.575</font></div><div><font face="courier new, monospace"> fft_wrap_pw1pw2_350 Â  Â  Â  Â  Â  Â  Â  1661 14.3 Â  Â 2.499 Â  Â 2.594 Â  32.640 Â  32.789</font></div><div><font face="courier new, monospace"> qs_vxc_create Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 150 10.5 Â  Â 0.003 Â  Â 0.004 Â  30.531 Â  30.553</font></div><div><font face="courier new, monospace"> xc_vxc_pw_create Â  Â  Â  Â  Â  Â  Â  Â  Â  150 11.5 Â  Â 1.027 Â  Â 1.065 Â  30.528 Â  30.551</font></div><div><font face="courier new, monospace"> fft3d_ps Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 3761 15.2 Â  12.507 Â  12.766 Â  28.236 Â  28.478</font></div><div><font face="courier new, monospace"> qs_rho_update_rho Â  Â  Â  Â  Â  Â  Â  Â  Â 150 Â 7.8 Â  Â 0.001 Â  Â 0.001 Â  18.349 Â  18.356</font></div><div><font face="courier new, monospace"> calculate_rho_elec Â  Â  Â  Â  Â  Â  Â  Â  150 Â 8.8 Â  Â 3.941 Â  Â 4.247 Â  18.348 Â  18.355</font></div><div><font face="courier new, monospace"> xc_rho_set_and_dset_create Â  Â  Â  Â  150 12.5 Â  Â 0.188 Â  Â 0.193 Â  16.380 Â  16.402</font></div><div><font face="courier new, monospace"> sum_up_and_integrate Â  Â  Â  Â  Â  Â  Â  150 10.5 Â  Â 0.079 Â  Â 0.082 Â  15.635 Â  15.650</font></div><div><font face="courier new, monospace"> integrate_v_rspace Â  Â  Â  Â  Â  Â  Â  Â  150 11.5 Â  Â 4.076 Â  Â 4.275 Â  15.556 Â  15.572</font></div><div><font face="courier new, monospace"> -------------------------------------------------------------------------------</font></div></div><div><font face="arial, sans-serif"><br></font></div><div><font face="arial, sans-serif">Without c9 calculation </font></div><div><font face="courier new, monospace"><br></font></div><div><font face="courier new, monospace"><div> -------------------------------------------------------------------------------</div><div> - Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  -</div><div> - Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â T I M I N G Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â -</div><div> - Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  -</div><div> -------------------------------------------------------------------------------</div><div> SUBROUTINE Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  CALLS Â ASD Â  Â  Â  Â  SELF TIME Â  Â  Â  Â TOTAL TIME</div><div>  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  MAXIMUM Â  Â  Â  AVERAGE Â MAXIMUM Â AVERAGE Â MAXIMUM</div><div> CP2K Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  1 Â 1.0 Â  Â 0.010 Â  Â 0.023 Â  98.369 Â  98.371</div><div> qs_mol_dyn_low Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  1 Â 2.0 Â  Â 0.002 Â  Â 0.003 Â  98.009 Â  98.019</div><div> qs_forces Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  11 Â 3.9 Â  Â 0.002 Â  Â 0.002 Â  97.695 Â  97.697</div><div> qs_energies Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  11 Â 4.9 Â  Â 0.001 Â  Â 0.001 Â  91.392 Â  91.395</div><div> scf_env_do_scf Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 11 Â 5.9 Â  Â 0.000 Â  Â 0.001 Â  84.901 Â  84.903</div><div> scf_env_do_scf_inner_loop Â  Â  Â  Â  Â 139 Â 6.7 Â  Â 0.004 Â  Â 0.028 Â  78.845 Â  79.075</div><div> velocity_verlet Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  10 Â 3.0 Â  Â 0.002 Â  Â 0.002 Â  67.867 Â  67.871</div><div> rebuild_ks_matrix Â  Â  Â  Â  Â  Â  Â  Â  Â 150 Â 8.5 Â  Â 0.000 Â  Â 0.001 Â  55.485 Â  55.544</div><div> qs_ks_build_kohn_sham_matrix Â  Â  Â  150 Â 9.5 Â  Â 0.017 Â  Â 0.020 Â  55.484 Â  55.543</div><div> qs_ks_update_qs_env Â  Â  Â  Â  Â  Â  Â  Â 151 Â 7.7 Â  Â 0.001 Â  Â 0.001 Â  50.557 Â  50.612</div><div> pw_transfer Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  3461 12.2 Â  Â 0.206 Â  Â 0.259 Â  37.722 Â  37.838</div><div> fft_wrap_pw1pw2 Â  Â  Â  Â  Â  Â  Â  Â  Â  3161 13.2 Â  Â 0.027 Â  Â 0.033 Â  37.180 Â  37.297</div><div> fft_wrap_pw1pw2_350 Â  Â  Â  Â  Â  Â  Â  1661 14.3 Â  Â 2.439 Â  Â 2.559 Â  34.568 Â  34.695</div><div> qs_vxc_create Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 150 10.5 Â  Â 0.003 Â  Â 0.004 Â  31.774 Â  31.801</div><div> xc_vxc_pw_create Â  Â  Â  Â  Â  Â  Â  Â  Â  150 11.5 Â  Â 1.015 Â  Â 1.048 Â  31.771 Â  31.798</div><div> fft3d_ps Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 3161 15.2 Â  12.404 Â  12.688 Â  31.074 Â  31.311</div><div> qs_rho_update_rho Â  Â  Â  Â  Â  Â  Â  Â  Â 150 Â 7.8 Â  Â 0.001 Â  Â 0.001 Â  20.139 Â  20.150</div><div> calculate_rho_elec Â  Â  Â  Â  Â  Â  Â  Â  150 Â 8.8 Â  Â 3.909 Â  Â 4.230 Â  20.138 Â  20.149</div><div> sum_up_and_integrate Â  Â  Â  Â  Â  Â  Â  150 10.5 Â  Â 0.077 Â  Â 0.081 Â  17.172 Â  17.191</div><div> integrate_v_rspace Â  Â  Â  Â  Â  Â  Â  Â  150 11.5 Â  Â 4.070 Â  Â 4.271 Â  17.094 Â  17.111</div><div> xc_rho_set_and_dset_create Â  Â  Â  Â  150 12.5 Â  Â 0.185 Â  Â 0.190 Â  16.948 Â  16.973</div><div> rs_pw_transfer Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 1822 12.1 Â  Â 0.020 Â  Â 0.024 Â  15.129 Â  15.437</div><div> mp_alltoall_z22v Â  Â  Â  Â  Â  Â  Â  Â  Â 3161 17.2 Â  15.000 Â  15.294 Â  15.000 Â  15.294</div><div> density_rs2pw Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 150 Â 9.8 Â  Â 0.007 Â  Â 0.009 Â  14.718 Â  14.977</div><div> qs_scf_new_mos Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  139 Â 7.7 Â  Â 0.001 Â  Â 0.001 Â  14.120 Â  14.173</div><div> qs_scf_loop_do_ot Â  Â  Â  Â  Â  Â  Â  Â  Â 139 Â 8.7 Â  Â 0.001 Â  Â 0.001 Â  14.120 Â  14.173</div><div> dbcsr_multiply_generic Â  Â  Â  Â  Â  Â 2770 12.6 Â  Â 0.073 Â  Â 0.082 Â  13.810 Â  13.940</div><div> ot_scf_mini Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 139 Â 9.7 Â  Â 0.005 Â  Â 0.006 Â  13.225 Â  13.279</div><div> potential_pw2rs Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 150 12.5 Â  Â 0.010 Â  Â 0.013 Â  12.324 Â  12.362</div><div> x_to_yz Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  1050 16.5 Â  Â 1.546 Â  Â 1.618 Â  Â 9.447 Â  Â 9.550</div><div> multiply_cannon Â  Â  Â  Â  Â  Â  Â  Â  Â  2770 13.6 Â  Â 0.293 Â  Â 0.307 Â  Â 8.197 Â  Â 8.790</div><div> yz_to_x Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 911 16.0 Â  Â 1.073 Â  Â 1.104 Â  Â 8.140 Â  Â 8.355</div><div> mp_waitall_1 Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 427928 15.4 Â  Â 7.704 Â  Â 8.344 Â  Â 7.704 Â  Â 8.344</div><div> ot_mini Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 139 10.7 Â  Â 0.001 Â  Â 0.001 Â  Â 8.062 Â  Â 8.132</div><div> qs_ot_get_derivative Â  Â  Â  Â  Â  Â  Â  139 11.7 Â  Â 0.002 Â  Â 0.002 Â  Â 6.714 Â  Â 6.768</div><div> xc_functional_eval Â  Â  Â  Â  Â  Â  Â  Â  150 13.5 Â  Â 0.002 Â  Â 0.004 Â  Â 6.023 Â  Â 6.043</div><div> pbe_lda_eval Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  150 14.5 Â  Â 6.021 Â  Â 6.041 Â  Â 6.021 Â  Â 6.041</div><div> init_scf_loop Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  12 Â 6.8 Â  Â 0.000 Â  Â 0.000 Â  Â 5.780 Â  Â 5.780</div><div> qs_ks_update_qs_env_forces Â  Â  Â  Â  Â 11 Â 4.9 Â  Â 0.000 Â  Â 0.000 Â  Â 4.981 Â  Â 4.985</div><div> rs_pw_transfer_PW2RS_350 Â  Â  Â  Â  Â  161 14.2 Â  Â 2.271 Â  Â 2.444 Â  Â 4.256 Â  Â 4.435</div><div> mp_waitany Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  18660 14.0 Â  Â 3.701 Â  Â 4.433 Â  Â 3.701 Â  Â 4.433</div><div> make_m2s Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 5540 13.6 Â  Â 0.087 Â  Â 0.097 Â  Â 4.247 Â  Â 4.358</div><div> rs_pw_transfer_RS2PW_350 Â  Â  Â  Â  Â  161 11.6 Â  Â 2.137 Â  Â 2.399 Â  Â 3.706 Â  Â 3.947</div><div> make_images Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  5540 14.6 Â  Â 0.322 Â  Â 0.341 Â  Â 3.720 Â  Â 3.811</div><div> qs_ot_get_derivative_taylor Â  Â  Â  Â 110 12.9 Â  Â 0.003 Â  Â 0.004 Â  Â 3.646 Â  Â 3.691</div><div> qs_energies_init_hamiltonians Â  Â  Â  11 Â 5.9 Â  Â 0.000 Â  Â 0.000 Â  Â 3.259 Â  Â 3.259</div><div> multiply_cannon_multrec Â  Â  Â  Â  Â 33240 14.6 Â  Â 2.695 Â  Â 3.049 Â  Â 2.705 Â  Â 3.060</div><div> qs_ot_get_p Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 151 10.5 Â  Â 0.001 Â  Â 0.001 Â  Â 2.871 Â  Â 2.945</div><div> init_scf_run Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 11 Â 5.9 Â  Â 0.000 Â  Â 0.001 Â  Â 2.925 Â  Â 2.925</div><div> scf_env_initial_rho_setup Â  Â  Â  Â  Â  11 Â 6.9 Â  Â 0.000 Â  Â 0.000 Â  Â 2.925 Â  Â 2.925</div><div><div> multiply_cannon_metrocomm1 Â  Â  Â  33240 14.6 Â  Â 0.049 Â  Â 0.053 Â  Â 2.285 Â  Â 2.914</div><div> multiply_cannon_metrocomm3 Â  Â  Â  33240 14.6 Â  Â 0.040 Â  Â 0.045 Â  Â 0.735 Â  Â 2.682</div><div> mp_sum_d Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 4362 11.6 Â  Â 2.357 Â  Â 2.664 Â  Â 2.357 Â  Â 2.664</div><div> wfi_extrapolate Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  11 Â 7.9 Â  Â 0.000 Â  Â 0.001 Â  Â 2.650 Â  Â 2.650</div><div> calculate_dispersion_pairpot Â  Â  Â  Â 11 Â 6.9 Â  Â 0.219 Â  Â 2.076 Â  Â 2.327 Â  Â 2.327</div><div> make_images_sizes Â  Â  Â  Â  Â  Â  Â  Â  5540 15.6 Â  Â 0.006 Â  Â 0.007 Â  Â 1.394 Â  Â 1.992</div><div> mp_alltoall_i44 Â  Â  Â  Â  Â  Â  Â  Â  Â  5540 16.6 Â  Â 1.388 Â  Â 1.986 Â  Â 1.388 Â  Â 1.986</div><div> -------------------------------------------------------------------------------</div></div><div><br></div></font></div><div><font face="courier new, monospace"><br></font></div><div><br></div></div>