<div dir="ltr">Hi Flo, <br><br>I've made tens of additional tests with the FULL_KINETIC preconditioner, <br>increasing progressively  the value of the ENERGY_GAP to very large <br>values (like 5 Ha). In the best case, this tends only to delay the occurence <br>of the convergence issue. <br><br>So, for the studied open-shell system, the FULL_ALL preconditioner remains <br>the best choice despite its computational cost. I was using an MPI+OMP <br>version of  CP2K-2.5.1; switching to the pure MPI version divides the time <br>taken by the first SCF cycle by 3~4, and this does more than compensate <br>for the increase of the time taken by the next cycles. <br><br>Linking the code to the ELPA2-2013.11.008 library reduces the time taken by <br>the first SCF cycle by some additonal and significant 10~14%! Unfortunately, <br>the MD simulation gets killed after a few hundreds cycle by the OOM killer. <br>Granting more memory to each process by decreasing the number of processes <br>per node allows to delay the occurence of the problem. This suggests a memory <br>leak; but, not being familiar with the code, I cannot track it down. I read the <br>cp_fm_elpa routine in the file src/cp_fm_diag.F, and it seems to me that the <br>allocated memories are returned at the end of the call to the function, but I may <br>be wrong. <br><br>If you have time, could you please have a look at this? so as to point me to some <br>directions ot explore? <br><br>Please note that I've compiled the ELPA2-2013.11.008 library with only the generic <br>fortran kernels.<br><br>Cheers, <br>Max<br><br></div>