<br><div>Hi All, <br>I have started to use CP2k with GPUs recently. I have observed an important speed up with the OT diagonalization. However, when I use the standard diagonalization I observe a slowdown. Just to give you some numbers with one step of the wavefunction with OT takes on average 0.7 s while with the standard diagonalization it takes around 32 s (with the same system).<br>I was wondering whether this was an installation issue or it is just that standard diagonalization does not <span><span>benefit the GPUS. <br><br>Thanks in advance and best regareds, <br>Omar <br></span></span><div><span><span><span>--<br></span></span></span></div><div><span><span><span>Doctoral student Omar Abou El Kheir</span></span></span></div><div><div><div><span><span><span>Department of Materials Science<br></span></span></span></div><span><span><span>Universita' degli Studi di Milano - Bicocca<br></span></span></span></div><span><span><span><span>Via R. Cozzi 55, Milano, </span><i><span>Italy</span></i></span></span></span></div></div><br>