<div dir="ltr">Hi Abhishek,<br><br>I just had a quick look at your outputs. You are not using the same number of MPI ranks for your experiment (Total number of message passing processes: 128/121), maybe some default was changed?<br>Even thought the larger, non-square number of MPI ranks is not optimal for MPI performance, it might improve local multiplications and pdsyevd due to smaller data portions.<br><br>Andreas<br><br></div>