<div dir="ltr">Dear Farah,<div>OK, this is the comparison of the two runs for functions where I see the highest timing discrepancy (time in seconds, second column w/ MKL, third column w/o MKL)</div><div><br></div><div><span style="font-family:monospace"><span style="color: rgb(0, 0, 0);">dbcsr_make_untransposed_blocks     4.139</span><span style="color: rgb(84, 84, 255);">     1.591</span><br></span></div><div><span style="font-family:monospace"><span style="color: rgb(0, 0, 0);">cp_fm_gemm                         5.691</span><span style="color: rgb(84, 84, 255);">     1.087</span><br></span></div><div><span style="font-family:monospace"><span style="color: rgb(0, 0, 0);">setup_rec_index_2d                 6.330</span><span style="color: rgb(84, 84, 255);">     1.741</span><br></span></div><div><span style="font-family:monospace"><span style="color: rgb(0, 0, 0);">cp_fm_cholesky_decompose          11.539</span><span style="color: rgb(84, 84, 255);">     1.703  </span><br></span></div><div><span style="font-family:monospace"><span style="color: rgb(0, 0, 0);">cp_fm_cholesky_invert             26.048</span><span style="color: rgb(84, 84, 255);">     3.031 </span><br></span></div><div><br></div><div>Well, personally I don't understand the differences in the 1st and 3rd line, likely it was a fluctuation.</div><div>For the other lines, these are MKL related (DGEMM and Cholesky decomposition). My suspicious is that you are using MKL in sequential, while Openblas is somehow using threads. A way to test it is to run with a single thread (or less threads in general), the difference should become smaller. I would also suggest to use the PSMP version.</div><div><br></div><div>Alfio</div><div><br><br>Il giorno giovedì 2 novembre 2017 15:33:13 UTC+1, Faraz H ha scritto:<blockquote class="gmail_quote" style="margin: 0;margin-left: 0.8ex;border-left: 1px #ccc solid;padding-left: 1ex;"><div dir="ltr">Thanks, I am attaching the output of two runs. One with the gcc4.9 executable and other with the MKL libraries and gcc4.9. Interestingly the results are not always consistent when I run the model multiple times. Sometimes the MKL one is faster by ~30 seconds overall. Sometimes slower. So perhaps something going on my system. Curious what you see.<br></div></blockquote></div></div>