<div dir="ltr"><div>Hello,</div><div>this is correct. Usually I use 100 jobs with 6 hours with 8 threads on Sandy Bridge (btw, tiny1 is the slowest phase).  </div><div>Now, I can suggest you two viabile options:</div><div>1) Download pre-compiled version from https://www.cp2k.org/static/downloads/libsmm/</div><div>2) Use the libxsmm by Intel (best choice for the future). Actually you can use the JIT version of libxsmm, so practically you don't need to pre-compile the kernels...</div><div><br></div><div>I hope this answer to your question.</div><div><br></div><div>Alfio</div><div><br></div><br><br>Il giorno martedì 7 giugno 2016 12:46:12 UTC+2, la...@iu.edu ha scritto:<blockquote class="gmail_quote" style="margin: 0;margin-left: 0.8ex;border-left: 1px #ccc solid;padding-left: 1ex;"><div dir="ltr">This is probably a very stupid question...<div><br></div><div>When I was trying to compile LibSMM on our supercomputer, it appears that even when split into 100 jobs, the time taken for each job to compile was well beyond the default limits (even for tiny1).  I would like to see if there is any advice on why this might be the case, and if there are any best practices on how to compile LibSMM.</div><div><br></div><div>Thanks!</div></div></blockquote></div>