<div dir="ltr">Hi Joe,<div>sorry I was busy with a workshop this week, don't have much time to reply to you.</div><div>First of all, it is a good idea to switch everything to Intel compiler. I found that it gives better performance than GNU when compiling libsmm.</div><div>Then, I understood correctly that with this new setup you are able to execute small1 up to</div><div><br></div><div>/output_linux.intel/small_<wbr>find_9_32_32.x > output_linux.intel/small_find_<wbr>9_32_32.out<br></div><div><br></div><div>? If so, than it means that my guess that the the problem was in MKL compatibility with GNU was correct.</div><div>Definitely now you are facing a different problem.</div><div><br></div><div>I downloaded your file and compiled with:</div><div><br></div><div>ifort -O2 -funroll-loops -vec-report2 -warn -xHost -fno-inline-functions -nogen-interfaces -openmp -nolib-inline -static-intel small_find_9_32_32.f90 -o small_find_9_32_32.x -mkl=sequential<br></div><div><br></div><div>and then I did:</div><div><br></div><div>export OMP_NUM_THREADS=1; ./small_find_9_32_32.x<br></div><div><br></div><div>It works for me (ifort version 13.1.0)...</div><div><br></div><div>Now, I can suggest to try to use:</div><div><br></div><div>ulimit -s unlimited<br></div><div><br></div><div>If it still doesn't work, then I can also suggest to try to add this flag during compilation: -heap-arrays 64</div><div>The problem is that Intel compiler puts temporaries on the stack, which might lead to segmentation faults is the stack limit is set to low. </div><div><br></div><div>Alfio</div><div><br></div><div><br></div><div><br><br>Il giorno sabato 14 settembre 2013 09:33:45 UTC+2, Joe Greenstone ha scritto:<blockquote class="gmail_quote" style="margin: 0;margin-left: 0.8ex;border-left: 1px #ccc solid;padding-left: 1ex;"><div dir="ltr"><div> Hi Alfio,</div><div> </div><div>Attached is small_find_9_32_32.f90 so you could compile/link and run it locally.</div><div>If amongst other variations you were to compile/link with the same options I mentioned in my previous reply, it may go some way toward establishing that there is a difference between different levels of the Intel compiler that matter in this case.</div><div> </div><div>Thanks again. </div></div></blockquote></div></div>