<blockquote class="gmail_quote" style="margin: 0;margin-left: 0.8ex;border-left: 1px #ccc solid;padding-left: 1ex;"><span style="border-collapse:collapse;font-family:arial, sans-serif;font-size:13px"><div><div><div style="text-align:left"><div><blockquote style="border-collapse:separate;font-family:arial;font-size:small;margin-top:0px;margin-right:0px;margin-bottom:0px;margin-left:40px;border-top-style:none;border-right-style:none;border-bottom-style:none;border-left-style:none;border-width:initial;border-color:initial;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px"><div style="text-align:left"><span style="font-family:arial, sans-serif;font-size:13px"><span style="border-collapse:collapse"><div><br></div></span></span></div></blockquote><font face="arial, sans-serif"><span style="border-collapse:collapse">TRACE revealed that qs_forces,  qs_energies_scf,  scf_env_do_scf,   velocity_verlet,  qs_forces,  qs_energies_scf,   scf_env_do_scf and others are 5 times slower in 2x8 than 2x2</span></font></div>
</div><div><font face="fixed-width, monospace"><span style="font-family:arial, sans-serif;font-size:13px"><br></span></font></div><div><font face="fixed-width, monospace"><span style="font-family:arial, sans-serif;font-size:13px"><br>
</span></font></div><div><font face="arial, sans-serif">Do you have any suggections and ideas why it's happened?</font></div></div></div></span></blockquote><div><br></div><div>this happens a lot with CPUs that have very limited memory bandwith.</div><div>the quickstep algorithm is very demanding in terms of memory bandwidth.</div><div><br></div><blockquote class="gmail_quote" style="margin: 0;margin-left: 0.8ex;border-left: 1px #ccc solid;padding-left: 1ex;"><span style="border-collapse:collapse;font-family:arial, sans-serif;font-size:13px"><div><div><div><font face="arial, sans-serif"><br></font></div><div><font face="arial, sans-serif"><br>
</font></div><div><font face="arial, sans-serif">CP2K version 2.2.262</font></div><div><font face="arial, sans-serif"><div dir="ltr" style="margin-bottom:0.2em;text-align:left;font-size:13px">the lib is MKL-Scalapack</div>
<div dir="ltr" style="margin-bottom:0.2em;text-align:left;font-size:13px">the system is cluster of XEON nodes (8cores/node) with Infiniband switch</div></font></div></div></div></span></blockquote><div><br></div><div>what type of xeon processors exactly? that makes all the difference.</div><div>the 56xx (westmere) and 55xx (nehalem) series ones for example have</div><div>_much_ more memory bandwidth than 54xx (harpertown) series ones.</div><div><br></div><div>cheers,</div><div>     axel.</div><meta http-equiv="content-type" content="text/html; charset=utf-8"><div><br></div><div> </div><blockquote class="gmail_quote" style="margin: 0;margin-left: 0.8ex;border-left: 1px #ccc solid;padding-left: 1ex;"><span style="border-collapse:collapse;font-family:arial, sans-serif;font-size:13px"><div><div><div><font face="arial, sans-serif"><div dir="ltr" style="margin-bottom:0.2em;text-align:left;font-size:13px">
the compiler is Intel's</div></font></div><div><font face="arial, sans-serif"><br></font></div><div><font face="arial, sans-serif">Thank you in advance.</font></div><div><font face="arial, sans-serif">Best regards, Maria.</font></div>
</div></div></span>
</blockquote>