Thanks a lot!  I feel that it was so "dangerous" for me if I didn't ask....<br><br>Sincerely, Yunfeng<br><br><div class="gmail_quote">On Mon, Mar 24, 2008 at 2:17 PM, Teodoro Laino <<a href="mailto:teodor...@gmail.com">teodor...@gmail.com</a>> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Dear Yunfeng,<br>
<br>
I guess you're definitely not aware of what you were running.<br>
That input file is not there to do performance analysis (there's a<br>
benchmark directory instead!)<br>
In few months, when you will have a more solid cp2k background,  you<br>
will open again that input file and you will realize that<br>
the file 32H2O-md.inp is highly IO bounded.<br>
RESTART of the wavefunctions are written at every SCF step and<br>
restart files at every MD step and since the IO (at least in cp2k)<br>
are non-parallel operations your code will never scale..<br>
<br>
I just modified for you the input file and I have run from 1 to 32<br>
procs and these are the data:<br>
<br>
1_proc/32H2O-md.out:    - 3294.21<br>
2_proc/32H2O-md.out:    - 1898.79  (1.73)<br>
4_proc/32H2O-md.out:    - 1038.44  (1.82)<br>
8_proc/32H2O-md.out:    -   572.58  (1.81)<br>
16_proc/32H2O-md.out:  -   334.94  (1.71)<br>
32_proc/32H2O-md.out:  -   242.30  (1.38)<br>
<br>
Timings are in seconds and in parentheses the speed w.r.t the same<br>
job with half number of processor (ideally 2).<br>
The writing of  the wfn restart file can easily take 1 second each<br>
time.. and in that run it is going to be written ~500 times.<br>
This justifies your timings!!!<br>
<br>
Keep in mind that these jobs have run on a dual core machine (like<br>
yours).. it is possible to have ration closer to 2 (?!?) when using<br>
single core processors.<br>
<br>
I can understand the psychology behind the hurries of  testing how<br>
well a code is scaling.. but...<br>
to do that you need to know what you are doing.. and know it very<br>
well.. even with very user friendly codes!<br>
In attachment all the data, for you and for all the people that in<br>
the future want something to compare..<br>
<br>
Teo<br>
<br>
<br>
<br>
<br><br>
<br>
On 24 Mar 2008, at 18:44, LIANG Yunfeng wrote:<br>
<br>
> Dear All,<br>
><br>
> The analyst help me set up cp2k (with the PGI compiler) in Linux<br>
> Opteron cluster with Infiniband interconnect, where each node has 2<br>
> Opteron CPUs (2.40GHz) and 2 GB of memory.<br>
><br>
> He gives the reports as below:<br>
><br>
> Running on 2 processors, this completed the 32H2O-md.inp<br>
> problem in about 32 minutes....<br>
><br>
> I also ran it on 4 processors, which took a little over 20 minutes.<br>
> I then ran it on 8 processors and found it took just under 20 minutes.<br>
> So, the program is not scaling very well as the number of processors<br>
> is increased.<br>
><br>
> ....<br>
><br>
> I think cp2k is still heavily bounded with OpenMP, so the<br>
> performance can only be like the above, am I right?<br>
><br>
> Thank you<br>
> Sincerely, Yunfeng<br>
><br>
> --~--~---------~--~----~------------~-------~--~----~<br>
> You received this message because you are subscribed to the Google<br>
> Groups "cp2k" group.<br>
> To post to this group, send email to <a href="mailto:cp...@googlegroups.com">cp...@googlegroups.com</a><br>
> To unsubscribe from this group, send email to cp2k-<br>
> <a href="mailto:unsub...@googlegroups.com">unsub...@googlegroups.com</a><br>
> For more options, visit this group at <a href="http://groups.google.com/" target="_blank">http://groups.google.com/</a><br>
> group/cp2k?hl=en<br>
> -~----------~----~----~----~------~----~------~--~---<br>
><br>
<br>
<br></blockquote></div><br>