<div dir="ltr"><div>Sorry, I'm confused... In your previous table, I see that you have</div><div><br></div><div><div>Intel PSMP OMP=1 gives</div><div>85.1906685165 time 434.5</div></div><div><br></div><div>In your last table, MPI1OMP1 takes </div><div><br></div><div>Used time                  =                1.739<br></div><div><br></div><div>Could you compare these two cases? I don't see any reason for such a large difference besides a numerical problem...</div><div><br></div>OK, I see that CP2K people will soon have a test based on 18.0.5 and PSMP (see https://github.com/cp2k/cp2k/pull/158/commits/11ad8588ee2cf6bbdbb9dcd78e62a30da96d8c1c ). Let's see if there is something wrong for the compiler, at least on the Xeon. Sorry to repeat myself, the only strategy I see is to have a common baseline... </div>