<div dir="ltr">Hi,<div><br></div><div>I just built cp2k 4.1 using DBCSR and CUDA_PW on a cray HPC system with one K20X GPU per node. The single aprun call seems to always launch 3 apruns as can be seen with ps, and one always stops very quickly while the others seem to keep running. I am testing in an interactive qsub, but it seems this is nonstandard behavior and may be problematic in a batched setting. And at any rate, this does not seem like correct mpi behavior based on other programs I have run.</div><div><br></div><div>I wonder if the build was not completely successful? I'm testing with H2O-32.inp from the tests/benchmark directory but this also happened with C.inp.</div><div><br></div><div>Thanks,</div><div><br></div><div>Ada</div></div>