<div dir="ltr">Hi developers,<div><br></div><div>CP2K may need extra cost in the first launch kernel when using GPU. It needs to load related code into GPU memory. The cost should depends on the size of kernel object code.</div><div>This behavior will not need to do again in the process life cycle if GPU memory is enough.</div><div><br></div><div>Is there any way to by pass the first launch time when we are doing the benchmark testing? In this way, we can observe the real cost of total kernel cost.</div><div>For an example, running a benchmark test with specified iterations in one CP2K process lifecycle and having a result of average without the first time.</div><div><br></div><div>Thanks,</div><div>Vitesse.</div></div>