Hello,<br><br>I am still struggling to compile CP2K in my laptop both with MPI and CUDA support. <br><br>The laptop has a Core2 Duo processor, 4GB RAM and a Nvidia 8800M GLX card.<br><br>The operating system is 64-bit Debian Sid. I am using GCC 4.6 (except for NVCC, in which case I have to use GCC 4.4 because I am using CUDA version 4.0).<br><br>I am able to compile the code. Before adding -D__DBCSR_CUDA, -lhwloc and -lstdc++ I was even able to run a few tests successfully. Most of them would not run, though.<br><br>After adding those options, the code still compiles but I get the following error:<br><br>---------------------<br>mirix@sopranix:~/Software/cp2k/cp2k-2.3/tests/QS$ /home/mirix/Software/cp2k/cp2k-2.3/exe/Linux-x86-64-GNU-OpenMPI-CUDA/cp2k.popt<br>WARNING: Number of MPI greater than GPUs<br><br>Floating point exception<br>---------------------<br><br>This is my arch file:<br><br>PERL     = perl<br>CC       = mpicc<br>CPP      = cpp<br>NVCC     = /usr/local/cuda/bin/nvcc<br>FC       = mpif90<br>LD       = mpif90<br>AR       = ar -r<br>#DFLAGS   = -D__GFORTRAN -D__CUDA -D__FFTSG -D__FFTSGL -D__FFTW3 -D__CUBLASDP<br>#DFLAGS   = -D__GFORTRAN -D__CUDA -D__FFTSG -D__FFTSGL -D__FFTW3 -D__CUBLASDP -DDGEMM=cuda_d_gemm -Ddgemm=cuda_d_gemm -DDSYMM=gpu_d_symm -Ddsymm=gpu_d_symm<br>#DFLAGS   = -D__GFORTRAN -D__FFTSG -D__FFTSGL -D__FFTW3 -D__CUBLASDP -DDGEMM=cuda_d_gemm -Ddgemm=cuda_d_gemm -DDSYMM=gpu_d_symm -Ddsymm=gpu_d_symm -DDSYEVD=cuda_lapack_dsyevd  -Ddsyevd=cuda_lapack_dsyevd<br><br>DFLAGSBASE   = -D__GFORTRAN -D__PARALLEL -D__SCALAPACK -D__BLACS -D__FFTW3 -D__LIBINT -D__CUDAPW -D__FFTCU -D__FFTSGL -D__FFTSG -D__CUBLASDP -D__DBCSR_CUDA -D__FFTW3 -D__HWLOC<br>DFLAGS   = $(DFLAGSBASE) -DDGEMM=cuda_d_gemm -Ddgemm=cuda_d_gemm -DDSYMM=gpu_d_symm -Ddsymm=gpu_d_symm<br><br>DFLAGSCU  = $(DFLAGSBASE) -Dcpu_d_gemm=dgemm -Dcpu_d_symm=dsymm<br><br>#DFLAGS   = -D__GFORTRAN -D__CUDA -D__FFTCU -D__FFTSGL -D__FFTSG<br>#DFLAGSCU = $(DFLAGS)<br><br>HWTOPO = yes<br>HWLOC = /usr/include/hwloc/<br>CFLAGS   =  $(DFLAGS) -I$(HWLOC) -O2 <br>CPPFLAGS = -traditional -C $(DFLAGS) -P<br>CPPFLAGSCU = -traditional -C $(DFLAGSCU) -P<br>NVFLAGS     = $(DFLAGS) -gencode=arch=compute_11,code=\"sm_11,compute_11\" --compiler-bindir=/usr/local/cuda/bin/gcc<br>FCFLAGS  = $(DFLAGS) -O2<br>FCFLAGSCU = $(DFLAGSCU) -O2<br>LDFLAGS  = $(FCFLAGS)<br>CUDAPATH = /usr/local/cuda/lib64<br>ATLASPATH = /usr/local/atlas/lib<br>LIBINTPATH = /usr/local/libint/1.1.4-stable/lib<br>LIBS     = -L$(CUDAPATH)/libcudart.so\<br>$(CUDAPATH)/libcufft.so\<br>$(CUDAPATH)/libcublas.so\<br>/home/mirix/Software/cp2k/scalapack-2.0.2/libscalapack.a\<br>$(ATLASPATH)/liblapack.a\<br>$(ATLASPATH)/libcblas.a\<br>$(ATLASPATH)/libf77blas.a\<br>$(ATLASPATH)/libptcblas.a\<br>$(ATLASPATH)/libptf77blas.a\<br>$(ATLASPATH)/libatlas.a\<br>$(LIBINTPATH)/libderiv.a\<br>$(LIBINTPATH)/libr12.a\<br>$(LIBINTPATH)/libint.a\<br>/usr/local/lib/libfftw3f.a\<br>/usr/lib/x86_64-linux-gnu/libhwloc.so.5.0.1 -lhwloc\<br>-lstdc++ -lpthread -lrt<br><br>OBJECTS_ARCHITECTURE = machine_gfortran.o<br><br>cuda_cublas.o: cuda_cublas.F<br>    $(CPP) $(CPPFLAGSCU) $< > cuda_cublas.f90<br>    $(FC) -c $(FCFLAGSCU) cuda_cublas.f90<br><br><br><br>