人工智能机器学习语言模型 Ubuntu 安装 CUDA 与 OPENCL

忘仔悠悠糖博客 2024-04-11 6 0

前言：最近需要做一些GPU并行计算，因而入坑CUDA和OPENCL，两者都有用到一些，刚好有点时间，同时记录一些学习过程，排掉一些坑，这篇是环境安装篇，基本跟着走就没什么问题，环境：ubuntu18.04 / ubuntu20.04 显卡：Nvidia

一、CUDA安装

1.查看电脑是否识别GPU

lspci | grep -i nvidia

2.查看电脑可以安装的显卡驱动版本

ubuntu-drivers devices

3.安装显卡驱动，选择上图的recommended

sudo apt install nvidia-driver-XXX

reboot #重启

4.查看显卡信息

nvidia-smi

5.安装CUDA

到nivida官网下载自己可安装的版本

复制Base Installer的执行代码，下载脚本（3个多G，可能有点久）

wget https://developer.download.nvidia.com/compute/cuda/11.4.0/local_installers/cuda_11.4.0_470.42.01_linux.run #选择自己的版本

运行脚本进行安装cuda库

sudo sh cuda_11.4.0_470.42.01_linux.run

在弹出的安装界面中选“continue”，如果选了会跳出安装，就说明安装失败，给了失败日志的路径，可以自己查看原因。

进入下一步，输入accept

把Driver选项的X去掉，不然它会再给你装一次驱动，会冲突，报错。然后选择Install

等待安装，没什么问题就成功了。

6.配置环境变量

gedit ~/.bashrc

最后一行增加

export PATH=$PATH:/usr/local/cuda/bin

export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

注意查看自己的cuda真是安装路径

7.检查是否安装成功

重新打开终端

nvcc -V

8.添加cuda lib 路径

注意自己的版本号

sudo echo '/usr/local/cuda-11.4/lib64/' >> /etc/ld.so.conf

sudo ldconfig

CUDA安装成功之后会在终端当前所在目录库生成一个NVIDIA_CUDA-11.4_Samples的编程例子的文件夹，可以用来测试。直接进去目录里面make就行。

二、OPENCL安装

1.安装

其实CUDA安装是包含了OPENCL的，但是你要使用OPENCL还需要配置一下。

也可以单独安装头文件和库

sudo apt install opencl-headers

sudo apt install ocl-icd-libopencl1

sudo apt install ocl-icd-opencl-dev

sudo apt install clinfo

#sudo apt install intel-opencl-icd #Install NEO OpenCL runtime for Intel GPU

查看电脑当前安装信息

clinfo

基本OK，接下来就可以愉快的写代码了。

2.测试opencl

#include

#ifdef MAC

#include

#else

#include

#endif

int main() {

/* Host data structures */

cl_platform_id *platforms;

//每一个cl_platform_id 结构表示一个在主机上的OpenCL执行平台，就是指电脑中支持OpenCL的硬件，如nvidia显卡，intel CPU和显卡，AMD显卡和CPU等

cl_uint num_platforms;

cl_int i, err, platform_index = -1;

/* Extension data */

char* ext_data;

size_t ext_size;

const char icd_ext[] = "cl_khr_icd";

//要使platform工作，需要两个步骤。1 需要为cl_platform_id结构分配内存空间。2 需要调用clGetPlatformIDs初始化这些数据结构。一般还需要步骤0：询问主机上有多少platforms

/* Find number of platforms */

//返回值如果为-1就说明调用函数失败，如果为0标明成功

//第二个参数为NULL代表要咨询主机上有多少个platform，并使用num_platforms取得实际flatform数量。

//第一个参数为1，代表我们需要取最多1个platform。可以改为任意大如：INT_MAX整数最大值。但是据说0，否则会报错，实际测试好像不会报错。下面是步骤0：询问主机有多少platforms

err = clGetPlatformIDs(5, NULL, &num_platforms);

if(err < 0) {

perror("Couldn't find any platforms.");

exit(1);

}

printf("I have platforms: %d\n", num_platforms); //本人计算机上显示为2，有intel和nvidia两个平台

/* Access all installed platforms */

//步骤1 创建cl_platform_id，并分配空间

platforms = (cl_platform_id*)

malloc(sizeof(cl_platform_id) * num_platforms);

//步骤2 第二个参数用指针platforms存储platform

clGetPlatformIDs(num_platforms, platforms, NULL);

/* Find extensions of all platforms */

//获取额外的平台信息。上面已经取得了平台id了，那么就可以进一步获取更加详细的信息了。

//一个for循环获取所有的主机上的platforms信息

for(i=0; i

{

/* Find size of extension data */

//也是和前面一样，先设置第三和第四个参数为0和NULL，然后就可以用第五个参数ext_size获取额外信息的长度了。

err = clGetPlatformInfo(platforms[i],

CL_PLATFORM_EXTENSIONS, 0, NULL, &ext_size);

if(err < 0)

{

perror("Couldn't read extension data.");

exit(1);

}

printf("The size of extension data is: %d\n", (int)ext_size);//我的计算机显示224.

/* Access extension data */

//这里的ext_data相当于一个缓存，存储相关信息。

ext_data = (char*)malloc(ext_size);

//这个函数就是获取相关信息的函数，第二个参数指明了需要什么样的信息，如这里的CL_PLATFORM_EXTENSIONS表示是opencl支持的扩展功能信息。我计算机输出一大串，机器比较新（专门为了学图形学而购置的电脑），支持的东西比较多。

clGetPlatformInfo(platforms[i], CL_PLATFORM_EXTENSIONS,

ext_size, ext_data, NULL);

printf("Platform %d supports extensions: %s\n", i, ext_data);

//这里是输出生产商的名字，比如我显卡信息是：NVIDIA CUDA

char *name = (char*)malloc(ext_size);

clGetPlatformInfo(platforms[i], CL_PLATFORM_NAME,

ext_size, name, NULL);

printf("Platform %d name: %s\n", i, name);

//这里是供应商信息，我显卡信息：NVIDIA Corporation

char *vendor = (char*)malloc(ext_size);

clGetPlatformInfo(platforms[i], CL_PLATFORM_VENDOR,

ext_size, vendor, NULL);

printf("Platform %d vendor: %s\n", i, vendor);

//最高支持的OpenCL版本，本机显示：OpenCL1.1 CUDA 4.2.1

char *version = (char*)malloc(ext_size);

clGetPlatformInfo(platforms[i], CL_PLATFORM_VERSION,

ext_size, version, NULL);

printf("Platform %d version: %s\n", i, version);

//这个只有两个值：full profile 和 embeded profile

char *profile = (char*)malloc(ext_size);

clGetPlatformInfo(platforms[i], CL_PLATFORM_PROFILE,

ext_size, profile, NULL);

printf("Platform %d full profile or embeded profile?: %s\n", i, profile);

/* Look for ICD extension */

//如果支持ICD这一扩展功能的platform，输出显示，本机的Intel和Nvidia都支持这一扩展功能

if(strstr(ext_data, icd_ext) != NULL)

platform_index = i;

//std::cout<<"Platform_index = "<

printf("Platform_index is: %d\n", platform_index);

/* Display whether ICD extension is supported */

if(platform_index > -1)

printf("Platform %d supports the %s extension.\n",

platform_index, icd_ext);

//释放空间

free(ext_data);

free(name);

free(vendor);

free(version);

free(profile);

}

if(platform_index <= -1)

printf("No platforms support the %s extension.\n", icd_ext);

/* Deallocate resources */

free(platforms);

return 0;

}

用gcc编译以上程序：

gcc opencl_hello.c -o opencl_hello -lOpenCL

若有类似如下输出，则表示opencl配置正确：

好文推荐

评论可见，请评论后查看内容，谢谢！！！评论后请刷新页面。

本文由用户于 2024-04-11 发布在夸智网，如有疑问，请联系我们。
本文链接：https://www.kuazhi.com/post/713733245.html

夸智网

人工智能机器学习语言模型 Ubuntu 安装 CUDA 与 OPENCL

linux 运维 c++ 开发语言服务器 qt 【疑难解决】 ubuntu 由于权限不足无法进入和获取root权限的解决办法

运维【Linux】Ubuntu23.10+VMWare17虚拟机的安装教程

发表评论取消回复

夸智网

人工智能 机器学习 语言模型 Ubuntu 安装 CUDA 与 OPENCL

linux 运维 c++ 开发语言 服务器 qt 【疑难解决】 ubuntu 由于权限不足 无法进入和获取root权限的解决办法

运维 【Linux】Ubuntu23.10+VMWare17虚拟机的安装教程

相关文章

发表评论取消回复

人工智能机器学习语言模型 Ubuntu 安装 CUDA 与 OPENCL

linux 运维 c++ 开发语言服务器 qt 【疑难解决】 ubuntu 由于权限不足无法进入和获取root权限的解决办法

运维【Linux】Ubuntu23.10+VMWare17虚拟机的安装教程