实验室服务器使用手册
服务器配置
- CPU: AMD EPYC 7742 64-Core *2
- 显卡: NVIDIA GeForce 3090 24G*4
- 内存: 1008G
- 硬盘: 1T SSD, 16T HDD
- 操作系统: Ubuntu 18.04
服务管理员
如对服务器管理有兴趣,随时欢迎加入
服务器使用说明
- 服务器IP地址为
10.184.17.102
,在校内网环境下可以直接链接,校外可通过学校提供的SSL VPN服务 (https://sslvpn.xjtu.edu.cn) 接入校内网使用 - 如需使用服务器可联系任一管理员创建账号,使用账号均为普通用户权限
- 在使用过程中有任何问题及时联系管理员进行处理
- 如果需要使用显卡进行深度学习训练,请先用
watch -n 1 nvidia-smi
命令查看并选择未被占用的显卡进行使用,Pytorch环境下使用torch.cuda.set_device(gpu_idx)
设置指定的GPU
数据目录挂载
当前的新用户的用户目录都是在数据盘下,因此不存在数据挂载问题,不需要再进行数据目录的挂载。
服务器系统盘只有1T的空间,目前已经使用了接近50%,之后如果要给服务器装软件还需要对其进行占用。因此,为了节省系统盘的空间,当大家有较大数据文件需要放在服务器上时,建议挂载到数据盘内。 数据盘目前总容量为14T,后面还可以加,所以放心使用。接下来说明如何将数据盘挂载到自己目录下。
- 切换到数据盘挂载的文件目录
/data
下shellcd /data
- 创建以自己用户名命名的文件夹shell
mkdir $USER$
- 将该文件夹soft link(mount 需要sudo权限,这里不必要)到自己的用户目录下即可shell
ln -s /data/$USER$ ~/data
- 删除软连接shell
rm -rf ~/data # 注意千万不要给后面再加一个/ 如果加了就是连数据一起删除了,惨的一
用户目录下conda安装
Python 环境推荐使用Anaconda,可以每个普通用户自行安装
首先创建目录 Downloads 用来存放下载文件
shellmkdir Downloads
进入 Downloads 文件夹下
shellcd Downloads
下载 Anaconda 安装包
shellwget https://repo.anaconda.com/archive/Anaconda3-2022.05-Linux-x86_64.sh
给安装包添加执行权限
shellchmod +x Anaconda3-2022.05-Linux-x86_64.sh
执行安装程序,一路回车,遇到选项就填
yes
./Anaconda3-2022.05-Linux-x86_64.sh
重新进入命令行即可激活
conda
环境
Docker
为便于大家使用服务器来进行实验,服务器上的每个用户都是在docker
组内,有docker
访问权限。
而docker的相关命令本身自带root
权限,因此,在使用docker
过程中一定要小心,避免误停或误删他人的容器或镜像。