跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 搭建实验室使用的深度学习服务器
未分類
17 9 月 2020

搭建实验室使用的深度学习服务器

搭建实验室使用的深度学习服务器

資深大佬 : w1573007 0

实验室资金有限只买了一台服务器。128 的内存,i5cpu,v100 卡。现在想让多人使用计算。

我想的方案是 dock,但不知道性能怎么样。老师给出的方案是 Jupiter 多用户多虚拟环境。

主要大家都要跑 bert,怕内存爆了导致所有人的实验都爆了。

大佬们有什么建议或者方案嘛。

大佬有話說 (13)

  • 資深大佬 : yangyaofei

    v100 单卡? 那只够一两个人跑 BERT 吧…. 怎么都会爆的感觉

  • 主 資深大佬 : w1573007

    @yangyaofei 实验室好多少人,cpu,gpu 都用

  • 資深大佬 : sleeepyy

    直接多用户 ssh 进去自己匀时间用啊,炼丹的机器还搞那么复杂干什么。
    另外单卡可能真的不太行,gpu 的多任务其实挺难受的

  • 資深大佬 : Tony042

    可以搞个 slurm 系统,所有人上去按先后和权重一个一个任务算,和 hpc 一样管理就行了

  • 資深大佬 : zhucegeqiu

    让领导加预算
    我公司的服务器 Xeon(R) Gold 6240, 内存 512,P100 * 2,我一个人炼丹都嫌不够
    实在不行,2080Ti 多买几张,多人用比单卡方便

  • 資深大佬 : misaka19000

    加预算

  • 資深大佬 : chizuo

    搞个服务器管理系统,貌似有这种适用于 gpu 管理的,联系你买服务器的供应商,找他们要

  • 資深大佬 : yangyaofei

    @w1573007 那基本只能每次一个人了

  • 主 資深大佬 : w1573007

    @Tony042 大佬有教程么

  • 資深大佬 : 594duck

    你老师的意见是对的。

    最烦干什么都上 docker

  • 資深大佬 : Andiry

    多买几张 V100,跑的时候用 CUDA_VISIBLE_DEVICES 指定 GPU

  • 資深大佬 : Tony042

    @w1573007 详见这个教程 https://slurm.schedmd.com/overview.html

  • 資深大佬 : s0ne4ver

    实验室导师让我们自己找云主机然后报销,我们用过比较实惠的是 mistgpu.com 的,体验挺好。
    阿里云华为云滴滴云腾讯云等等各大云服务提供商也都有带 gpu 的服务器,只是价格可能贵一些,像宽带存储都得单独扣费。

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具