• Eric
    2018-12-05
    单块GPU资源都不能共享,还得自己fork一份device plugin维护虚拟化的GPU。 社区有时候办事真的不利索

    作者回复: 我已经吐槽的很委婉了

    
     10
  • 每日都想上班
    2018-12-04
    今天爆出kubenetes安全漏洞需要升级,请问要如何升级
    
     2
  • 小河
    2019-08-04
    hi,张老师,我现在将gpu的服务迁移到kubernetes上,对外提供的是gRRC接口,我使用了ingres-nginx对gRPC进行负载均衡,但是发现支持并不好,又想使用Istio以sidecar模式代理gPRC,但是又觉得太重,请问目前有什么较好的方案在kuberntes支持对gRPC的负载均衡么😀
    
     1
  • 凌
    2019-05-27
    https://mp.weixin.qq.com/s/NU8Cj6DL8wEKFzVYhuyzbQ
    
     1
  • 勇敢的心
    2018-12-13
    所以目前是无法实现多用户同时共享单块GPU咯?有没有可以实现这一功能的Magic?还有,目前可能实现GPU或者CPU数量的动态改变吗,在不重建pod的情况下?期待老师的解答
    
     1
  • 乱愣黎
    2018-12-05
    1、device plugin只能通过patch操作来实现device信息的添加吗?能否在节点添加的时候自动添加
    2、在第1点的情况下,在服务器持续集成的情况下,新旧设备device信息肯定是会不一致的,如何解决device plugin机制无法区分设备属性的情况?
        以本篇文章的内容来看,可以这么设置
        批次A使用nvidia.com/GP100=4,批次B使用amd.com/VEGA64=4
        这样编写资源需求和新旧设备交替都需要人为指定,这样对于运维来说很难受啊
    3、是否能把GPU抽象成类似于CPU的时间片,将整个GPU计算能力池化,然后根据pod.spec.containers.resources里面的require和limits字段来分配GPU计算资源
    展开
    
     1
  • hlzhu1983
    2018-12-03
    张老师,问一下现在k8s关于GPU资源调度粒度是否能像CPU调度粒度那么细?现在还只能按照1块GPU卡来分配GPU资源吗?

    作者回复: 很粗粒度呢

    
     1
  • 硕
    2018-12-03
    刚公司需要 使用nvdia-docker 管理 gpu 用于部署ai 图像 这就来了
    
     1
  • PatHoo
    2020-01-01
    请问现在K8S支持按硬件拓扑结构调度了吗?
    
    
  • 拉欧
    2019-11-23
    按需增加api, google把这一块完全开放出来,应该是唯一的道路
    
    
  • Tarjintor
    2019-07-05
    那么,理论上,可以做到对一个进程组的gpu使用百分比做限制吗?
    之前对docker做介绍的时候,说过可以限制一个cpu所能使用的百分比
    
    
  • Hank
    2019-03-15
    kubeflow 能否解决此事呢? 粗颗粒 转换成细粒度
     1
    
  • 🔜
    2019-03-13
    [root@bigdata-k8s-master-1 ~]# curl --header "Content-Type: application/json-patch+json" \
    > --request PATCH \
    > --data '[{"op": "add", "path": "/status/capacity/nvidia.com/gpu", "value": "1"}]' \
    > http://localhost:8001/api/v1/nodes/k8s-master-01/status
    {
      "kind": "Status",
      "apiVersion": "v1",
      "metadata": {

      },
      "status": "Failure",
      "message": "jsonpatch add operation does not apply: doc is missing path: /status/capacity/nvidia.com/gpu",
      "code": 500

    什么原因
    展开
    
    
  • 普罗@庞铮
    2018-12-22
    社区就是江湖,开源不是免费。
    差异性如何体现,lol
    
    
  • Eurica
    2018-12-03
    Redhat的提议或类似层面的解决方案,后面还有可能支持吗?
    
    
我们在线,来聊聊吧