1.在集群环境,怎么保证arena高可用?比如说一个master节点挂了,arena是否可用?
2.arena的底层是不是通过command命令,kubectl create -f aa.yml来创建训练任务的?
3.把arena打成镜像怎么起起来?起来后怎么去用?
1.在集群环境,怎么保证arena高可用?比如说一个master节点挂了,arena是否可用?
2.arena的底层是不是通过command命令,kubectl create -f aa.yml来创建训练任务的?
3.把arena打成镜像怎么起起来?起来后怎么去用?