跳到主要内容

LBG Utility常见问题

1. 为什么Utility查不到任务相关信息?

Lebesgue Utility首次使用时需要指定项目,请确保当前项目ID是正确的。

查看所有项目:

lbg project ls

修改默认项目:

lbg project switch <project>

2. 使用Utility提交任务,如何设置任务运行最大时长?

在--file -i json文件中增加max_run_time,单位为分钟,任务超过最大运行时长后会自动终止并回收文件

3. 为什么任务会异常中断?使用 LBG Utility 提交任务时,如何设置任务异常中断后,自动重试?

计算节点运行过程中有较低的概率可能出现异常:如机器被回收,物理机故障,此时您的任务会中断并返回任务状态为失败,任务结果会正常回收,您可至任务详情页进行下载。

如您希望任务异常中断后,系统自动进行重试,可在 job.json 内进行如下设置:

  • 若您的计算程序支持续算,您可以:

    • command设置为支持续算,例如使用 if else 等语句判断是否有 checkpoint 文件,从而执行不同的命令进行计算。

    • 设置 maxRescheduleTimes 值为您可接受的重试次数,任务中断后,系统会自动进行续算重试。设置重试 2 次填写示例如下:

      maxRescheduleTimes: 2
  • 若您的计算程序不支持续算:

    • 您只需设置 maxRescheduleTimes 值为您可接受的重试次数。任务中断后,系统会进行完整任务的重新计算。设置重试 2 次填写示例如下:

      maxRescheduleTimes: 2