跳到主要内容

Bohrium CLI常见问题

1. 为什么 Bohrium CLI 查不到任务相关信息?

Bohrium CLI首次使用时需要绑定AccessKey,请确保绑定的AccessKey是正确的。

请访问Bohrium-AccessKey生成AccessKey(AccessKey再次创建时会导致原来的失效ACCESS_KEY值

获取到ACCESS_KEY值后,将ACCESS_KEY配置都环境变量

注:ACCESS_KEY 后的 XXXX 请替换成您自己的AccessKey

ZSH

如果您使用的是ZSH,使用以下命令将ACCESS_KEY写入~/.zshrc

echo 'export ACCESS_KEY=XXXX' >> ~/.zshrc
source ~/.zshrc

BASH

如果您使用的是BASH,使用以下命令将ACCESS_KEY写入~/.bashrc

echo 'export ACCESS_KEY=XXXX' >> ~/.bashrc
source ~/.bashrc

Windows

打开命令提示符 (CMD) 并运行以下命令:(请注意,setx 命令需要重新打开命令提示符才会生效)

setx ACCESS_KEY XXXX

或者通过手动添加环境。

2. 在使用 Bohrium CLI 创建数据集中途突然出现出错怎么办?

由于bohr支持断点续传,如果中途由于网络等因素导致了中断,可以通过重新执行同样的命令,然后根据提示输入y恢复先前的文件,最后即可做到断点续传。

3. 使用 Bohrium CLI 创建的项目组ID在Bohrium平台上找不到?

使用bohr job_group create创建的任务组ID用于多个任务提交到同一个任务组来使用。它和Bohrium平台上的任务组id并不一致,这个任务组id只适用于Bohrium CLI提交任务时使用。

如果想将任务都提交到同一个任务组中,先使用bohr job_group create创建任务组ID,就可以将此任务组ID写入提交任务时使用的job.json中的job_group_id字段 ,示例如下:

{
"job_group_id":0000
}

4. 使用 Bohrium CLI 提交任务,如何设置任务运行最大时长?

--file -i json文件中增加max_run_time,单位为分钟,任务超过最大运行时长后会自动终止并回收文件

{
"max_run_time":2
}

5. 为什么任务会异常中断?使用 Bohrium CLI 提交任务时,如何设置任务异常中断后,自动重试?

计算节点运行过程中有较低的概率可能出现异常:如机器被回收,物理机故障,此时您的任务会中断并返回任务状态为失败,任务结果会正常回收,您可至任务详情页进行下载。

如您希望任务异常中断后,系统自动进行重试,可在 job.json 内进行如下设置:

  • 若您的计算程序支持续算,您可以:

    • command设置为支持续算,例如使用 if else 等语句判断是否有 checkpoint 文件,从而执行不同的命令进行计算。
  • 若您的计算程序不支持续算:

    • 您只需在--file -i json文件中新增变量 max_reschedule_times ,该值为您可接受的重试次数。任务中断后,系统会进行完整任务的重新计算。设置重试 2 次填写示例如下:

      {
      "max_reschedule_times":2
      }