Bohrium CLI常见问题
1. 为什么 Bohrium CLI 查不到任务相关信息?
Bohrium CLI首次使用时需要绑定AccessKey,请确保绑定的AccessKey是正确的。
请访问Bohrium-AccessKey生成AccessKey(AccessKey再次创建时会导致原来的失效)
获取到ACCESS_KEY值后,将ACCESS_KEY配置都环境变量
注:
ACCESS_KEY
后的XXXX
请替换成您自己的AccessKey
ZSH
如果您使用的是ZSH,使用以下命令将ACCESS_KEY
写入~/.zshrc
echo 'export ACCESS_KEY=XXXX' >> ~/.zshrc
source ~/.zshrc
BASH
如果您使用的是BASH,使用以下命令将ACCESS_KEY
写入~/.bashrc
echo 'export ACCESS_KEY=XXXX' >> ~/.bashrc
source ~/.bashrc
Windows
打开命令提示符 (CMD) 并运行以下命令:(请注意,setx 命令需要重新打开命令提示符才会生效)
setx ACCESS_KEY XXXX
或者通过手动添加环境。
2. 在使用 Bohrium CLI 创建数据集中途突然出现出错怎么办?
由于bohr支持断点续传,如果中途由于网络等因素导致了中断,可以通过重新执行同样的命令,然后根据提示输入y
恢复先前的文件,最后即可做到断点续传。
3. 使用 Bohrium CLI 创建的项目组ID在Bohrium平台上找不到?
使用bohr job_group create
创建的任务组ID用于多个任务提交到同一个任务组来使用。它和Bohrium平台上的任务组id并不一致,这个任务组id只适用于Bohrium CLI提交任务时使用。
如果想将任务都提交到同一个任务组中,先使用bohr job_group create创建任务组ID,就可以将此任务组ID写入提交任务时使用的job.json
中的job_group_id
字段 ,示例如下:
{
"job_group_id":0000
}
4. 使用 Bohrium CLI 提交任务,如何设置任务运行最大时长?
在--file -i json
文件中增加max_run_time
,单位为分钟,任务超过最大运行时长后会自动终止并回收文件
{
"max_run_time":2
}
5. 为什么任务会异常中断?使用 Bohrium CLI 提交任务时,如何设置任务异常中断后,自动重试?
计算节点运行过程中有较低的概率可能出现异常:如机器被回收,物理机故障,此时您的任务会中断并返回任务状态为失败,任务结果会正常回收,您可至任务详情页进行下载。
如您希望任务异常中断后,系统自动进行重试,可在 job.json
内进行如下设置:
若您的计算程序支持续算,您可以:
- 把
command
设置为支持续算,例如使用if else
等语句判断是否有checkpoint
文件,从而执行不同的命令进行计算。
- 把
若您的计算程序不支持续算:
您只需在
--file -i json
文件中新增变量max_reschedule_times
,该值为您可接受的重试次数。任务中断后,系统会进行完整任务的重新计算。设置重试 2 次填写示例如下:{
"max_reschedule_times":2
}