数据查询与下载
数据
用于数据的查看与下载,以下为gym data --help列举的功能并附简单例子。
Usage: gym data [OPTIONS] COMMAND [ARGS]...
数据管理命令
Options:
--help Show this message and exit.
Commands:
detail 查看单条数据详情
download 下载单个或批量 bag 数据。
list 分页列出数据记录
tag list 列出数据标签
列出数据
Usage: gym data list [OPTIONS]
列出数据管理
Options:
-p, --page INTEGER 页码,默认为1
-l, --limit INTEGER 每页数量,默认为10
-s, --status TEXT 批量过滤: 0=待标注 1=待审核 2=审核失败 3=审核成功 4=待同步 5=同步失败
6=已标注 7=待验收 8=验收失败 9=验收成功 10=标注中;省略=全部
-name, --data-name TEXT 按数据文件名(包含匹配)筛选,传入子串将作为 dataName 参数提交
-start, --start-date TEXT 上传开始日期(YYYY-MM-DD HH:MM:SS 或 YYYY-MM-DD)
示例:'2025-12-11 00:00:00'
-end, --end-date TEXT 上传结束日期(YYYY-MM-DD HH:MM:SS 或 YYYY-MM-DD)
示例:'2025-12-11 00:00:00'
-P, --project-id TEXT 【必填】按项目过滤, 输入项目Id, 可通过 gym project list 命令查询项目Id
[required]
-S1, --scene1 TEXT 按一级场景过滤, 输入一级场景ID, 可通过 gym scene list -P
<project_id> 命令查询一级场景ID
-S2, --scene2 TEXT 按二级场景过滤, 输入二级场景ID, 可通过 gym scene list -P
<project_id> -S <scene1_id> 命令查询二级场景ID
-S3, --scene3 TEXT 按二级场景过滤, 输入二级场景ID, 可通过 gym scene list -P
<project_id> -S3 <scene1_id> 命令查询二级场景ID
-tag --tag TEXT 按标签过滤, 输入标签名, 可通过 gym data -tag <tag_name> -P <project_id> 命令查询标签名
-i, --interactive 开启沉浸式交互翻页 (n/p/q/页码)
--help Show this message and exit.
gym data list列出数据,通过可选参数筛选指定数据,-i可翻页查找。
# 查找上传时间在2025年8月7日12点00分至2025年8月8日16点30分的工装上料待审核的数据
gym data list --status 1 -S3 1948404267751632897
-start 202508071200 -end 202508081630
ID 文件名 时长(s) 大小(MB) 状态
-----------------------------------------------------------------------------------------
1953672602714980353 XGZSL_16_001_P4-199_20250808_103743.bag 52 841 待审核
1953672103762395137 XGZSL_16_001_P4-199_20250808_103417.bag 68 1058 待审核
1953348263980752898 XGZSL_16_001_P4-199_20250807_144043.bag 59 951 待审核
1953366818958200833 XGZSL_16_001_P4-199_20250807_154907.bag 84 1373 待审核
1953638706603216898 XGZSL_16_001_P4-199_20250808_093045.bag 69 1047 待审核
1953323634811064322 XGZSL_16_001_P4-199_20250807_131126.bag 58 897 待审核
1953319020811599873 XGZSL_16_001_P4-199_20250807_125335.bag 51 822 待审核
1953325217096105986 XGZSL_16_001_P4-199_20250807_131752.bag 60 928 待审核
1953665304865095681 XGZSL_16_001_P4-199_20250808_082225.bag 66 1062 待审核
1953663716851269634 XGZSL_16_001_P4-199_20250807_163015.bag 105 1733 待审核
总条数: 140,总时长: 2.34 小时, 总大小: 134.31 GB
查看单条数据
gym data detail 1953663716851269634
数据详情
--------------------------------------------------------------------------------------------------
ID : 1953663716851269634
数据名称 : XGZSL_16_001_P4-199_20250807_163015.bag
组织名称 : 长三角一体化示范区智能机器人训练中心
状态 : 待审核
--------------------------------------------------------------------------------------------------
设备SN : P4-199
设备MAC : 60:ff:9e:77:7a:53
时长(s) : 105
数据大小(MB) : 1733
--------------------------------------------------------------------------------------------------
采集员 : 程悦
标注员 : 标注员j
审核员 : -
--------------------------------------------------------------------------------------------------
上传时间 : 2025-08-08 11:45:02
标注时间 : 2025-08-13 08:07:16
审核时间 : -
下载数据
Usage: gym data download [OPTIONS] [DATA_ID]
下载单个或批量 bag 数据。
Options:
-o, --output TEXT 输出目录 (默认当前)
--filename TEXT 单文件模式: 指定保存文件名(可选)
--show-only 单文件模式: 仅显示链接不下载
--batch 启用批量下载模式(忽略 data_id)
--offline / --no-offline 离线模式: 优先从 NAS 下载,无则从云端下载 (默认开启)
--status [0|1|2|3|4|5|6|7|8|9|10] 批量过滤: 0=待标注 1=待审核 2=审核失败 3=审核成功 4=待同步 5=同步失败 6=已标注 7=待验收 8=验收失败 9=验收成功 10=标注中;
省略=全部
--data-name, --name TEXT 批量过滤: 文件名包含
--start, --start-date TEXT 批量过滤: 开始日期 (模糊: YYYY|YYYY-MM|YYYYMM|YYYYMMDD)
--end, --end-date TEXT 批量过滤: 结束日期 (模糊: 同上)
-t, --task-id, --task TEXT 来源为任务ID的 BAG 列表(需配合 --batch)
-c, --count INTEGER 批量模式: 下载条数 [default: 1000]
-C, --concurrency INTEGER 批量模式: 并发数 (1-10) [default: 3]
-p, --page INTEGER 批量模式: 起始页 [default: 1]
-l, --limit INTEGER 批量模式: 每页拉取多少记录(影响获取池, 不等于 count) [default: 50]
-P, --project TEXT 批量过滤: 项目,输入项目ID
-S1, --scene1 TEXT 批量过滤: 一级场景,输入一级场景ID
-S2, --scene2 TEXT 批量过滤: 二级场景,输入二级场景ID
-S3, --scene3 TEXT 批量过滤: 三级场景,输入三级场景ID
-tag, --tag TEXT 按数据标签名过滤,支持多个用逗号分隔(需配合 -P/--project)
--dry-run 批量: 仅展示将要下载的文件清单并退出
-y, --yes 批量: 跳过确认直接开始下载
-f, --force 强制覆盖下载(关闭断点续传)
--easy 简单模式: 不创建额外文件夹
--help Show this message and exit.
下载数据为gym主要功能,可分为单条数据下载与批量下载。
⚠️ 注意: 待同步和同步失败状态因未上传云端而无法下载,所有显示的条数、大小、时长等信息均已排除待同步和同步失败。-c, --count不指定条数默认1000条。
# 下载单条数据:输入data_id下载对应数据,若已有标注,会下载同名json文件(待同步的数据无法下载)
gym data download 1988533562367979522
# 批量下载数据:--batch 命令启用批量下载模式,可根据名称、状态、数据上传时间、任务所属、数据所在项目和场景筛选所需数据。
# 以下为下载1944962480635777024任务,指定下载路径为./single_FMCG_loading-P4-dex_hand,数据名包含P4,且状态为待标注,于十月份采集的数据
gym data download -t 1944962480635777024 -o single_FMCG_loading-P4-dex_hand --name P4 --status 0 --start 20251001 --end 20251101
⚠️ 注意: 有无--easy的区别:
- 有
--easy: 不会另外创建文件夹,下载后的文件结构为:<output_dir>/
├── KXPZX_10_P4-162_20250721_094021.bag
├── KXPZX_10_P4-162_20250721_094021.json
├── KXPZX_10_P4-162_20250721_104333.bag
├── KXPZX_10_P4-162_20250721_104333.json
├── KXPZX_10_P4-162_20250721_111428.bag
└── KXPZX_10_P4-162_20250721_111428.json - 没有
--easy: 会创建与数据同名文件夹,将数据bag与标注josn存储在该文件夹下:<output_dir>/
├── KXPZX_10_P4-162_20250721_094021
│ ├── KXPZX_10_P4-162_20250721_094021.bag
│ └── KXPZX_10_P4-162_20250721_094021.json
├── KXPZX_10_P4-162_20250721_104333
│ ├── KXPZX_10_P4-162_20250721_104333.bag
│ └── KXPZX_10_P4-162_20250721_104333.json
└── KXPZX_10_P4-162_20250721_111428
├── KXPZX_10_P4-162_20250721_111428.bag
└── KXPZX_10_P4-162_20250721_111428.json
标签名查询
Usage: gym data tag list [OPTIONS]
列出数据标签
Options:
-P, --project TEXT 项目,输入项目ID
--help Show this message and exit.