数据查询与下载

数据

用于数据的查看与下载，以下为gym data --help列举的功能并附简单例子。

Usage: gym data [OPTIONS] COMMAND [ARGS]...

  数据管理命令

Options:
  --help  Show this message and exit.

Commands:
  detail    查看单条数据详情
  download  下载单个或批量 bag 数据。
  list      分页列出数据记录
  tag list  列出数据标签

列出数据

Usage: gym data list [OPTIONS]

   列出数据管理

Options:
  -p, --page INTEGER         页码，默认为1
  -l, --limit INTEGER        每页数量，默认为10
  -s, --status TEXT          批量过滤: 0=待标注 1=待审核 2=审核失败 3=审核成功 4=待同步 5=同步失败
                             6=已标注 7=待验收 8=验收失败 9=验收成功 10=标注中;省略=全部
  -name, --data-name TEXT    按数据文件名(包含匹配)筛选，传入子串将作为 dataName 参数提交
  -start, --start-date TEXT  上传开始日期(YYYY-MM-DD HH:MM:SS 或 YYYY-MM-DD)
                             示例:'2025-12-11 00:00:00'
  -end, --end-date TEXT      上传结束日期(YYYY-MM-DD HH:MM:SS 或 YYYY-MM-DD)
                             示例:'2025-12-11 00:00:00'
  -P, --project-id TEXT      【必填】按项目过滤, 输入项目Id, 可通过 gym project list 命令查询项目Id
                             [required]
  -S1, --scene1 TEXT         按一级场景过滤, 输入一级场景ID, 可通过 gym scene list -P
                             <project_id> 命令查询一级场景ID
  -S2, --scene2 TEXT         按二级场景过滤, 输入二级场景ID, 可通过 gym scene list -P
                             <project_id> -S <scene1_id> 命令查询二级场景ID
  -S3, --scene3 TEXT         按二级场景过滤, 输入二级场景ID, 可通过 gym scene list -P
                             <project_id> -S3 <scene1_id> 命令查询二级场景ID
  -tag --tag TEXT            按标签过滤, 输入标签名, 可通过 gym data -tag <tag_name> -P <project_id> 命令查询标签名
  -i, --interactive          开启沉浸式交互翻页 (n/p/q/页码)
  --help                     Show this message and exit.

gym data list列出数据，通过可选参数筛选指定数据，-i可翻页查找。

# 查找上传时间在2025年8月7日12点00分至2025年8月8日16点30分的工装上料待审核的数据
gym data list --status 1 -S3 1948404267751632897
-start 202508071200 -end 202508081630

ID                   文件名                                  时长(s)  大小(MB)   状态
-----------------------------------------------------------------------------------------
1953672602714980353  XGZSL_16_001_P4-199_20250808_103743.bag       52    841     待审核
1953672103762395137  XGZSL_16_001_P4-199_20250808_103417.bag       68    1058    待审核
1953348263980752898  XGZSL_16_001_P4-199_20250807_144043.bag       59    951     待审核
1953366818958200833  XGZSL_16_001_P4-199_20250807_154907.bag       84    1373    待审核
1953638706603216898  XGZSL_16_001_P4-199_20250808_093045.bag       69    1047    待审核
1953323634811064322  XGZSL_16_001_P4-199_20250807_131126.bag       58    897     待审核
1953319020811599873  XGZSL_16_001_P4-199_20250807_125335.bag       51    822     待审核
1953325217096105986  XGZSL_16_001_P4-199_20250807_131752.bag       60    928     待审核
1953665304865095681  XGZSL_16_001_P4-199_20250808_082225.bag       66    1062    待审核
1953663716851269634  XGZSL_16_001_P4-199_20250807_163015.bag      105    1733    待审核
总条数: 140,总时长: 2.34 小时, 总大小: 134.31 GB

查看单条数据

gym data detail 1953663716851269634

数据详情
--------------------------------------------------------------------------------------------------
ID              : 1953663716851269634
数据名称        : XGZSL_16_001_P4-199_20250807_163015.bag
组织名称        : 长三角一体化示范区智能机器人训练中心
状态            : 待审核
--------------------------------------------------------------------------------------------------
设备SN          : P4-199
设备MAC         : 60:ff:9e:77:7a:53
时长(s)         : 105
数据大小(MB)    : 1733
--------------------------------------------------------------------------------------------------
采集员          : 程悦
标注员          : 标注员j
审核员          : -
--------------------------------------------------------------------------------------------------
上传时间        : 2025-08-08 11:45:02
标注时间        : 2025-08-13 08:07:16
审核时间        : -

下载数据

Usage: gym data download [OPTIONS] [DATA_ID]

  下载单个或批量 bag 数据。

Options:
  -o, --output TEXT           输出目录 (默认当前)
  --filename TEXT             单文件模式: 指定保存文件名(可选)
  --show-only                 单文件模式: 仅显示链接不下载
  --batch                     启用批量下载模式(忽略 data_id)
  --offline / --no-offline    离线模式: 优先从 NAS 下载，无则从云端下载 (默认开启)
  --status [0|1|2|3|4|5|6|7|8|9|10]      批量过滤: 0=待标注 1=待审核 2=审核失败 3=审核成功 4=待同步 5=同步失败 6=已标注 7=待验收 8=验收失败 9=验收成功 10=标注中;
                              省略=全部
  --data-name, --name TEXT    批量过滤: 文件名包含
  --start, --start-date TEXT  批量过滤: 开始日期 (模糊: YYYY|YYYY-MM|YYYYMM|YYYYMMDD)
  --end, --end-date TEXT      批量过滤: 结束日期 (模糊: 同上)
  -t, --task-id, --task TEXT  来源为任务ID的 BAG 列表（需配合 --batch）
  -c, --count INTEGER         批量模式: 下载条数 [default: 1000]
  -C, --concurrency INTEGER   批量模式: 并发数 (1-10)  [default: 3]
  -p, --page INTEGER          批量模式: 起始页  [default: 1]
  -l, --limit INTEGER         批量模式: 每页拉取多少记录(影响获取池, 不等于 count)  [default: 50]
  -P, --project TEXT          批量过滤: 项目,输入项目ID
  -S1, --scene1 TEXT          批量过滤: 一级场景，输入一级场景ID
  -S2, --scene2 TEXT          批量过滤: 二级场景，输入二级场景ID
  -S3, --scene3 TEXT          批量过滤: 三级场景，输入三级场景ID
  -tag, --tag TEXT            按数据标签名过滤，支持多个用逗号分隔（需配合 -P/--project）
  --dry-run                   批量: 仅展示将要下载的文件清单并退出
  -y, --yes                   批量: 跳过确认直接开始下载
  -f, --force                 强制覆盖下载（关闭断点续传）
  --easy                      简单模式: 不创建额外文件夹
  --help                      Show this message and exit.

下载数据为gym主要功能，可分为单条数据下载与批量下载。

⚠️ 注意: 待同步和同步失败状态因未上传云端而无法下载，所有显示的条数、大小、时长等信息均已排除待同步和同步失败。-c, --count不指定条数默认1000条。

# 下载单条数据：输入data_id下载对应数据，若已有标注，会下载同名json文件（待同步的数据无法下载）
gym data download 1988533562367979522

# 批量下载数据：--batch 命令启用批量下载模式，可根据名称、状态、数据上传时间、任务所属、数据所在项目和场景筛选所需数据。
# 以下为下载1944962480635777024任务，指定下载路径为./single_FMCG_loading-P4-dex_hand，数据名包含P4，且状态为待标注,于十月份采集的数据
gym data download -t 1944962480635777024 -o single_FMCG_loading-P4-dex_hand --name P4 --status 0 --start 20251001 --end 20251101

⚠️ 注意: 有无--easy的区别:

有--easy: 不会另外创建文件夹，下载后的文件结构为：

<output_dir>/
├── KXPZX_10_P4-162_20250721_094021.bag
├── KXPZX_10_P4-162_20250721_094021.json
├── KXPZX_10_P4-162_20250721_104333.bag
├── KXPZX_10_P4-162_20250721_104333.json
├── KXPZX_10_P4-162_20250721_111428.bag
└── KXPZX_10_P4-162_20250721_111428.json

没有--easy: 会创建与数据同名文件夹，将数据bag与标注josn存储在该文件夹下：

<output_dir>/
├── KXPZX_10_P4-162_20250721_094021
│   ├── KXPZX_10_P4-162_20250721_094021.bag
│   └── KXPZX_10_P4-162_20250721_094021.json
├── KXPZX_10_P4-162_20250721_104333
│   ├── KXPZX_10_P4-162_20250721_104333.bag
│   └── KXPZX_10_P4-162_20250721_104333.json
└── KXPZX_10_P4-162_20250721_111428
    ├── KXPZX_10_P4-162_20250721_111428.bag
    └── KXPZX_10_P4-162_20250721_111428.json

标签名查询

Usage: gym data tag list [OPTIONS]

  列出数据标签

Options:
  -P, --project TEXT  项目,输入项目ID
  --help              Show this message and exit.

数据​

列出数据​

查看单条数据​

下载数据​

标签名查询​

数据

列出数据

查看单条数据

下载数据

标签名查询