82 lines
6.8 KiB
Markdown
82 lines
6.8 KiB
Markdown
|
|
| 分类 | 字段名 | 数据类型 | 描述 | 来源 |
|
|
| --- | --- | --- | --- | --- |
|
|
| **标识符** | `subbh` | String | 店铺唯一标识 | 骨架 |
|
|
| | `hh` | String | 商品唯一标识 | 骨架 |
|
|
| | `kdrq` | Date | 开单日期 (主键之一) | 骨架 |
|
|
| **核心指标** | `sales_quantity` | Float | 当日销售量 (无销售则为0) | 当日销售 |
|
|
| | `return_quantity` | Float | 当日退货量 (无销售则为0) | 当日销售 |
|
|
| | `net_sales_quantity` | Float | **当日净销售量 (目标变量)** | 当日销售 |
|
|
| | `gross_profit_total` | Float | 当日毛利 (无销售则为0) | 当日销售 |
|
|
| | `transaction_count` | Integer | 当日交易次数 (无销售则为0) | 当日销售 |
|
|
| **日期特征** | `date` | Date | 日期 (冗余字段) | 时序计算 |
|
|
| | `is_weekend` | Boolean | 是否为周末 (True/False) | 时序计算 |
|
|
| | `day_of_week` | Integer | 一周中的第几天 (0=周一, 6=周日) | 时序计算 |
|
|
| | `day_of_month` | Integer | 一月中的第几天 (1-31) | 时序计算 |
|
|
| | `day_of_year` | Integer | 一年中的第几天 (1-366) | 时序计算 |
|
|
| | `week_of_month` | Integer | 当月第几周 (1-5) | 时序计算 |
|
|
| | `month` | Integer | 月份 (1-12) | 时序计算 |
|
|
| | `quarter` | Integer | 季度 (1-4) | 时序计算 |
|
|
| | `is_holiday` | Boolean | 是否为节假日 (True/False) | 时序计算 |
|
|
| **生命周期特征** | `first_sale_date` | Date | SKU在店首次销售日期 | 生命周期 |
|
|
| | `last_sale_date` | Date | SKU在店末次销售日期 | 生命周期 |
|
|
| | `lifecycle_days` | Integer | SKU在店生命周期总天数 | 生命周期 |
|
|
| | `sample_category` | String | 生命周期分类 (new/medium/old) | 生命周期 |
|
|
| | `rolling_7d_valid` | Boolean | 7日滚动窗口是否有效 (距离首次销售>=7天) | 生命周期 |
|
|
| | `rolling_15d_valid` | Boolean | 15日滚动窗口是否有效 | 生命周期 |
|
|
| | `rolling_30d_valid` | Boolean | 30日滚动窗口是否有效 | 生命周期 |
|
|
| | `rolling_90d_valid` | Boolean | 90日滚动窗口是否有效 | 生命周期 |
|
|
| **滚动特征 (7天)** | `sales_quantity_rolling_mean_7d` | Float | 过去7日平均销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_mean_7d` | Float | 过去7日平均退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_mean_7d`| Float | 过去7日平均净销量 | 历史滚动 |
|
|
| | `sales_quantity_rolling_sum_7d` | Float | 过去7日总销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_sum_7d` | Float | 过去7日总退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_sum_7d` | Float | 过去7日总净销量 | 历史滚动 |
|
|
| **滚动特征 (15天)** | `sales_quantity_rolling_mean_15d` | Float | 过去15日平均销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_mean_15d` | Float | 过去15日平均退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_mean_15d`| Float | 过去15日平均净销量 | 历史滚动 |
|
|
| | `sales_quantity_rolling_sum_15d` | Float | 过去15日总销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_sum_15d` | Float | 过去15日总退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_sum_15d` | Float | 过去15日总净销量 | 历史滚动 |
|
|
| **滚动特征 (30天)** | `sales_quantity_rolling_mean_30d` | Float | 过去30日平均销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_mean_30d` | Float | 过去30日平均退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_mean_30d`| Float | 过去30日平均净销量 | 历史滚动 |
|
|
| | `sales_quantity_rolling_sum_30d` | Float | 过去30日总销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_sum_30d` | Float | 过去30日总退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_sum_30d` | Float | 过去30日总净销量 | 历史滚动 |
|
|
| **滚动特征 (90天)** | `sales_quantity_rolling_mean_90d` | Float | 过去90日平均销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_mean_90d` | Float | 过去90日平均退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_mean_90d`| Float | 过去90日平均净销量 | 历史滚动 |
|
|
| | `sales_quantity_rolling_sum_90d` | Float | 过去90日总销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_sum_90d` | Float | 过去90日总退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_sum_90d` | Float | 过去90日总净销量 | 历史滚动 |
|
|
| **滚动特征 (180天)** | `sales_quantity_rolling_mean_180d` | Float | 过去180日平均销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_mean_180d` | Float | 过去180日平均退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_mean_180d`| Float | 过去180日平均净销量 | 历史滚动 |
|
|
| | `sales_quantity_rolling_sum_180d` | Float | 过去180日总销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_sum_180d` | Float | 过去180日总退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_sum_180d` | Float | 过去180日总净销量 | 历史滚动 |
|
|
| **滚动特征 (365天)** | `sales_quantity_rolling_mean_365d` | Float | 过去365日平均销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_mean_365d` | Float | 过去365日平均退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_mean_365d`| Float | 过去365日平均净销量 | 历史滚动 |
|
|
| | `sales_quantity_rolling_sum_365d` | Float | 过去365日总销售量 | 历史滚动 |
|
|
| | `return_quantity_rolling_sum_365d` | Float | 过去365日总退货量 | 历史滚动 |
|
|
| | `net_sales_quantity_rolling_sum_365d` | Float | 过去365日总净销量 | 历史滚动 |
|
|
| **店铺特征** | `province` | String | 店铺所在省份 | 店铺特征 |
|
|
| | `city` | String | 店铺所在城市 | 店铺特征 |
|
|
| | `district` | String | 店铺所在行政区 | 店铺特征 |
|
|
| | `poi_residential_count` | Integer | 周边住宅区POI数量 | 店铺特征 |
|
|
| | `poi_school_count` | Integer | 周边学校POI数量 | 店铺特征 |
|
|
| | `poi_mall_count` | Integer | 周边购物中心POI数量 | 店铺特征 |
|
|
| | `temperature_2m_max` | Float | 当日最高气温 | 店铺特征 |
|
|
| | `temperature_2m_min` | Float | 当日最低气温 | 店铺特征 |
|
|
| | `temperature_2m_mean`| Float | 当日平均气温 | 店铺特征 |
|
|
| **商品特征** | `零售大类代码_encoded` | Integer | 零售大类代码的数字编码 | 商品特征 |
|
|
| | `零售中类代码_encoded` | Integer | 零售中类代码的数字编码 | 商品特征 |
|
|
| | `零售小类代码_encoded` | Integer | 零售小类代码的数字编码 | 商品特征 |
|
|
| | `商品ABC分类_encoded` | Integer | 商品ABC分类的数字编码 | 商品特征 |
|
|
| | `商品手册代码_encoded` | Integer | 商品手册代码的数字编码 | 商品特征 |
|
|
| | `产地_encoded` | Integer | 产地的数字编码 | 商品特征 |
|
|
| | `brand_encoded` | Integer | 品牌的数字编码 | 商品特征 |
|
|
| | `packaging_quantity` | Float | 包装数量 (从规格中提取) | 商品特征 |
|
|
| | `approval_type_encoded` | Integer | 批准文号类型的数字编码 | 商品特征 | |