ShopTRAINING/server/utils/multi_store_data_utils.py

"""
多店铺销售预测系统 - 数据处理工具函数
支持多店铺数据的加载、过滤和处理
"""

import pandas as pd
import numpy as np
import os
import json
from datetime import datetime, timedelta
from typing import Optional, List, Tuple, Dict, Any
from core.config import DEFAULT_DATA_PATH

def load_multi_store_data(file_path: str = None,
                         store_id: Optional[str] = None,
                         product_id: Optional[str] = None,
                         start_date: Optional[str] = None,
                         end_date: Optional[str] = None) -> pd.DataFrame:
    """
    加载多店铺销售数据，支持按店铺、产品、时间范围过滤
    """
    if file_path is None:
        file_path = DEFAULT_DATA_PATH
    if not os.path.exists(file_path):
        raise FileNotFoundError(f"数据文件不存在: {file_path}")
    try:
        df = pd.read_parquet(file_path or DEFAULT_DATA_PATH)
    except Exception as e:
        raise e
    
    df = standardize_column_names(df)

    if store_id:
        df['store_id'] = df['store_id'].astype(str)
        df = df[df['store_id'] == str(store_id)].copy()
    
    if product_id:
        df['product_id'] = df['product_id'].astype(str)
        df = df[df['product_id'] == str(product_id)].copy()
    
    if start_date:
        df = df[df['date'] >= pd.to_datetime(start_date)].copy()

    if end_date:
        df = df[df['date'] <= pd.to_datetime(end_date)].copy()
    
    return df

def standardize_column_names(df: pd.DataFrame) -> pd.DataFrame:
    """
    标准化列名以匹配训练代码和API期望的格式
    """
    df = df.copy()
    try:
        current_dir = os.path.dirname(os.path.abspath(__file__))
        mapping_file_path = os.path.join(current_dir, '..', 'core', 'field_mapping.json')
        with open(mapping_file_path, 'r', encoding='utf-8') as f:
            rename_map = json.load(f).get("mapping", {})
    except Exception as e:
        # 关键修复：添加明确的错误日志
        print(f"!!! CRITICAL ERROR: 无法加载或解析 'field_mapping.json'. 错误: {e}")
        print(f"    - 尝试加载的路径: {mapping_file_path}")
        print(f"    - 将使用空的映射，列名可能不会被标准化。")
        rename_map = {}

    if 'kdrq' in df.columns and 'date' in df.columns:
        df = df.drop(columns=['date'])
        
    df.rename(columns=rename_map, inplace=True)

    if 'date' in df.columns:
        df['date'] = pd.to_datetime(df['date'], errors='coerce')
        df.dropna(subset=['date'], inplace=True)
    else:
        raise ValueError("数据中缺少 'date' (或 'kdrq') 列。")
    return df

def get_available_stores(file_path: str = None) -> List[Dict[str, Any]]:
    """
    获取可用的店铺列表 (最终修复版)
    """
    try:
        df = pd.read_parquet(file_path or DEFAULT_DATA_PATH)
        
        source_cols = ['subbh', 'kdrq', 'district_name', 'area_sq_km']
        existing_cols = [col for col in source_cols if col in df.columns]
        if 'subbh' not in df.columns: return []

        agg_dict = {'kdrq': 'min'}
        for col in existing_cols:
            if col not in ['subbh', 'kdrq']:
                agg_dict[col] = 'first'
        
        stores_df = df[existing_cols].groupby('subbh').agg(agg_dict).reset_index()

        stores_df.rename(columns={
            'subbh': 'store_id',
            'kdrq': 'opening_date',
            'district_name': 'location',
            'area_sq_km': 'area'
        }, inplace=True)
        
        stores_df['store_name'] = stores_df['store_id']
        if 'opening_date' in stores_df.columns:
            stores_df['opening_date'] = pd.to_datetime(stores_df['opening_date']).dt.strftime('%Y-%m-%d')
        
        stores_df['type'] = '综合'
        stores_df['status'] = '营业中'

        final_cols = ['store_id', 'store_name', 'location', 'type', 'area', 'opening_date', 'status']
        for col in final_cols:
            if col not in stores_df.columns:
                stores_df[col] = 'N/A'

        return stores_df[final_cols].to_dict('records')
    except Exception as e:
        print(f"获取店铺列表失败: {e}")
        return []

def get_all_unique_products(file_path: str = None) -> List[Dict[str, Any]]:
    """
    高效地获取数据源中所有唯一的产品列表。
    """
    try:
        # 只读取需要的列以提高效率
        df = pd.read_parquet(file_path or DEFAULT_DATA_PATH, columns=['hh'])
        if 'hh' not in df.columns:
            return []
        
        unique_products = df['hh'].unique()
        
        # 格式化为前端期望的格式
        product_list = [
            {'product_id': pid, 'product_name': pid} for pid in unique_products
        ]
        
        return product_list
    except Exception as e:
        print(f"获取所有唯一产品列表失败: {e}")
        return []

def get_available_products(file_path: str = None,
                         store_id: Optional[str] = None) -> List[Dict[str, Any]]:
    """
    获取店铺相关的产品列表及其销售统计 (v4 - 统一数据加载逻辑)
    """
    try:
        # 复用统一的数据加载和过滤函数，确保逻辑一致
        df = load_multi_store_data(file_path=file_path, store_id=store_id)

        if df.empty:
            # 添加日志以便调试
            print(f"!!! INFO: 为店铺ID '{store_id}' 加载数据后DataFrame为空。")
            return []

        # 此处的 df 已经是标准化和过滤后的，可以直接使用
        agg_ops = {
            'date': 'max',
            'sales_quantity': 'sum',
            'gross_profit': 'sum',
            'net_sales_quantity': 'sum',
            'category': 'first',
        }
        # 注意：这里的列名应该是标准化后的
        valid_agg_ops = {k: v for k, v in agg_ops.items() if k in df.columns}
        
        if 'product_id' not in df.columns:
            print("!!! WARNING: 'product_id' 列在标准化后不存在，返回空列表。")
            return []
            
        products_df = df.groupby('product_id').agg(valid_agg_ops).reset_index()

        products_df.rename(columns={
            'date': 'last_sale_date',
            'sales_quantity': 'total_sales',
        }, inplace=True)
        
        if 'gross_profit' in products_df.columns and 'net_sales_quantity' in products_df.columns:
            products_df['avg_price'] = (products_df['gross_profit'] / products_df['net_sales_quantity']).where(products_df['net_sales_quantity'] != 0, 0)
        
        products_df['product_name'] = products_df['product_id']
        
        if 'last_sale_date' in products_df.columns:
            products_df['last_sale_date'] = pd.to_datetime(products_df['last_sale_date']).dt.strftime('%Y-%m-%d')

        final_cols = ['product_id', 'product_name', 'category', 'total_sales', 'avg_price', 'last_sale_date']
        for col in final_cols:
            if col not in products_df.columns:
                if col in ['total_sales', 'avg_price']:
                    products_df[col] = 0
                else:
                    products_df[col] = 'N/A'

        # 关键修复：在转换为字典之前，将所有NaN和无穷大值替换为None，以确保JSON序列化成功
        products_df.replace([np.inf, -np.inf], np.nan, inplace=True)
        products_df = products_df.astype(object).where(products_df.notna(), None)
        
        return products_df[final_cols].to_dict('records')
    except Exception as e:
        print(f"获取产品列表失败: {e}")
        return []

def get_store_product_sales_data(store_id: str,
                               product_id: str,
                               file_path: str = None) -> pd.DataFrame:
    df = load_multi_store_data(file_path, store_id=store_id, product_id=product_id)
    if len(df) == 0:
        raise ValueError(f"没有找到店铺 {store_id} 产品 {product_id} 的销售数据")
    return df

def aggregate_multi_store_data(product_id: Optional[str] = None,
                              store_id: Optional[str] = None,
                              aggregation_method: str = 'sum',
                              file_path: str = None) -> pd.DataFrame:
    if store_id:
        df = load_multi_store_data(file_path, store_id=store_id)
    elif product_id:
        df = load_multi_store_data(file_path, product_id=product_id)
    else:
        df = load_multi_store_data(file_path)
    
    if df.empty:
        raise ValueError("过滤后数据为空，无法聚合")

    agg_dict = {}
    if aggregation_method == 'sum':
        agg_dict = {'sales_quantity': 'sum'}
    elif aggregation_method == 'mean':
        agg_dict = {'sales_quantity': 'mean'}
    
    valid_agg_dict = {k: v for k, v in agg_dict.items() if k in df.columns}
    
    aggregated_df = df.groupby('date').agg(valid_agg_dict).reset_index()
    
    return aggregated_df

def get_sales_statistics(file_path: str = None,
                        store_id: Optional[str] = None,
                        product_id: Optional[str] = None) -> Dict[str, Any]:
    try:
        df = load_multi_store_data(file_path, store_id=store_id, product_id=product_id)
        if len(df) == 0:
            return {'error': '没有数据'}
        
        stats = {
            'total_records': len(df),
            'date_range': {
                'start': df['date'].min().strftime('%Y-%m-%d'),
                'end': df['date'].max().strftime('%Y-%m-%d')
            },
            'stores': df['store_id'].nunique(),
            'products': df['product_id'].nunique(),
        }
        return stats
    except Exception as e:
        return {'error': str(e)}

def load_data(file_path=None, store_id=None):
    return load_multi_store_data(file_path, store_id=store_id)
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								"""
 								多店铺销售预测系统 - 数据处理工具函数
 								支持多店铺数据的加载、过滤和处理
 								"""
 								import pandas as pd
 								import numpy as np
 								import os
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								import json
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								from datetime import datetime, timedelta
 								from typing import Optional, List, Tuple, Dict, Any
-												**日期**: 2025-07-14
**主题**: UI导航栏重构

### 描述
根据用户请求，对左侧功能导航栏进行了调整。

### 主要改动
1.  **删除“数据管理”**:
    *   从 `UI/src/App.vue` 的导航菜单中移除了“数据管理”项。
    *   从 `UI/src/router/index.js` 中删除了对应的 `/data` 路由。
    *   删除了视图文件 `UI/src/views/DataView.vue`。

2.  **提升“店铺管理”**:
    *   将“店铺管理”菜单项在 `UI/src/App.vue` 中的位置提升，以填补原“数据管理”的位置，使其在导航中更加突出。

### 涉及文件
*   `UI/src/App.vue`
*   `UI/src/router/index.js`
*   `UI/src/views/DataView.vue` (已删除)

**按药品模型预测**
---
**日期**: 2025-07-14
**主题**: 修复导航菜单高亮问题

### 描述
修复了首次进入或刷新页面时，左侧导航菜单项与当前路由不匹配导致不高亮的问题。

### 主要改动
*   **文件**: `UI/src/App.vue`
*   **修改**:
    1.  引入 `useRoute` 和 `computed`。
    2.  创建了一个计算属性 `activeMenu`，其值动态地等于当前路由的路径 (`route.path`)。
    3.  将 `el-menu` 组件的 `:default-active` 属性绑定到 `activeMenu`。

### 结果
确保了导航菜单的高亮状态始终与当前页面的URL保持同步。

---
**日期**: 2025-07-15
**主题**: 修复硬编码文件路径问题，提高项目可移植性

### 问题描述
项目在从一台计算机迁移到另一台时，由于数据文件路径被硬编码在代码中，导致程序无法找到数据文件而运行失败。

### 根本原因
多个Python文件（`predictor.py`, `multi_store_data_utils.py`）中直接写入了相对路径 `'data/timeseries_training_data_sample_10s50p.parquet'` 作为默认值。这种方式在不同运行环境下（如从根目录运行 vs 从子目录运行）会产生路径解析错误。

### 解决方案：集中配置，统一管理
1.  **修改 `server/core/config.py` (核心)**:
    *   动态计算并定义了一个全局变量 `PROJECT_ROOT`，它始终指向项目的根目录。
    *   基于 `PROJECT_ROOT`，使用 `os.path.join` 创建了一个跨平台的、绝对的默认数据路径 `DEFAULT_DATA_PATH` 和模型保存路径 `DEFAULT_MODEL_DIR`。
    *   这确保了无论从哪个位置执行代码，路径总能被正确解析。

2.  **修改 `server/utils/multi_store_data_utils.py`**:
    *   从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   将所有数据加载函数的 `file_path` 参数的默认值从硬编码的字符串改为 `None`。
    *   在函数内部，如果 `file_path` 为 `None`，则自动使用导入的 `DEFAULT_DATA_PATH`。
    *   移除了原有的、复杂的、为了猜测正确路径而编写的冗余代码。

3.  **修改 `server/core/predictor.py`**:
    *   同样从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   在初始化 `PharmacyPredictor` 时，如果未提供数据路径，则使用导入的 `DEFAULT_DATA_PATH` 作为默认值。

### 最终结果
通过将数据源路径集中到唯一的配置文件中进行管理，彻底解决了因硬编码路径导致的可移植性问题。项目现在可以在任何环境下可靠地运行。

---
### 未来如何修改数据源（例如，连接到服务器数据库）

本次重构为将来更换数据源打下了坚实的基础。操作非常简单：

1.  **定位配置文件**: 打开 `server/core/config.py` 文件。

2.  **修改数据源定义**:
    *   **当前 (文件)**:
        ```python
        DEFAULT_DATA_PATH = os.path.join(PROJECT_ROOT, 'data', 'timeseries_training_data_sample_10s50p.parquet')
        ```
    *   **未来 (数据库示例)**:
        您可以将这行替换为数据库连接字符串，或者添加新的数据库配置变量。例如：
        ```python
        # 注释掉或删除旧的文件路径配置
        # DEFAULT_DATA_PATH = ...

        # 新增数据库连接配置
        DATABASE_URL = "postgresql://user:password@your_server_ip:5432/your_database_name"
        ```

3.  **修改数据加载逻辑**:
    *   **定位数据加载函数**: 打开 `server/utils/multi_store_data_utils.py`。
    *   **修改 `load_multi_store_data` 函数**:
        *   引入数据库连接库（如 `sqlalchemy` 或 `psycopg2`）。
        *   修改函数逻辑，使其使用 `config.py` 中的 `DATABASE_URL` 来连接数据库，并执行SQL查询来获取数据，而不是读取文件。
        *   **示例**:
            ```python
            from sqlalchemy import create_engine
            from core.config import DATABASE_URL # 导入新的数据库配置

            def load_multi_store_data(...):
                # ...
                engine = create_engine(DATABASE_URL)
                query = "SELECT * FROM sales_data" # 根据需要构建查询
                df = pd.read_sql(query, engine)
                # ... 后续处理逻辑保持不变 ...
            ```

											
										
										
											2025-07-15 10:37:25 +08:00
+								from core.config import DEFAULT_DATA_PATH
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												**日期**: 2025-07-14
**主题**: UI导航栏重构

### 描述
根据用户请求，对左侧功能导航栏进行了调整。

### 主要改动
1.  **删除“数据管理”**:
    *   从 `UI/src/App.vue` 的导航菜单中移除了“数据管理”项。
    *   从 `UI/src/router/index.js` 中删除了对应的 `/data` 路由。
    *   删除了视图文件 `UI/src/views/DataView.vue`。

2.  **提升“店铺管理”**:
    *   将“店铺管理”菜单项在 `UI/src/App.vue` 中的位置提升，以填补原“数据管理”的位置，使其在导航中更加突出。

### 涉及文件
*   `UI/src/App.vue`
*   `UI/src/router/index.js`
*   `UI/src/views/DataView.vue` (已删除)

**按药品模型预测**
---
**日期**: 2025-07-14
**主题**: 修复导航菜单高亮问题

### 描述
修复了首次进入或刷新页面时，左侧导航菜单项与当前路由不匹配导致不高亮的问题。

### 主要改动
*   **文件**: `UI/src/App.vue`
*   **修改**:
    1.  引入 `useRoute` 和 `computed`。
    2.  创建了一个计算属性 `activeMenu`，其值动态地等于当前路由的路径 (`route.path`)。
    3.  将 `el-menu` 组件的 `:default-active` 属性绑定到 `activeMenu`。

### 结果
确保了导航菜单的高亮状态始终与当前页面的URL保持同步。

---
**日期**: 2025-07-15
**主题**: 修复硬编码文件路径问题，提高项目可移植性

### 问题描述
项目在从一台计算机迁移到另一台时，由于数据文件路径被硬编码在代码中，导致程序无法找到数据文件而运行失败。

### 根本原因
多个Python文件（`predictor.py`, `multi_store_data_utils.py`）中直接写入了相对路径 `'data/timeseries_training_data_sample_10s50p.parquet'` 作为默认值。这种方式在不同运行环境下（如从根目录运行 vs 从子目录运行）会产生路径解析错误。

### 解决方案：集中配置，统一管理
1.  **修改 `server/core/config.py` (核心)**:
    *   动态计算并定义了一个全局变量 `PROJECT_ROOT`，它始终指向项目的根目录。
    *   基于 `PROJECT_ROOT`，使用 `os.path.join` 创建了一个跨平台的、绝对的默认数据路径 `DEFAULT_DATA_PATH` 和模型保存路径 `DEFAULT_MODEL_DIR`。
    *   这确保了无论从哪个位置执行代码，路径总能被正确解析。

2.  **修改 `server/utils/multi_store_data_utils.py`**:
    *   从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   将所有数据加载函数的 `file_path` 参数的默认值从硬编码的字符串改为 `None`。
    *   在函数内部，如果 `file_path` 为 `None`，则自动使用导入的 `DEFAULT_DATA_PATH`。
    *   移除了原有的、复杂的、为了猜测正确路径而编写的冗余代码。

3.  **修改 `server/core/predictor.py`**:
    *   同样从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   在初始化 `PharmacyPredictor` 时，如果未提供数据路径，则使用导入的 `DEFAULT_DATA_PATH` 作为默认值。

### 最终结果
通过将数据源路径集中到唯一的配置文件中进行管理，彻底解决了因硬编码路径导致的可移植性问题。项目现在可以在任何环境下可靠地运行。

---
### 未来如何修改数据源（例如，连接到服务器数据库）

本次重构为将来更换数据源打下了坚实的基础。操作非常简单：

1.  **定位配置文件**: 打开 `server/core/config.py` 文件。

2.  **修改数据源定义**:
    *   **当前 (文件)**:
        ```python
        DEFAULT_DATA_PATH = os.path.join(PROJECT_ROOT, 'data', 'timeseries_training_data_sample_10s50p.parquet')
        ```
    *   **未来 (数据库示例)**:
        您可以将这行替换为数据库连接字符串，或者添加新的数据库配置变量。例如：
        ```python
        # 注释掉或删除旧的文件路径配置
        # DEFAULT_DATA_PATH = ...

        # 新增数据库连接配置
        DATABASE_URL = "postgresql://user:password@your_server_ip:5432/your_database_name"
        ```

3.  **修改数据加载逻辑**:
    *   **定位数据加载函数**: 打开 `server/utils/multi_store_data_utils.py`。
    *   **修改 `load_multi_store_data` 函数**:
        *   引入数据库连接库（如 `sqlalchemy` 或 `psycopg2`）。
        *   修改函数逻辑，使其使用 `config.py` 中的 `DATABASE_URL` 来连接数据库，并执行SQL查询来获取数据，而不是读取文件。
        *   **示例**:
            ```python
            from sqlalchemy import create_engine
            from core.config import DATABASE_URL # 导入新的数据库配置

            def load_multi_store_data(...):
                # ...
                engine = create_engine(DATABASE_URL)
                query = "SELECT * FROM sales_data" # 根据需要构建查询
                df = pd.read_sql(query, engine)
                # ... 后续处理逻辑保持不变 ...
            ```

											
										
										
											2025-07-15 10:37:25 +08:00
+								def load_multi_store_data(file_path: str = None,
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								                         store_id: Optional[str] = None,
 								                         product_id: Optional[str] = None,
 								                         start_date: Optional[str] = None,
 								                         end_date: Optional[str] = None) -> pd.DataFrame:
 								    """
 								    加载多店铺销售数据，支持按店铺、产品、时间范围过滤
 								    """
-												**日期**: 2025-07-14
**主题**: UI导航栏重构

### 描述
根据用户请求，对左侧功能导航栏进行了调整。

### 主要改动
1.  **删除“数据管理”**:
    *   从 `UI/src/App.vue` 的导航菜单中移除了“数据管理”项。
    *   从 `UI/src/router/index.js` 中删除了对应的 `/data` 路由。
    *   删除了视图文件 `UI/src/views/DataView.vue`。

2.  **提升“店铺管理”**:
    *   将“店铺管理”菜单项在 `UI/src/App.vue` 中的位置提升，以填补原“数据管理”的位置，使其在导航中更加突出。

### 涉及文件
*   `UI/src/App.vue`
*   `UI/src/router/index.js`
*   `UI/src/views/DataView.vue` (已删除)

**按药品模型预测**
---
**日期**: 2025-07-14
**主题**: 修复导航菜单高亮问题

### 描述
修复了首次进入或刷新页面时，左侧导航菜单项与当前路由不匹配导致不高亮的问题。

### 主要改动
*   **文件**: `UI/src/App.vue`
*   **修改**:
    1.  引入 `useRoute` 和 `computed`。
    2.  创建了一个计算属性 `activeMenu`，其值动态地等于当前路由的路径 (`route.path`)。
    3.  将 `el-menu` 组件的 `:default-active` 属性绑定到 `activeMenu`。

### 结果
确保了导航菜单的高亮状态始终与当前页面的URL保持同步。

---
**日期**: 2025-07-15
**主题**: 修复硬编码文件路径问题，提高项目可移植性

### 问题描述
项目在从一台计算机迁移到另一台时，由于数据文件路径被硬编码在代码中，导致程序无法找到数据文件而运行失败。

### 根本原因
多个Python文件（`predictor.py`, `multi_store_data_utils.py`）中直接写入了相对路径 `'data/timeseries_training_data_sample_10s50p.parquet'` 作为默认值。这种方式在不同运行环境下（如从根目录运行 vs 从子目录运行）会产生路径解析错误。

### 解决方案：集中配置，统一管理
1.  **修改 `server/core/config.py` (核心)**:
    *   动态计算并定义了一个全局变量 `PROJECT_ROOT`，它始终指向项目的根目录。
    *   基于 `PROJECT_ROOT`，使用 `os.path.join` 创建了一个跨平台的、绝对的默认数据路径 `DEFAULT_DATA_PATH` 和模型保存路径 `DEFAULT_MODEL_DIR`。
    *   这确保了无论从哪个位置执行代码，路径总能被正确解析。

2.  **修改 `server/utils/multi_store_data_utils.py`**:
    *   从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   将所有数据加载函数的 `file_path` 参数的默认值从硬编码的字符串改为 `None`。
    *   在函数内部，如果 `file_path` 为 `None`，则自动使用导入的 `DEFAULT_DATA_PATH`。
    *   移除了原有的、复杂的、为了猜测正确路径而编写的冗余代码。

3.  **修改 `server/core/predictor.py`**:
    *   同样从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   在初始化 `PharmacyPredictor` 时，如果未提供数据路径，则使用导入的 `DEFAULT_DATA_PATH` 作为默认值。

### 最终结果
通过将数据源路径集中到唯一的配置文件中进行管理，彻底解决了因硬编码路径导致的可移植性问题。项目现在可以在任何环境下可靠地运行。

---
### 未来如何修改数据源（例如，连接到服务器数据库）

本次重构为将来更换数据源打下了坚实的基础。操作非常简单：

1.  **定位配置文件**: 打开 `server/core/config.py` 文件。

2.  **修改数据源定义**:
    *   **当前 (文件)**:
        ```python
        DEFAULT_DATA_PATH = os.path.join(PROJECT_ROOT, 'data', 'timeseries_training_data_sample_10s50p.parquet')
        ```
    *   **未来 (数据库示例)**:
        您可以将这行替换为数据库连接字符串，或者添加新的数据库配置变量。例如：
        ```python
        # 注释掉或删除旧的文件路径配置
        # DEFAULT_DATA_PATH = ...

        # 新增数据库连接配置
        DATABASE_URL = "postgresql://user:password@your_server_ip:5432/your_database_name"
        ```

3.  **修改数据加载逻辑**:
    *   **定位数据加载函数**: 打开 `server/utils/multi_store_data_utils.py`。
    *   **修改 `load_multi_store_data` 函数**:
        *   引入数据库连接库（如 `sqlalchemy` 或 `psycopg2`）。
        *   修改函数逻辑，使其使用 `config.py` 中的 `DATABASE_URL` 来连接数据库，并执行SQL查询来获取数据，而不是读取文件。
        *   **示例**:
            ```python
            from sqlalchemy import create_engine
            from core.config import DATABASE_URL # 导入新的数据库配置

            def load_multi_store_data(...):
                # ...
                engine = create_engine(DATABASE_URL)
                query = "SELECT * FROM sales_data" # 根据需要构建查询
                df = pd.read_sql(query, engine)
                # ... 后续处理逻辑保持不变 ...
            ```

											
										
										
											2025-07-15 10:37:25 +08:00
+								    if file_path is None:
 								        file_path = DEFAULT_DATA_PATH
 								    if not os.path.exists(file_path):
 								        raise FileNotFoundError(f"数据文件不存在: {file_path}")
 								    try:
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        df = pd.read_parquet(file_path or DEFAULT_DATA_PATH)
-												**日期**: 2025-07-14
**主题**: UI导航栏重构

### 描述
根据用户请求，对左侧功能导航栏进行了调整。

### 主要改动
1.  **删除“数据管理”**:
    *   从 `UI/src/App.vue` 的导航菜单中移除了“数据管理”项。
    *   从 `UI/src/router/index.js` 中删除了对应的 `/data` 路由。
    *   删除了视图文件 `UI/src/views/DataView.vue`。

2.  **提升“店铺管理”**:
    *   将“店铺管理”菜单项在 `UI/src/App.vue` 中的位置提升，以填补原“数据管理”的位置，使其在导航中更加突出。

### 涉及文件
*   `UI/src/App.vue`
*   `UI/src/router/index.js`
*   `UI/src/views/DataView.vue` (已删除)

**按药品模型预测**
---
**日期**: 2025-07-14
**主题**: 修复导航菜单高亮问题

### 描述
修复了首次进入或刷新页面时，左侧导航菜单项与当前路由不匹配导致不高亮的问题。

### 主要改动
*   **文件**: `UI/src/App.vue`
*   **修改**:
    1.  引入 `useRoute` 和 `computed`。
    2.  创建了一个计算属性 `activeMenu`，其值动态地等于当前路由的路径 (`route.path`)。
    3.  将 `el-menu` 组件的 `:default-active` 属性绑定到 `activeMenu`。

### 结果
确保了导航菜单的高亮状态始终与当前页面的URL保持同步。

---
**日期**: 2025-07-15
**主题**: 修复硬编码文件路径问题，提高项目可移植性

### 问题描述
项目在从一台计算机迁移到另一台时，由于数据文件路径被硬编码在代码中，导致程序无法找到数据文件而运行失败。

### 根本原因
多个Python文件（`predictor.py`, `multi_store_data_utils.py`）中直接写入了相对路径 `'data/timeseries_training_data_sample_10s50p.parquet'` 作为默认值。这种方式在不同运行环境下（如从根目录运行 vs 从子目录运行）会产生路径解析错误。

### 解决方案：集中配置，统一管理
1.  **修改 `server/core/config.py` (核心)**:
    *   动态计算并定义了一个全局变量 `PROJECT_ROOT`，它始终指向项目的根目录。
    *   基于 `PROJECT_ROOT`，使用 `os.path.join` 创建了一个跨平台的、绝对的默认数据路径 `DEFAULT_DATA_PATH` 和模型保存路径 `DEFAULT_MODEL_DIR`。
    *   这确保了无论从哪个位置执行代码，路径总能被正确解析。

2.  **修改 `server/utils/multi_store_data_utils.py`**:
    *   从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   将所有数据加载函数的 `file_path` 参数的默认值从硬编码的字符串改为 `None`。
    *   在函数内部，如果 `file_path` 为 `None`，则自动使用导入的 `DEFAULT_DATA_PATH`。
    *   移除了原有的、复杂的、为了猜测正确路径而编写的冗余代码。

3.  **修改 `server/core/predictor.py`**:
    *   同样从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   在初始化 `PharmacyPredictor` 时，如果未提供数据路径，则使用导入的 `DEFAULT_DATA_PATH` 作为默认值。

### 最终结果
通过将数据源路径集中到唯一的配置文件中进行管理，彻底解决了因硬编码路径导致的可移植性问题。项目现在可以在任何环境下可靠地运行。

---
### 未来如何修改数据源（例如，连接到服务器数据库）

本次重构为将来更换数据源打下了坚实的基础。操作非常简单：

1.  **定位配置文件**: 打开 `server/core/config.py` 文件。

2.  **修改数据源定义**:
    *   **当前 (文件)**:
        ```python
        DEFAULT_DATA_PATH = os.path.join(PROJECT_ROOT, 'data', 'timeseries_training_data_sample_10s50p.parquet')
        ```
    *   **未来 (数据库示例)**:
        您可以将这行替换为数据库连接字符串，或者添加新的数据库配置变量。例如：
        ```python
        # 注释掉或删除旧的文件路径配置
        # DEFAULT_DATA_PATH = ...

        # 新增数据库连接配置
        DATABASE_URL = "postgresql://user:password@your_server_ip:5432/your_database_name"
        ```

3.  **修改数据加载逻辑**:
    *   **定位数据加载函数**: 打开 `server/utils/multi_store_data_utils.py`。
    *   **修改 `load_multi_store_data` 函数**:
        *   引入数据库连接库（如 `sqlalchemy` 或 `psycopg2`）。
        *   修改函数逻辑，使其使用 `config.py` 中的 `DATABASE_URL` 来连接数据库，并执行SQL查询来获取数据，而不是读取文件。
        *   **示例**:
            ```python
            from sqlalchemy import create_engine
            from core.config import DATABASE_URL # 导入新的数据库配置

            def load_multi_store_data(...):
                # ...
                engine = create_engine(DATABASE_URL)
                query = "SELECT * FROM sales_data" # 根据需要构建查询
                df = pd.read_sql(query, engine)
                # ... 后续处理逻辑保持不变 ...
            ```

											
										
										
											2025-07-15 10:37:25 +08:00
+								    except Exception as e:
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        raise e
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								    df = standardize_column_names(df)
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    if store_id:
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        df['store_id'] = df['store_id'].astype(str)
 								        df = df[df['store_id'] == str(store_id)].copy()
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
 								    if product_id:
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        df['product_id'] = df['product_id'].astype(str)
 								        df = df[df['product_id'] == str(product_id)].copy()
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
 								    if start_date:
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        df = df[df['date'] >= pd.to_datetime(start_date)].copy()
-												完成模型训练调试，修改模型预测的导航栏

											
										
										
											2025-07-14 19:26:57 +08:00
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    if end_date:
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        df = df[df['date'] <= pd.to_datetime(end_date)].copy()
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
 								    return df
 								def standardize_column_names(df: pd.DataFrame) -> pd.DataFrame:
 								    """
-												完成模型训练调试，修改模型预测的导航栏

											
										
										
											2025-07-14 19:26:57 +08:00
+								    标准化列名以匹配训练代码和API期望的格式
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    """
 								    df = df.copy()
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								    try:
 								        current_dir = os.path.dirname(os.path.abspath(__file__))
 								        mapping_file_path = os.path.join(current_dir, '..', 'core', 'field_mapping.json')
 								        with open(mapping_file_path, 'r', encoding='utf-8') as f:
 								            rename_map = json.load(f).get("mapping", {})
 								    except Exception as e:
 								        # 关键修复：添加明确的错误日志
 								        print(f"!!! CRITICAL ERROR: 无法加载或解析 'field_mapping.json'. 错误: {e}")
 								        print(f"    - 尝试加载的路径: {mapping_file_path}")
 								        print(f"    - 将使用空的映射，列名可能不会被标准化。")
 								        rename_map = {}
 								    if 'kdrq' in df.columns and 'date' in df.columns:
 								        df = df.drop(columns=['date'])
 								    df.rename(columns=rename_map, inplace=True)
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    if 'date' in df.columns:
-												完成模型训练调试，修改模型预测的导航栏

											
										
										
											2025-07-14 19:26:57 +08:00
+								        df['date'] = pd.to_datetime(df['date'], errors='coerce')
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        df.dropna(subset=['date'], inplace=True)
-												完成模型训练调试，修改模型预测的导航栏

											
										
										
											2025-07-14 19:26:57 +08:00
+								    else:
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        raise ValueError("数据中缺少 'date' (或 'kdrq') 列。")
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    return df
-												**日期**: 2025-07-14
**主题**: UI导航栏重构

### 描述
根据用户请求，对左侧功能导航栏进行了调整。

### 主要改动
1.  **删除“数据管理”**:
    *   从 `UI/src/App.vue` 的导航菜单中移除了“数据管理”项。
    *   从 `UI/src/router/index.js` 中删除了对应的 `/data` 路由。
    *   删除了视图文件 `UI/src/views/DataView.vue`。

2.  **提升“店铺管理”**:
    *   将“店铺管理”菜单项在 `UI/src/App.vue` 中的位置提升，以填补原“数据管理”的位置，使其在导航中更加突出。

### 涉及文件
*   `UI/src/App.vue`
*   `UI/src/router/index.js`
*   `UI/src/views/DataView.vue` (已删除)

**按药品模型预测**
---
**日期**: 2025-07-14
**主题**: 修复导航菜单高亮问题

### 描述
修复了首次进入或刷新页面时，左侧导航菜单项与当前路由不匹配导致不高亮的问题。

### 主要改动
*   **文件**: `UI/src/App.vue`
*   **修改**:
    1.  引入 `useRoute` 和 `computed`。
    2.  创建了一个计算属性 `activeMenu`，其值动态地等于当前路由的路径 (`route.path`)。
    3.  将 `el-menu` 组件的 `:default-active` 属性绑定到 `activeMenu`。

### 结果
确保了导航菜单的高亮状态始终与当前页面的URL保持同步。

---
**日期**: 2025-07-15
**主题**: 修复硬编码文件路径问题，提高项目可移植性

### 问题描述
项目在从一台计算机迁移到另一台时，由于数据文件路径被硬编码在代码中，导致程序无法找到数据文件而运行失败。

### 根本原因
多个Python文件（`predictor.py`, `multi_store_data_utils.py`）中直接写入了相对路径 `'data/timeseries_training_data_sample_10s50p.parquet'` 作为默认值。这种方式在不同运行环境下（如从根目录运行 vs 从子目录运行）会产生路径解析错误。

### 解决方案：集中配置，统一管理
1.  **修改 `server/core/config.py` (核心)**:
    *   动态计算并定义了一个全局变量 `PROJECT_ROOT`，它始终指向项目的根目录。
    *   基于 `PROJECT_ROOT`，使用 `os.path.join` 创建了一个跨平台的、绝对的默认数据路径 `DEFAULT_DATA_PATH` 和模型保存路径 `DEFAULT_MODEL_DIR`。
    *   这确保了无论从哪个位置执行代码，路径总能被正确解析。

2.  **修改 `server/utils/multi_store_data_utils.py`**:
    *   从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   将所有数据加载函数的 `file_path` 参数的默认值从硬编码的字符串改为 `None`。
    *   在函数内部，如果 `file_path` 为 `None`，则自动使用导入的 `DEFAULT_DATA_PATH`。
    *   移除了原有的、复杂的、为了猜测正确路径而编写的冗余代码。

3.  **修改 `server/core/predictor.py`**:
    *   同样从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   在初始化 `PharmacyPredictor` 时，如果未提供数据路径，则使用导入的 `DEFAULT_DATA_PATH` 作为默认值。

### 最终结果
通过将数据源路径集中到唯一的配置文件中进行管理，彻底解决了因硬编码路径导致的可移植性问题。项目现在可以在任何环境下可靠地运行。

---
### 未来如何修改数据源（例如，连接到服务器数据库）

本次重构为将来更换数据源打下了坚实的基础。操作非常简单：

1.  **定位配置文件**: 打开 `server/core/config.py` 文件。

2.  **修改数据源定义**:
    *   **当前 (文件)**:
        ```python
        DEFAULT_DATA_PATH = os.path.join(PROJECT_ROOT, 'data', 'timeseries_training_data_sample_10s50p.parquet')
        ```
    *   **未来 (数据库示例)**:
        您可以将这行替换为数据库连接字符串，或者添加新的数据库配置变量。例如：
        ```python
        # 注释掉或删除旧的文件路径配置
        # DEFAULT_DATA_PATH = ...

        # 新增数据库连接配置
        DATABASE_URL = "postgresql://user:password@your_server_ip:5432/your_database_name"
        ```

3.  **修改数据加载逻辑**:
    *   **定位数据加载函数**: 打开 `server/utils/multi_store_data_utils.py`。
    *   **修改 `load_multi_store_data` 函数**:
        *   引入数据库连接库（如 `sqlalchemy` 或 `psycopg2`）。
        *   修改函数逻辑，使其使用 `config.py` 中的 `DATABASE_URL` 来连接数据库，并执行SQL查询来获取数据，而不是读取文件。
        *   **示例**:
            ```python
            from sqlalchemy import create_engine
            from core.config import DATABASE_URL # 导入新的数据库配置

            def load_multi_store_data(...):
                # ...
                engine = create_engine(DATABASE_URL)
                query = "SELECT * FROM sales_data" # 根据需要构建查询
                df = pd.read_sql(query, engine)
                # ... 后续处理逻辑保持不变 ...
            ```

											
										
										
											2025-07-15 10:37:25 +08:00
+								def get_available_stores(file_path: str = None) -> List[Dict[str, Any]]:
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    """
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								    获取可用的店铺列表 (最终修复版)
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    """
 								    try:
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        df = pd.read_parquet(file_path or DEFAULT_DATA_PATH)
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        source_cols = ['subbh', 'kdrq', 'district_name', 'area_sq_km']
 								        existing_cols = [col for col in source_cols if col in df.columns]
 								        if 'subbh' not in df.columns: return []
-												完成模型训练调试，修改模型预测的导航栏

											
										
										
											2025-07-14 19:26:57 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        agg_dict = {'kdrq': 'min'}
 								        for col in existing_cols:
 								            if col not in ['subbh', 'kdrq']:
 								                agg_dict[col] = 'first'
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        stores_df = df[existing_cols].groupby('subbh').agg(agg_dict).reset_index()
-												完成模型训练调试，修改模型预测的导航栏

											
										
										
											2025-07-14 19:26:57 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        stores_df.rename(columns={
 								            'subbh': 'store_id',
 								            'kdrq': 'opening_date',
 								            'district_name': 'location',
 								            'area_sq_km': 'area'
 								        }, inplace=True)
 								        stores_df['store_name'] = stores_df['store_id']
 								        if 'opening_date' in stores_df.columns:
 								            stores_df['opening_date'] = pd.to_datetime(stores_df['opening_date']).dt.strftime('%Y-%m-%d')
 								        stores_df['type'] = '综合'
 								        stores_df['status'] = '营业中'
 								        final_cols = ['store_id', 'store_name', 'location', 'type', 'area', 'opening_date', 'status']
 								        for col in final_cols:
 								            if col not in stores_df.columns:
 								                stores_df[col] = 'N/A'
 								        return stores_df[final_cols].to_dict('records')
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    except Exception as e:
 								        print(f"获取店铺列表失败: {e}")
 								        return []
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								def get_all_unique_products(file_path: str = None) -> List[Dict[str, Any]]:
 								    """
 								    高效地获取数据源中所有唯一的产品列表。
 								    """
 								    try:
 								        # 只读取需要的列以提高效率
 								        df = pd.read_parquet(file_path or DEFAULT_DATA_PATH, columns=['hh'])
 								        if 'hh' not in df.columns:
 								            return []
 								        unique_products = df['hh'].unique()
 								        # 格式化为前端期望的格式
 								        product_list = [
 								            {'product_id': pid, 'product_name': pid} for pid in unique_products
 								        ]
 								        return product_list
 								    except Exception as e:
 								        print(f"获取所有唯一产品列表失败: {e}")
 								        return []
-												**日期**: 2025-07-14
**主题**: UI导航栏重构

### 描述
根据用户请求，对左侧功能导航栏进行了调整。

### 主要改动
1.  **删除“数据管理”**:
    *   从 `UI/src/App.vue` 的导航菜单中移除了“数据管理”项。
    *   从 `UI/src/router/index.js` 中删除了对应的 `/data` 路由。
    *   删除了视图文件 `UI/src/views/DataView.vue`。

2.  **提升“店铺管理”**:
    *   将“店铺管理”菜单项在 `UI/src/App.vue` 中的位置提升，以填补原“数据管理”的位置，使其在导航中更加突出。

### 涉及文件
*   `UI/src/App.vue`
*   `UI/src/router/index.js`
*   `UI/src/views/DataView.vue` (已删除)

**按药品模型预测**
---
**日期**: 2025-07-14
**主题**: 修复导航菜单高亮问题

### 描述
修复了首次进入或刷新页面时，左侧导航菜单项与当前路由不匹配导致不高亮的问题。

### 主要改动
*   **文件**: `UI/src/App.vue`
*   **修改**:
    1.  引入 `useRoute` 和 `computed`。
    2.  创建了一个计算属性 `activeMenu`，其值动态地等于当前路由的路径 (`route.path`)。
    3.  将 `el-menu` 组件的 `:default-active` 属性绑定到 `activeMenu`。

### 结果
确保了导航菜单的高亮状态始终与当前页面的URL保持同步。

---
**日期**: 2025-07-15
**主题**: 修复硬编码文件路径问题，提高项目可移植性

### 问题描述
项目在从一台计算机迁移到另一台时，由于数据文件路径被硬编码在代码中，导致程序无法找到数据文件而运行失败。

### 根本原因
多个Python文件（`predictor.py`, `multi_store_data_utils.py`）中直接写入了相对路径 `'data/timeseries_training_data_sample_10s50p.parquet'` 作为默认值。这种方式在不同运行环境下（如从根目录运行 vs 从子目录运行）会产生路径解析错误。

### 解决方案：集中配置，统一管理
1.  **修改 `server/core/config.py` (核心)**:
    *   动态计算并定义了一个全局变量 `PROJECT_ROOT`，它始终指向项目的根目录。
    *   基于 `PROJECT_ROOT`，使用 `os.path.join` 创建了一个跨平台的、绝对的默认数据路径 `DEFAULT_DATA_PATH` 和模型保存路径 `DEFAULT_MODEL_DIR`。
    *   这确保了无论从哪个位置执行代码，路径总能被正确解析。

2.  **修改 `server/utils/multi_store_data_utils.py`**:
    *   从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   将所有数据加载函数的 `file_path` 参数的默认值从硬编码的字符串改为 `None`。
    *   在函数内部，如果 `file_path` 为 `None`，则自动使用导入的 `DEFAULT_DATA_PATH`。
    *   移除了原有的、复杂的、为了猜测正确路径而编写的冗余代码。

3.  **修改 `server/core/predictor.py`**:
    *   同样从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   在初始化 `PharmacyPredictor` 时，如果未提供数据路径，则使用导入的 `DEFAULT_DATA_PATH` 作为默认值。

### 最终结果
通过将数据源路径集中到唯一的配置文件中进行管理，彻底解决了因硬编码路径导致的可移植性问题。项目现在可以在任何环境下可靠地运行。

---
### 未来如何修改数据源（例如，连接到服务器数据库）

本次重构为将来更换数据源打下了坚实的基础。操作非常简单：

1.  **定位配置文件**: 打开 `server/core/config.py` 文件。

2.  **修改数据源定义**:
    *   **当前 (文件)**:
        ```python
        DEFAULT_DATA_PATH = os.path.join(PROJECT_ROOT, 'data', 'timeseries_training_data_sample_10s50p.parquet')
        ```
    *   **未来 (数据库示例)**:
        您可以将这行替换为数据库连接字符串，或者添加新的数据库配置变量。例如：
        ```python
        # 注释掉或删除旧的文件路径配置
        # DEFAULT_DATA_PATH = ...

        # 新增数据库连接配置
        DATABASE_URL = "postgresql://user:password@your_server_ip:5432/your_database_name"
        ```

3.  **修改数据加载逻辑**:
    *   **定位数据加载函数**: 打开 `server/utils/multi_store_data_utils.py`。
    *   **修改 `load_multi_store_data` 函数**:
        *   引入数据库连接库（如 `sqlalchemy` 或 `psycopg2`）。
        *   修改函数逻辑，使其使用 `config.py` 中的 `DATABASE_URL` 来连接数据库，并执行SQL查询来获取数据，而不是读取文件。
        *   **示例**:
            ```python
            from sqlalchemy import create_engine
            from core.config import DATABASE_URL # 导入新的数据库配置

            def load_multi_store_data(...):
                # ...
                engine = create_engine(DATABASE_URL)
                query = "SELECT * FROM sales_data" # 根据需要构建查询
                df = pd.read_sql(query, engine)
                # ... 后续处理逻辑保持不变 ...
            ```

											
										
										
											2025-07-15 10:37:25 +08:00
+								def get_available_products(file_path: str = None,
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								                         store_id: Optional[str] = None) -> List[Dict[str, Any]]:
 								    """
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								    获取店铺相关的产品列表及其销售统计 (v4 - 统一数据加载逻辑)
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    """
 								    try:
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        # 复用统一的数据加载和过滤函数，确保逻辑一致
 								        df = load_multi_store_data(file_path=file_path, store_id=store_id)
 								        if df.empty:
 								            # 添加日志以便调试
 								            print(f"!!! INFO: 为店铺ID '{store_id}' 加载数据后DataFrame为空。")
 								            return []
 								        # 此处的 df 已经是标准化和过滤后的，可以直接使用
 								        agg_ops = {
 								            'date': 'max',
 								            'sales_quantity': 'sum',
 								            'gross_profit': 'sum',
 								            'net_sales_quantity': 'sum',
 								            'category': 'first',
 								        }
 								        # 注意：这里的列名应该是标准化后的
 								        valid_agg_ops = {k: v for k, v in agg_ops.items() if k in df.columns}
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        if 'product_id' not in df.columns:
 								            print("!!! WARNING: 'product_id' 列在标准化后不存在，返回空列表。")
 								            return []
 								        products_df = df.groupby('product_id').agg(valid_agg_ops).reset_index()
 								        products_df.rename(columns={
 								            'date': 'last_sale_date',
 								            'sales_quantity': 'total_sales',
 								        }, inplace=True)
 								        if 'gross_profit' in products_df.columns and 'net_sales_quantity' in products_df.columns:
 								            products_df['avg_price'] = (products_df['gross_profit'] / products_df['net_sales_quantity']).where(products_df['net_sales_quantity'] != 0, 0)
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        products_df['product_name'] = products_df['product_id']
 								        if 'last_sale_date' in products_df.columns:
 								            products_df['last_sale_date'] = pd.to_datetime(products_df['last_sale_date']).dt.strftime('%Y-%m-%d')
 								        final_cols = ['product_id', 'product_name', 'category', 'total_sales', 'avg_price', 'last_sale_date']
 								        for col in final_cols:
 								            if col not in products_df.columns:
 								                if col in ['total_sales', 'avg_price']:
 								                    products_df[col] = 0
 								                else:
 								                    products_df[col] = 'N/A'
 								        # 关键修复：在转换为字典之前，将所有NaN和无穷大值替换为None，以确保JSON序列化成功
 								        products_df.replace([np.inf, -np.inf], np.nan, inplace=True)
 								        products_df = products_df.astype(object).where(products_df.notna(), None)
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        return products_df[final_cols].to_dict('records')
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    except Exception as e:
 								        print(f"获取产品列表失败: {e}")
 								        return []
 								def get_store_product_sales_data(store_id: str,
 								                               product_id: str,
-												**日期**: 2025-07-14
**主题**: UI导航栏重构

### 描述
根据用户请求，对左侧功能导航栏进行了调整。

### 主要改动
1.  **删除“数据管理”**:
    *   从 `UI/src/App.vue` 的导航菜单中移除了“数据管理”项。
    *   从 `UI/src/router/index.js` 中删除了对应的 `/data` 路由。
    *   删除了视图文件 `UI/src/views/DataView.vue`。

2.  **提升“店铺管理”**:
    *   将“店铺管理”菜单项在 `UI/src/App.vue` 中的位置提升，以填补原“数据管理”的位置，使其在导航中更加突出。

### 涉及文件
*   `UI/src/App.vue`
*   `UI/src/router/index.js`
*   `UI/src/views/DataView.vue` (已删除)

**按药品模型预测**
---
**日期**: 2025-07-14
**主题**: 修复导航菜单高亮问题

### 描述
修复了首次进入或刷新页面时，左侧导航菜单项与当前路由不匹配导致不高亮的问题。

### 主要改动
*   **文件**: `UI/src/App.vue`
*   **修改**:
    1.  引入 `useRoute` 和 `computed`。
    2.  创建了一个计算属性 `activeMenu`，其值动态地等于当前路由的路径 (`route.path`)。
    3.  将 `el-menu` 组件的 `:default-active` 属性绑定到 `activeMenu`。

### 结果
确保了导航菜单的高亮状态始终与当前页面的URL保持同步。

---
**日期**: 2025-07-15
**主题**: 修复硬编码文件路径问题，提高项目可移植性

### 问题描述
项目在从一台计算机迁移到另一台时，由于数据文件路径被硬编码在代码中，导致程序无法找到数据文件而运行失败。

### 根本原因
多个Python文件（`predictor.py`, `multi_store_data_utils.py`）中直接写入了相对路径 `'data/timeseries_training_data_sample_10s50p.parquet'` 作为默认值。这种方式在不同运行环境下（如从根目录运行 vs 从子目录运行）会产生路径解析错误。

### 解决方案：集中配置，统一管理
1.  **修改 `server/core/config.py` (核心)**:
    *   动态计算并定义了一个全局变量 `PROJECT_ROOT`，它始终指向项目的根目录。
    *   基于 `PROJECT_ROOT`，使用 `os.path.join` 创建了一个跨平台的、绝对的默认数据路径 `DEFAULT_DATA_PATH` 和模型保存路径 `DEFAULT_MODEL_DIR`。
    *   这确保了无论从哪个位置执行代码，路径总能被正确解析。

2.  **修改 `server/utils/multi_store_data_utils.py`**:
    *   从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   将所有数据加载函数的 `file_path` 参数的默认值从硬编码的字符串改为 `None`。
    *   在函数内部，如果 `file_path` 为 `None`，则自动使用导入的 `DEFAULT_DATA_PATH`。
    *   移除了原有的、复杂的、为了猜测正确路径而编写的冗余代码。

3.  **修改 `server/core/predictor.py`**:
    *   同样从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   在初始化 `PharmacyPredictor` 时，如果未提供数据路径，则使用导入的 `DEFAULT_DATA_PATH` 作为默认值。

### 最终结果
通过将数据源路径集中到唯一的配置文件中进行管理，彻底解决了因硬编码路径导致的可移植性问题。项目现在可以在任何环境下可靠地运行。

---
### 未来如何修改数据源（例如，连接到服务器数据库）

本次重构为将来更换数据源打下了坚实的基础。操作非常简单：

1.  **定位配置文件**: 打开 `server/core/config.py` 文件。

2.  **修改数据源定义**:
    *   **当前 (文件)**:
        ```python
        DEFAULT_DATA_PATH = os.path.join(PROJECT_ROOT, 'data', 'timeseries_training_data_sample_10s50p.parquet')
        ```
    *   **未来 (数据库示例)**:
        您可以将这行替换为数据库连接字符串，或者添加新的数据库配置变量。例如：
        ```python
        # 注释掉或删除旧的文件路径配置
        # DEFAULT_DATA_PATH = ...

        # 新增数据库连接配置
        DATABASE_URL = "postgresql://user:password@your_server_ip:5432/your_database_name"
        ```

3.  **修改数据加载逻辑**:
    *   **定位数据加载函数**: 打开 `server/utils/multi_store_data_utils.py`。
    *   **修改 `load_multi_store_data` 函数**:
        *   引入数据库连接库（如 `sqlalchemy` 或 `psycopg2`）。
        *   修改函数逻辑，使其使用 `config.py` 中的 `DATABASE_URL` 来连接数据库，并执行SQL查询来获取数据，而不是读取文件。
        *   **示例**:
            ```python
            from sqlalchemy import create_engine
            from core.config import DATABASE_URL # 导入新的数据库配置

            def load_multi_store_data(...):
                # ...
                engine = create_engine(DATABASE_URL)
                query = "SELECT * FROM sales_data" # 根据需要构建查询
                df = pd.read_sql(query, engine)
                # ... 后续处理逻辑保持不变 ...
            ```

											
										
										
											2025-07-15 10:37:25 +08:00
+								                               file_path: str = None) -> pd.DataFrame:
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    df = load_multi_store_data(file_path, store_id=store_id, product_id=product_id)
 								    if len(df) == 0:
 								        raise ValueError(f"没有找到店铺 {store_id} 产品 {product_id} 的销售数据")
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								    return df
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												完成模型训练调试，修改模型预测的导航栏

											
										
										
											2025-07-14 19:26:57 +08:00
+								def aggregate_multi_store_data(product_id: Optional[str] = None,
 								                              store_id: Optional[str] = None,
 								                              aggregation_method: str = 'sum',
-												**日期**: 2025-07-14
**主题**: UI导航栏重构

### 描述
根据用户请求，对左侧功能导航栏进行了调整。

### 主要改动
1.  **删除“数据管理”**:
    *   从 `UI/src/App.vue` 的导航菜单中移除了“数据管理”项。
    *   从 `UI/src/router/index.js` 中删除了对应的 `/data` 路由。
    *   删除了视图文件 `UI/src/views/DataView.vue`。

2.  **提升“店铺管理”**:
    *   将“店铺管理”菜单项在 `UI/src/App.vue` 中的位置提升，以填补原“数据管理”的位置，使其在导航中更加突出。

### 涉及文件
*   `UI/src/App.vue`
*   `UI/src/router/index.js`
*   `UI/src/views/DataView.vue` (已删除)

**按药品模型预测**
---
**日期**: 2025-07-14
**主题**: 修复导航菜单高亮问题

### 描述
修复了首次进入或刷新页面时，左侧导航菜单项与当前路由不匹配导致不高亮的问题。

### 主要改动
*   **文件**: `UI/src/App.vue`
*   **修改**:
    1.  引入 `useRoute` 和 `computed`。
    2.  创建了一个计算属性 `activeMenu`，其值动态地等于当前路由的路径 (`route.path`)。
    3.  将 `el-menu` 组件的 `:default-active` 属性绑定到 `activeMenu`。

### 结果
确保了导航菜单的高亮状态始终与当前页面的URL保持同步。

---
**日期**: 2025-07-15
**主题**: 修复硬编码文件路径问题，提高项目可移植性

### 问题描述
项目在从一台计算机迁移到另一台时，由于数据文件路径被硬编码在代码中，导致程序无法找到数据文件而运行失败。

### 根本原因
多个Python文件（`predictor.py`, `multi_store_data_utils.py`）中直接写入了相对路径 `'data/timeseries_training_data_sample_10s50p.parquet'` 作为默认值。这种方式在不同运行环境下（如从根目录运行 vs 从子目录运行）会产生路径解析错误。

### 解决方案：集中配置，统一管理
1.  **修改 `server/core/config.py` (核心)**:
    *   动态计算并定义了一个全局变量 `PROJECT_ROOT`，它始终指向项目的根目录。
    *   基于 `PROJECT_ROOT`，使用 `os.path.join` 创建了一个跨平台的、绝对的默认数据路径 `DEFAULT_DATA_PATH` 和模型保存路径 `DEFAULT_MODEL_DIR`。
    *   这确保了无论从哪个位置执行代码，路径总能被正确解析。

2.  **修改 `server/utils/multi_store_data_utils.py`**:
    *   从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   将所有数据加载函数的 `file_path` 参数的默认值从硬编码的字符串改为 `None`。
    *   在函数内部，如果 `file_path` 为 `None`，则自动使用导入的 `DEFAULT_DATA_PATH`。
    *   移除了原有的、复杂的、为了猜测正确路径而编写的冗余代码。

3.  **修改 `server/core/predictor.py`**:
    *   同样从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   在初始化 `PharmacyPredictor` 时，如果未提供数据路径，则使用导入的 `DEFAULT_DATA_PATH` 作为默认值。

### 最终结果
通过将数据源路径集中到唯一的配置文件中进行管理，彻底解决了因硬编码路径导致的可移植性问题。项目现在可以在任何环境下可靠地运行。

---
### 未来如何修改数据源（例如，连接到服务器数据库）

本次重构为将来更换数据源打下了坚实的基础。操作非常简单：

1.  **定位配置文件**: 打开 `server/core/config.py` 文件。

2.  **修改数据源定义**:
    *   **当前 (文件)**:
        ```python
        DEFAULT_DATA_PATH = os.path.join(PROJECT_ROOT, 'data', 'timeseries_training_data_sample_10s50p.parquet')
        ```
    *   **未来 (数据库示例)**:
        您可以将这行替换为数据库连接字符串，或者添加新的数据库配置变量。例如：
        ```python
        # 注释掉或删除旧的文件路径配置
        # DEFAULT_DATA_PATH = ...

        # 新增数据库连接配置
        DATABASE_URL = "postgresql://user:password@your_server_ip:5432/your_database_name"
        ```

3.  **修改数据加载逻辑**:
    *   **定位数据加载函数**: 打开 `server/utils/multi_store_data_utils.py`。
    *   **修改 `load_multi_store_data` 函数**:
        *   引入数据库连接库（如 `sqlalchemy` 或 `psycopg2`）。
        *   修改函数逻辑，使其使用 `config.py` 中的 `DATABASE_URL` 来连接数据库，并执行SQL查询来获取数据，而不是读取文件。
        *   **示例**:
            ```python
            from sqlalchemy import create_engine
            from core.config import DATABASE_URL # 导入新的数据库配置

            def load_multi_store_data(...):
                # ...
                engine = create_engine(DATABASE_URL)
                query = "SELECT * FROM sales_data" # 根据需要构建查询
                df = pd.read_sql(query, engine)
                # ... 后续处理逻辑保持不变 ...
            ```

											
										
										
											2025-07-15 10:37:25 +08:00
+								                              file_path: str = None) -> pd.DataFrame:
-												完成模型训练调试，修改模型预测的导航栏

											
										
										
											2025-07-14 19:26:57 +08:00
+								    if store_id:
 								        df = load_multi_store_data(file_path, store_id=store_id)
 								    elif product_id:
 								        df = load_multi_store_data(file_path, product_id=product_id)
 								    else:
 								        df = load_multi_store_data(file_path)
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								    if df.empty:
 								        raise ValueError("过滤后数据为空，无法聚合")
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    agg_dict = {}
 								    if aggregation_method == 'sum':
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        agg_dict = {'sales_quantity': 'sum'}
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								    elif aggregation_method == 'mean':
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								        agg_dict = {'sales_quantity': 'mean'}
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								    valid_agg_dict = {k: v for k, v in agg_dict.items() if k in df.columns}
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								    aggregated_df = df.groupby('date').agg(valid_agg_dict).reset_index()
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												更换数据源，调试完模型训练，模型预测不完善

											
										
										
											2025-07-26 16:59:30 +08:00
+								    return aggregated_df
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
-												**日期**: 2025-07-14
**主题**: UI导航栏重构

### 描述
根据用户请求，对左侧功能导航栏进行了调整。

### 主要改动
1.  **删除“数据管理”**:
    *   从 `UI/src/App.vue` 的导航菜单中移除了“数据管理”项。
    *   从 `UI/src/router/index.js` 中删除了对应的 `/data` 路由。
    *   删除了视图文件 `UI/src/views/DataView.vue`。

2.  **提升“店铺管理”**:
    *   将“店铺管理”菜单项在 `UI/src/App.vue` 中的位置提升，以填补原“数据管理”的位置，使其在导航中更加突出。

### 涉及文件
*   `UI/src/App.vue`
*   `UI/src/router/index.js`
*   `UI/src/views/DataView.vue` (已删除)

**按药品模型预测**
---
**日期**: 2025-07-14
**主题**: 修复导航菜单高亮问题

### 描述
修复了首次进入或刷新页面时，左侧导航菜单项与当前路由不匹配导致不高亮的问题。

### 主要改动
*   **文件**: `UI/src/App.vue`
*   **修改**:
    1.  引入 `useRoute` 和 `computed`。
    2.  创建了一个计算属性 `activeMenu`，其值动态地等于当前路由的路径 (`route.path`)。
    3.  将 `el-menu` 组件的 `:default-active` 属性绑定到 `activeMenu`。

### 结果
确保了导航菜单的高亮状态始终与当前页面的URL保持同步。

---
**日期**: 2025-07-15
**主题**: 修复硬编码文件路径问题，提高项目可移植性

### 问题描述
项目在从一台计算机迁移到另一台时，由于数据文件路径被硬编码在代码中，导致程序无法找到数据文件而运行失败。

### 根本原因
多个Python文件（`predictor.py`, `multi_store_data_utils.py`）中直接写入了相对路径 `'data/timeseries_training_data_sample_10s50p.parquet'` 作为默认值。这种方式在不同运行环境下（如从根目录运行 vs 从子目录运行）会产生路径解析错误。

### 解决方案：集中配置，统一管理
1.  **修改 `server/core/config.py` (核心)**:
    *   动态计算并定义了一个全局变量 `PROJECT_ROOT`，它始终指向项目的根目录。
    *   基于 `PROJECT_ROOT`，使用 `os.path.join` 创建了一个跨平台的、绝对的默认数据路径 `DEFAULT_DATA_PATH` 和模型保存路径 `DEFAULT_MODEL_DIR`。
    *   这确保了无论从哪个位置执行代码，路径总能被正确解析。

2.  **修改 `server/utils/multi_store_data_utils.py`**:
    *   从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   将所有数据加载函数的 `file_path` 参数的默认值从硬编码的字符串改为 `None`。
    *   在函数内部，如果 `file_path` 为 `None`，则自动使用导入的 `DEFAULT_DATA_PATH`。
    *   移除了原有的、复杂的、为了猜测正确路径而编写的冗余代码。

3.  **修改 `server/core/predictor.py`**:
    *   同样从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   在初始化 `PharmacyPredictor` 时，如果未提供数据路径，则使用导入的 `DEFAULT_DATA_PATH` 作为默认值。

### 最终结果
通过将数据源路径集中到唯一的配置文件中进行管理，彻底解决了因硬编码路径导致的可移植性问题。项目现在可以在任何环境下可靠地运行。

---
### 未来如何修改数据源（例如，连接到服务器数据库）

本次重构为将来更换数据源打下了坚实的基础。操作非常简单：

1.  **定位配置文件**: 打开 `server/core/config.py` 文件。

2.  **修改数据源定义**:
    *   **当前 (文件)**:
        ```python
        DEFAULT_DATA_PATH = os.path.join(PROJECT_ROOT, 'data', 'timeseries_training_data_sample_10s50p.parquet')
        ```
    *   **未来 (数据库示例)**:
        您可以将这行替换为数据库连接字符串，或者添加新的数据库配置变量。例如：
        ```python
        # 注释掉或删除旧的文件路径配置
        # DEFAULT_DATA_PATH = ...

        # 新增数据库连接配置
        DATABASE_URL = "postgresql://user:password@your_server_ip:5432/your_database_name"
        ```

3.  **修改数据加载逻辑**:
    *   **定位数据加载函数**: 打开 `server/utils/multi_store_data_utils.py`。
    *   **修改 `load_multi_store_data` 函数**:
        *   引入数据库连接库（如 `sqlalchemy` 或 `psycopg2`）。
        *   修改函数逻辑，使其使用 `config.py` 中的 `DATABASE_URL` 来连接数据库，并执行SQL查询来获取数据，而不是读取文件。
        *   **示例**:
            ```python
            from sqlalchemy import create_engine
            from core.config import DATABASE_URL # 导入新的数据库配置

            def load_multi_store_data(...):
                # ...
                engine = create_engine(DATABASE_URL)
                query = "SELECT * FROM sales_data" # 根据需要构建查询
                df = pd.read_sql(query, engine)
                # ... 后续处理逻辑保持不变 ...
            ```

											
										
										
											2025-07-15 10:37:25 +08:00
+								def get_sales_statistics(file_path: str = None,
-												临时版本

											
										
										
											2025-07-02 11:05:23 +08:00
+								                        store_id: Optional[str] = None,
 								                        product_id: Optional[str] = None) -> Dict[str, Any]:
 								    try:
 								        df = load_multi_store_data(file_path, store_id=store_id, product_id=product_id)
 								        if len(df) == 0:
 								            return {'error': '没有数据'}
 								        stats = {
 								            'total_records': len(df),
 								            'date_range': {
 								                'start': df['date'].min().strftime('%Y-%m-%d'),
 								                'end': df['date'].max().strftime('%Y-%m-%d')
 								            },
 								            'stores': df['store_id'].nunique(),
 								            'products': df['product_id'].nunique(),
 								        }
 								        return stats
 								    except Exception as e:
 								        return {'error': str(e)}
-												**日期**: 2025-07-14
**主题**: UI导航栏重构

### 描述
根据用户请求，对左侧功能导航栏进行了调整。

### 主要改动
1.  **删除“数据管理”**:
    *   从 `UI/src/App.vue` 的导航菜单中移除了“数据管理”项。
    *   从 `UI/src/router/index.js` 中删除了对应的 `/data` 路由。
    *   删除了视图文件 `UI/src/views/DataView.vue`。

2.  **提升“店铺管理”**:
    *   将“店铺管理”菜单项在 `UI/src/App.vue` 中的位置提升，以填补原“数据管理”的位置，使其在导航中更加突出。

### 涉及文件
*   `UI/src/App.vue`
*   `UI/src/router/index.js`
*   `UI/src/views/DataView.vue` (已删除)

**按药品模型预测**
---
**日期**: 2025-07-14
**主题**: 修复导航菜单高亮问题

### 描述
修复了首次进入或刷新页面时，左侧导航菜单项与当前路由不匹配导致不高亮的问题。

### 主要改动
*   **文件**: `UI/src/App.vue`
*   **修改**:
    1.  引入 `useRoute` 和 `computed`。
    2.  创建了一个计算属性 `activeMenu`，其值动态地等于当前路由的路径 (`route.path`)。
    3.  将 `el-menu` 组件的 `:default-active` 属性绑定到 `activeMenu`。

### 结果
确保了导航菜单的高亮状态始终与当前页面的URL保持同步。

---
**日期**: 2025-07-15
**主题**: 修复硬编码文件路径问题，提高项目可移植性

### 问题描述
项目在从一台计算机迁移到另一台时，由于数据文件路径被硬编码在代码中，导致程序无法找到数据文件而运行失败。

### 根本原因
多个Python文件（`predictor.py`, `multi_store_data_utils.py`）中直接写入了相对路径 `'data/timeseries_training_data_sample_10s50p.parquet'` 作为默认值。这种方式在不同运行环境下（如从根目录运行 vs 从子目录运行）会产生路径解析错误。

### 解决方案：集中配置，统一管理
1.  **修改 `server/core/config.py` (核心)**:
    *   动态计算并定义了一个全局变量 `PROJECT_ROOT`，它始终指向项目的根目录。
    *   基于 `PROJECT_ROOT`，使用 `os.path.join` 创建了一个跨平台的、绝对的默认数据路径 `DEFAULT_DATA_PATH` 和模型保存路径 `DEFAULT_MODEL_DIR`。
    *   这确保了无论从哪个位置执行代码，路径总能被正确解析。

2.  **修改 `server/utils/multi_store_data_utils.py`**:
    *   从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   将所有数据加载函数的 `file_path` 参数的默认值从硬编码的字符串改为 `None`。
    *   在函数内部，如果 `file_path` 为 `None`，则自动使用导入的 `DEFAULT_DATA_PATH`。
    *   移除了原有的、复杂的、为了猜测正确路径而编写的冗余代码。

3.  **修改 `server/core/predictor.py`**:
    *   同样从 `server/core/config` 导入 `DEFAULT_DATA_PATH`。
    *   在初始化 `PharmacyPredictor` 时，如果未提供数据路径，则使用导入的 `DEFAULT_DATA_PATH` 作为默认值。

### 最终结果
通过将数据源路径集中到唯一的配置文件中进行管理，彻底解决了因硬编码路径导致的可移植性问题。项目现在可以在任何环境下可靠地运行。

---
### 未来如何修改数据源（例如，连接到服务器数据库）

本次重构为将来更换数据源打下了坚实的基础。操作非常简单：

1.  **定位配置文件**: 打开 `server/core/config.py` 文件。

2.  **修改数据源定义**:
    *   **当前 (文件)**:
        ```python
        DEFAULT_DATA_PATH = os.path.join(PROJECT_ROOT, 'data', 'timeseries_training_data_sample_10s50p.parquet')
        ```
    *   **未来 (数据库示例)**:
        您可以将这行替换为数据库连接字符串，或者添加新的数据库配置变量。例如：
        ```python
        # 注释掉或删除旧的文件路径配置
        # DEFAULT_DATA_PATH = ...

        # 新增数据库连接配置
        DATABASE_URL = "postgresql://user:password@your_server_ip:5432/your_database_name"
        ```

3.  **修改数据加载逻辑**:
    *   **定位数据加载函数**: 打开 `server/utils/multi_store_data_utils.py`。
    *   **修改 `load_multi_store_data` 函数**:
        *   引入数据库连接库（如 `sqlalchemy` 或 `psycopg2`）。
        *   修改函数逻辑，使其使用 `config.py` 中的 `DATABASE_URL` 来连接数据库，并执行SQL查询来获取数据，而不是读取文件。
        *   **示例**:
            ```python
            from sqlalchemy import create_engine
            from core.config import DATABASE_URL # 导入新的数据库配置

            def load_multi_store_data(...):
                # ...
                engine = create_engine(DATABASE_URL)
                query = "SELECT * FROM sales_data" # 根据需要构建查询
                df = pd.read_sql(query, engine)
                # ... 后续处理逻辑保持不变 ...
            ```

											
										
										
											2025-07-15 10:37:25 +08:00
+								def load_data(file_path=None, store_id=None):
-												将药品预测的修改，同步到店铺和全局预测界面

											
										
										
											2025-07-23 15:18:46 +08:00
+								    return load_multi_store_data(file_path, store_id=store_id)