mindspore-lab · CCCrystaLLL · Mar 25, 2025 · Apr 6, 2025
diff --git a/research/arxiv_papers/Optimizing_of_MACD/README.md b/research/arxiv_papers/Optimizing_of_MACD/README.md
@@ -0,0 +1,351 @@
+# 项目名称：基于MACD指标的交易策略分析与回测
+
+## 数据集下载
+```
+git lfs install
+git clone https://oauth2:[email protected]/datasets/ccccccwy/stock_data.git
+```
+其中data文件夹为数据文件
+## 运行结果
+result文件夹为运行结果文件，其中：
+trading_strategies.xlsx 为小波分析和背离分析的运行结果
+x1.xlsx 为原始策略交易量化指标
+x2.xlsx 为小波分析后交易量化指标
+x3.xlsx 为背离分析后交易量化指标
+
+## 代码功能解释
+raw_draw.py 为MACD买入卖出图
+little_wave.py 为小波分析结果
+divergence.py 为背离分析结果
+end_1.py 为小波分析和背离分析
+end2_mindspore.py 为遗传算法测定买入点
+end_2_draw.py 为遗传算法测定买入点最终结果的画图程序
+
+
+## 项目简介
+本项目旨在通过分析MACD指标（移动平均收敛散度）来构建一个简单的交易策略，并使用历史数据进行回测。项目结合了技术分析中的MACD指标、小波变换（Wavelet Transform）以及MindSpore框架，对股票价格数据进行分析，生成买卖信号，并计算策略的表现指标。
+
+## 主要功能
+1. **数据加载与预处理**：从Excel文件中加载股票价格数据，并进行简单的预处理。
+2. **小波变换**：对DIF信号进行小波变换，提取近似信号以平滑数据。
+3. **MACD指标计算**：计算短期和长期的指数移动平均线（EMA），并生成MACD指标（DIF、DEA、MACD柱状图）。
+4. **买卖信号生成**：基于MACD指标生成买卖信号，并结合局部极值点检测技术识别牛市和熊市背离信号。
+5. **遗传算法计算个股最优参数**：在MindSpore计算框架的基础上加快遗传算法的计算速度得出个股最优的MACD相关参数，提高指标个股适应性。
+6. **策略回测**：根据生成的买卖信号进行回测，计算策略的收益率、胜率、夏普比率等关键指标。
+7. **可视化**：绘制股票价格、MACD指标、买卖信号以及背离信号的图表。
+
+## 依赖库
+- `numpy`
+- `pandas`
+- `matplotlib`
+- `pywt`
+- `mindspore`
+
+**安装依赖库**：
+确保已安装所需的Python库。可以通过以下命令安装：
+```bash
+pip install -r requirements.txt
+```
+
+## 文件结构
+- `data/510300.SH.xlsx`：包含股票价格数据的Excel文件。
+- `end2_mindspore.py`：主程序文件，包含数据加载、指标计算、信号生成、回测和可视化代码。
+
+## 使用方法
+1. **准备数据**：
+   将股票价格数据保存为Excel文件，并放置在`data/`目录下。文件应包含至少以下列：
+   - `日期`：日期列。
+   - `收盘价(元)`：股票收盘价。
+
+2. **运行代码**：
+   运行`end2_mindspore.py`文件，程序将自动加载数据、计算指标、生成买卖信号并进行回测。最终结果将显示在图表中，并打印出策略的表现指标。
+
+   ```bash
+   python end2_mindspore.py
+   ```
+
+3. **查看结果**：
+   - 图表将展示股票价格、MACD指标、买卖信号以及背离信号。
+   - 控制台将输出策略的表现指标，包括胜率、总收益、年化收益、夏普比率等。
+
+## 关键代码说明
+- **MACD指标计算**：
+  ```python
+  ema_short = data['收盘价(元)'].ewm(span=9, adjust=False).mean()
+  ema_long = data['收盘价(元)'].ewm(span=22, adjust=False).mean()
+  dif = ema_short - ema_long
+  dea = dif.ewm(span=25, adjust=False).mean()
+  macd_histogram = dif - dea
+  ```
+
+- **小波变换**：
+  ```python
+  coeffs = pywt.wavedec(dif.asnumpy(), 'coif5', level=4)
+  approximation = coeffs[0]
+  reconstructed_signal = pywt.waverec([approximation] + [np.zeros_like(coeff) for coeff in coeffs[1:]], 'coif5')
+  ```
+
+- **买卖信号生成**：
+  ```python
+  buy_signals = (data['DIF'] > data['MACD']) & (data['DIF'].shift(1) <= data['MACD'].shift(1))
+  sell_signals = (data['DIF'] < data['MACD']) & (data['DIF'].shift(1) >= data['MACD'].shift(1))
+  ```
+
+- **遗传算法实现**：
+在`end2_mindspore.py`中，我们使用MindSpore框架实现了遗传算法，用于优化MACD指标的参数，以找到最佳的买入点。以下是遗传算法的关键步骤：
+
+1. **种群初始化**：
+   - 根据参数范围初始化种群，生成随机的个体。
+
+2. **适应度计算**：
+   - 计算每个个体的适应度值，即其对应参数下的交易策略的总收益。
+
+3. **选择操作**：
+   - 采用精英保留策略和基于适应度的概率选择，保留优秀个体并选择下一代个体。
+
+4. **交叉操作**：
+   - 随机选择交叉点，交换两个个体的部分基因。
+
+5. **变异操作**：
+   - 以一定的概率随机改变个体的某个基因，增加种群的多样性。
+
+6. **进化过程**：
+   - 每一代进行适应度评估、选择、交叉和变异操作，逐步进化种群，寻找最优解。
+
+- **策略回测**：
+  ```python
+  for i in range(len(data) - 1):
+      if (buy_signals.iloc[i] or data['bear_divergence'][i]) and capital > 0:
+          # 买入逻辑
+      elif (sell_signals.iloc[i] or data['bull_divergence'][i]) and stocks_held > 0:
+          # 卖出逻辑
+  ```
+
+## 输出结果
+- **图表**：
+  - 股票价格与买卖信号图。
+  - MACD指标图，包含DIF、DEA以及MACD柱状图。
+- **策略表现指标**：
+  - 胜率（Win Rate）
+  - 盈亏比（Odds Ratio）
+  - 交易频率（Trade Frequency）
+  - 总收益（Total Return）
+  - 年化收益（Annual Return）
+  - 夏普比率（Sharpe Ratio）
+  - 最大回撤（Max Drawdown）
+
+## 注意事项
+- 本项目使用的数据为历史数据，回测结果仅供参考，实际交易中可能存在滑点、手续费等因素，需谨慎使用。
+- 代码中的参数（如EMA的周期、小波变换的类型等）可以根据实际需求进行调整。
+
+## 未来改进
+- 增加更多的技术指标（如RSI、布林带等）来优化策略。
+- 引入机器学习模型来预测买卖信号。
+- 考虑交易成本、滑点等实际交易中的因素。
+
+## 许可证
+本项目采用MIT许可证。详情请参阅LICENSE文件。
+
+## **MindSpore 的核心功能**
+在本项目中，MindSpore 主要用于以下两个部分：
+
+### 2.1 **数据转换为 MindSpore Tensor**
+MindSpore 的核心数据结构是 `Tensor`，它类似于 NumPy 的 `ndarray`，但支持更高效的数值计算和自动微分。项目中通过 `ms.Tensor` 将 Pandas DataFrame 中的数据转换为 MindSpore Tensor。
+
+```python
+import mindspore as ms
+
+# 示例：将 Pandas Series 转换为 MindSpore Tensor
+data_tensor = ms.Tensor(data.values)
+```
+
+- **输入**：Pandas Series 或 DataFrame 中的数据。
+- **输出**：MindSpore Tensor 格式的数据。
+- **作用**：将 MACD 指标（DIF、DEA、MACD 柱状图）以及股票价格数据转换为 MindSpore Tensor，以便后续计算。
+
+### 2.2 **使用 MindSpore 进行数值计算**
+在项目中，MindSpore 的 `mnp` 模块（MindSpore NumPy）被用于一些数值计算任务。例如，计算 MACD 指标中的红色和蓝色部分：
+
+```python
+import mindspore.numpy as mnp
+
+red_bar = mnp.where(macd_histogram > 0, macd_histogram, 0)
+blue_bar = mnp.where(macd_histogram < 0, macd_histogram, 0)
+```
+
+- **`mnp.where`**：类似于 NumPy 的 `np.where`，用于条件筛选。
+- **作用**：将 MACD 柱状图分为红色（正值）和蓝色（负值）两部分，便于后续可视化。
+
+### 2.3 **遗传算法中的 MindSpore 应用**
+在遗传算法的实现中，MindSpore 提供了强大的支持，主要体现在以下几个方面：
+
+#### 2.3.1 **种群初始化**
+```python
+low_bounds_np = low_bounds.asnumpy()
+high_bounds_np = high_bounds.asnumpy()
+temp_pop = []
+for i in range(num_variables):
+    col = ms_np.randint(int(low_bounds_np[i]), int(high_bounds_np[i]), (num_individuals,))
+    temp_pop.append(col)
+population = ops.stack(temp_pop, axis=1)
+```
+
+- **输入**：参数范围（`bounds`）。
+- **输出**：初始化的种群（`population`）。
+- **作用**：根据参数范围随机生成初始种群，为后续的遗传操作提供基础。
+
+#### 2.3.2 **适应度计算**
+```python
+def evaluate_population(pop):
+    pop_np = pop.asnumpy()
+    fitness_vals = [fitness_func(subset_data1, ind) for ind in pop_np]
+    return Tensor(fitness_vals, dtype=ms.float32)
+```
+
+- **输入**：种群（`pop`）。
+- **输出**：每个个体的适应度值（`fitness_vals`）。
+- **作用**：计算每个个体的适应度值，即其对应参数下的交易策略的总收益。
+
+#### 2.3.3 **选择操作**
+```python
+def select(population, fitness):
+    elite_indices = ops.argsort(fitness)[-elite_size:]
+    elite = ops.gather(population, elite_indices, 0)
+    max_fitness = ops.reduce_max(fitness)
+    exp_values = ops.exp(fitness - max_fitness)
+    prob = exp_values / ops.reduce_sum(exp_values)
+    chosen_indices_np = np.random.choice(np.arange(num_individuals), size=num_individuals - elite_size, replace=True, p=prob.asnumpy())
+    chosen_indices = Tensor(chosen_indices_np, dtype=ms.int32)
+    chosen = ops.gather(population, chosen_indices, 0)
+    return ops.concat((chosen, elite), 0)
+```
+
+- **输入**：种群（`population`）和适应度值（`fitness`）。
+- **输出**：选择后的种群（`selected`）。
+- **作用**：采用精英保留策略和基于适应度的概率选择，保留优秀个体并选择下一代个体。
+
+#### 2.3.4 **交叉操作**
+```python
+if ms_np.rand() < crossover_rate:
+    point = np.random.randint(1, num_variables)
+    seg1 = new_population[i, point:].copy()
+    new_population[i, point:] = new_population[i + 1, point:]
+    new_population[i + 1, point:] = seg1
+```
+
+- **输入**：当前种群（`new_population`）。
+- **输出**：交叉后的种群。
+- **作用**：随机选择交叉点，交换两个个体的部分基因，增加种群的多样性。
+
+#### 2.3.5 **变异操作**
+```python
+def mutate(individual, mutation_rate, bounds):
+    for i in range(len(bounds)):
+        if ms_np.rand() < mutation_rate:
+            individual[i] = ms_np.randint(bounds[i][0], bounds[i][1] + 1)
+    return individual
+```
+
+- **输入**：个体（`individual`）、变异率（`mutation_rate`）和参数范围（`bounds`）。
+- **输出**：变异后的个体。
+- **作用**：以一定的概率随机改变个体的某个基因，增加种群的多样性。
+
+#### 2.3.6 **进化过程**
+```python
+for generation in range(num_generations):
+    fitness = evaluate_population(population)
+    best_index_tensor = ops.argmax(fitness)
+    best_index = int(best_index_tensor.asnumpy())
+    max_fitness_tensor = ops.reduce_max(fitness)
+    max_fitness_val = float(max_fitness_tensor.asnumpy())
+    best_fitness_history.append(max_fitness_val)
+
+    if max_stagnant_generations:
+        if len(best_fitness_history) > 1 and (best_fitness_history[-1] - best_fitness_history[-2] < 1e-5):
+            stagnant_counter += 1
+        else:
+            stagnant_counter = 0
+        if stagnant_counter >= max_stagnant_generations:
+            print(f"Progress stagnant for {max_stagnant_generations} generations at generation {generation}")
+            break
+
+    selected = select(population, fitness)
+    new_population = selected.copy()
+
+    for i in range(0, num_individuals - elite_size, 2):
+        if ms_np.rand() < crossover_rate:
+            point = np.random.randint(1, num_variables)
+            seg1 = new_population[i, point:].copy()
+            new_population[i, point:] = new_population[i + 1, point:]
+            new_population[i + 1, point:] = seg1
+        new_population[i] = mutate(new_population[i], mutation_rate, bounds)
+        new_population[i + 1] = mutate(new_population[i + 1], mutation_rate, bounds)
+
+    population = new_population
+    print(f"Generation {generation}: Max Fitness = {max_fitness_tensor}")
+```
+
+- **输入**：初始种群（`population`）。
+- **输出**：进化后的最优个体（`best_solution`）和最大适应度值（`max_fitness`）。
+- **作用**：每一代进行适应度评估、选择、交叉和变异操作，逐步进化种群，寻找最优解。
+
+---
+
+## **MindSpore 的优势**
+在本项目中使用 MindSpore 的主要优势包括：
+
+1. **高效计算**：
+   - MindSpore Tensor 支持高效的数值计算，尤其是在大规模数据集上表现优异。
+   - 与 NumPy 相比，MindSpore 的计算速度更快，尤其是在 GPU 或 Ascend 硬件上。
+
+2. **自动微分**：
+   - 虽然本项目未涉及深度学习模型，但 MindSpore 的自动微分功能为未来扩展（如引入神经网络模型）提供了便利。
+
+3. **跨平台支持**：
+   - MindSpore 支持 CPU、GPU 和 Ascend 等多种硬件平台，便于在不同环境中运行代码。
+
+---
+
+## **MindSpore 的扩展性**
+如果需要进一步扩展本项目，可以利用 MindSpore 的以下功能：
+
+1. **引入神经网络模型**：
+   - 使用 MindSpore 构建深度学习模型，预测股票价格或生成买卖信号。
+   - 示例代码：
+     ```python
+     import mindspore.nn as nn
+
+     class StockPredictionModel(nn.Cell):
+         def __init__(self):
+             super(StockPredictionModel, self).__init__()
+             self.fc1 = nn.Dense(10, 64)
+             self.fc2 = nn.Dense(64, 1)
+
+         def construct(self, x):
+             x = self.fc1(x)
+             x = self.fc2(x)
+             return x
+     ```
+
+2. **优化计算性能**：
+   - 使用 MindSpore 的图模式（Graph Mode）加速计算。
+   - 示例代码：
+     ```python
+     ms.set_context(mode=ms.GRAPH_MODE, device_target="GPU")
+     ```
+
+3. **分布式训练**：
+   - 如果需要处理更大规模的数据，可以使用 MindSpore 的分布式训练功能。
+
+---
+
+## **注意事项**
+- **硬件支持**：确保运行环境支持 MindSpore（如安装正确版本的 CUDA 或 Ascend 驱动）。
+- **数据格式**：MindSpore Tensor 与 NumPy 数组可以互相转换，但需要注意数据类型的兼容性。
+- **性能调优**：对于大规模数据，建议使用 MindSpore 的图模式或 GPU 加速。
+
+---
+
+## **参考文档**
+- [MindSpore 官方文档](https://www.mindspore.cn/docs)
+- [MindSpore GitHub 仓库](https://github.com/mindspore-ai/mindspore)