功能说明
本代码实现了一个结合宏观经济指标的LSTM深度学习量化交易策略,通过PyTorch框架构建时序预测模型,利用GDP增长率、CPI、失业率等关键经济指标预测市场趋势,生成自动化交易信号。系统包含数据预处理模块(缺失值处理、归一化)、特征工程组件(滞后特征构造)、LSTM网络定义、训练循环及回测引擎,最终输出策略收益曲线与风险评估指标。该方案适用于中低频量化交易场景,需注意过拟合风险与经济周期突变带来的模型失效问题。
核心概念解析
宏观经济指标体系构建
选取具有领先/同步/滞后特性的经济指标组合:
- 先行指标:采购经理人指数(PMI)、消费者信心指数(CCI)
- 同步指标:工业增加值、零售销售总额
- 滞后指标:失业率、银行信贷余额
采用动态权重分配机制,根据经济周期阶段自动调整指标贡献度。例如在衰退期增加先行指标权重,复苏期侧重同步指标。
LSTM网络架构设计
importtorchimporttorch.nnasnnclassEconomicLSTM(nn.Module):def__init__(self,input_dim,hidden_dim,num_layers,output_dim):super(EconomicLSTM,self).__init__()self.hidden_dim=hidden_dim self.num_layers=num_layers# 双向LSTM层self.lstm=nn.LSTM(input_dim,hidden_dim,num_layers=num_layers,batch_first=True,bidirectional=True)# 注意力机制self.attention=nn.Sequential(nn.Linear(hidden_dim*2,hidden_dim),nn.Tanh(),nn.Linear(hidden_dim,1))# 输出层self.fc=nn.Linear(hidden_dim*2,output_dim)defforward(self,x):h0=torch.zeros(self.num_layers*2,x.size(0),self.hidden_dim)c0=torch.zeros(self.num_layers*2,x.size(0),self.hidden_dim)out,(hn,cn)=self.lstm(x,(h0,c0))# 注意力加权attention_weights=torch.softmax(self.attention(out),dim=1)context=torch.sum(attention_weights*out,dim=1)out=self.fc(context)returnout数据处理流程
数据源整合
从Quandl获取FRED经济数据库指标,使用pandas_datareader补充另类数据:
importpandasaspdfrompandas_datareaderimportdataaspdrdeffetch_economic_data(tickers,start_date,end_date):fred_data=pdr.get_data_fred(tickers,start=start_date,end=end_date)fred_data.columns=[ticker.upper()fortickerintickers]returnfred_data.asfreq('M').ffill()特征工程实现
defcreate_features(df,lookback=6,forecast_horizon=3):# 滞后特征构造forcolindf.columns:forlaginrange(1,lookback+1):df[f'{col}_lag{lag}']=df[col].shift(lag)# 滚动统计量df['rolling_mean_5']=df['GDP'].rolling(5).mean()df['volatility_12']=df['SP500'].rolling(12).std()# 目标变量构造df['target']=df['SP500'].shift(-forecast_horizon)# 删除缺失值df.dropna(inplace=True)returndf模型训练与验证
损失函数优化
采用Huber损失函数增强对异常值的鲁棒性:
criterion=nn.HuberLoss(delta=1.0)optimizer=torch.optim.AdamW(model.parameters(),lr=0.001,weight_decay=1e-5)时间序列交叉验证
实现Walk-Forward验证策略,保持时序相关性:
fromsklearn.model_selectionimportTimeSeriesSplit tscv=TimeSeriesSplit(n_splits=5)fortrain_idx,val_idxintscv.split(X):train_X,val_X=X[train_idx],X[val_idx]train_y,val_y=y[train_idx],y[val_idx]# 执行训练循环...交易策略逻辑
信号生成规则
defgenerate_signal(prediction,threshold=0.1):ifprediction>threshold:return'BUY'elifprediction<-threshold:return'SELL'else:return'HOLD'仓位管理算法
实现动态头寸调整机制,考虑波动率因子:
defcalculate_position(signal,volatility,max_exposure=0.9):base_pos=signal*(max_exposure/volatility)returnnp.clip(base_pos,-max_exposure,max_exposure)风险控制体系
止损机制设计
设置两级止损阈值:
- 硬止损:账户净值下跌15%触发清仓
- 浮动止损:持仓期间最大回撤达8%平仓
压力测试模拟
defstress_test(portfolio,scenarios):results={}forscenarioinscenarios:simulated_returns=simulate_market_shock(scenario)portfolio_value=backtest_engine(simulated_returns)results[scenario]=portfolio_value.min()returnresults