首页 - 技术栈

代做网站微信号做301到别人网站

作者: 五速梦信息网
时间: 2026年03月21日 11:27

当前位置：首页 > news >正文

代做网站微信号,做301到别人网站,福州商城网站,dedecms做电影网站深度学习模型类简介按滑动时间窗口切割数据集模型类CNNGRULSTMMLPRNNTCNTransformer 简介本文所定义模型类的输入数据的形状shape统一为 [batch_size, time_step#xff0c;n_features]#xff0c;batch_size为批次大小#xff0c;time_step为时间步长#xff0c;n_feat… 深度学习模型类简介按滑动时间窗口切割数据集模型类CNNGRULSTMMLPRNNTCNTransformer 简介本文所定义模型类的输入数据的形状shape统一为 [batch_size, time_stepn_features]batch_size为批次大小time_step为时间步长n_features为特征数量。另外该模型类同时适用于单特征与多特征本项目代码统一了训练方式只需在models文件夹中加入下面模型类即可使用该模型而不需要重新写训练模型等的代码减少了代码的冗余。代码有注释不加解释声明转载请标明出处超参数只需通过字典定义传入即可所有训练方式一样的模型通用
按滑动时间窗口切割数据集 import osimport pandas as pd import torch from sklearn.preprocessing import MinMaxScaler from torch.utils.data import Dataset, DataLoaderclass TimeSeriesDataset(Dataset):自定义的时间序列数据集类用于处理时间序列数据的加载和预处理。目的是将时间序列数据准备成适合机器学习模型训练的格式(按滑动窗口划分)。Args:data (torch.Tensor): 包含时间序列数据的张量形状为 [1, n_features, data_len]args.time_step (int): 输入数据的时间步。args.skip (int): 输入数据的跳跃步。Returns:tuple: 包含输入数据 x 和目标数据 y 的元组。X: 输入数据的批次形状为 [time_step, n_features]Y: 目标数据的批次形状为 [1]def init(self, data, args):self.data dataself.time_step args.time_stepself.skip args.skipdef len(self):n self.data.shape[-1] - self.time_step 1 - self.skipreturn ndef getitem(self, idx):x self.data[:, :, idx:idx self.time_step].permute(2, 1, 0).squeeze(-1)y self.data[:, :1, idx self.time_step self.skip - 1].view(-1)return x, ydef Dataset_Custom(args, if_BatchingTrue):创建自定义时间序列数据集Args:args (Namespace): 包含所有必要参数的命名空间。if_Batching: 是否批次化类似XGBoost算法不需要Returns:Tuple[TimeSeriesDataset, TimeSeriesDataset, TimeSeriesDataset]: 训练、验证和测试数据集# 读取数据data pd.read_csv(os.path.join(args.root_path, args.data_path))# 检查是否存在 date 列如果存在则删除if date in data.columns:data data.drop(date, axis1)# 确保 load 列是第一列如果不是将其移到第一列if args.target in data.columns:data data[[args.target] [col for col in data.columns if col ! args.target]]# 定义数据集划分比例例如70% 训练集10% 验证集20% 测试集data_len len(data)num_train int(data_len * 0.7)num_test int(data_len * 0.2)num_vali data_len - num_train - num_testtrain_data data[:num_train]vali_data data[num_train:num_train num_vali]test_data data[num_train num_vali:]# 归一化scaler MinMaxScaler(feature_range(0, 1))scaler.fit(train_data)train_data scaler.transform(train_data)vali_data scaler.transform(vali_data)test_data scaler.transform(test_data)# 转换为张量并添加维度train_data torch.from_numpy(train_data).float()vali_data torch.from_numpy(vali_data).float()test_data torch.from_numpy(test_data).float()# 将其变为[1, n_features, data_len]train_data train_data.unsqueeze(0).permute(0, 2, 1)vali_data vali_data.unsqueeze(0).permute(0, 2, 1)test_data test_data.unsqueeze(0).permute(0, 2, 1)# 按滑动时间窗口转成机器学习的数据格式training_dataset TimeSeriesDataset(train_data, args)valiing_dataset TimeSeriesDataset(vali_data, args)testing_dataset TimeSeriesDataset(test_data, args)print(ftrain:{len(training_dataset)},vali:{len(valiing_dataset)},test:{len(testing_dataset)})if if_Batching:# 创建数据加载器用于批量加载数据train_loader DataLoader(training_dataset, shuffleTrue, drop_lastTrue, batch_sizeargs.batch_size)vali_loader DataLoader(valiing_dataset, shuffleTrue, drop_lastTrue, batch_sizeargs.batch_size)test_loader DataLoader(testing_dataset, shuffleFalse, drop_lastFalse, batch_sizelen(testing_dataset))return train_loader, vali_loader, test_loaderelse:return training_dataset, valiing_dataset, testing_dataset 模型类 CNN import torch from torch import nnclass Model(nn.Module):def init(self, configs):super(Model, self).init()self.input_size configs.input_size # 输入特征的大小self.output_size configs.output_size # 预测结果的维度self.time_step configs.time_step # 时间步数self.kernel_size configs.kernel_size # 卷积核的大小self.relu nn.ReLU(inplaceTrue) # ReLU激活函数# 第一个卷积层self.conv1 nn.Sequential(nn.Conv1d(in_channelsself.input_size, out_channels64, kernel_sizeself.kernel_size),# 输入特征维度为input_size输出通道数为64卷积核大小为kernel_sizenn.ReLU(), # ReLU激活函数nn.MaxPool1d(kernel_sizeself.kernel_size, stride1) # 最大池化池化窗口大小为kernel_size步长为1)# 第二个卷积层self.conv2 nn.Sequential(nn.Conv1d(in_channels64, out_channels128, kernel_size2),# 输入通道数为64输出通道数为128卷积核大小为2nn.ReLU(), # ReLU激活函数nn.MaxPool1d(kernel_sizeself.kernel_size, stride1) # 最大池化池化窗口大小为kernel_size步长为1)# 根据卷积操作后的数据格式和输出大小计算线性层的输入维度conv_output_size self._calculate_conv_output_size()# 线性层1输入维度为卷积层输出大小输出维度为50self.linear1 nn.Linear(conv_output_size, 50)# 线性层2输入维度为50输出维度为预测结果的维度self.linear2 nn.Linear(50, self.output_size)def forward(self, x):x x.transpose(1, 2)x self.conv1(x)x self.conv2(x)x x.view(x.size(0), -1)x self.linear1(x)x self.relu(x)x self.linear2(x)x x.view(x.shape[0], -1)return xdef _calculate_conv_output_size(self):自动计算卷积层输出形状此操作避免手算该参数参数:input_size( 输入特征维度 )返回值: conv_output_size (卷积层输出的特征维度)input_tensor torch.zeros(1, self.input_size, self.time_step) # 创建输入零张量维度为(1, input_size, time_step)conv1_output self.conv1(input_tensor)conv2_output self.conv2(conv1_output)conv_output_size conv2_output.view(conv2_output.size(0), -1).size(1)return conv_output_size GRU import torch from torch import nn from torch.autograd import Variable# GRU模型结构 class Model(nn.Module):def init(self, configs):super(Model, self).init()# 初始化模型参数self.output_size configs.output_size # 输出类别的数量self.num_layers configs.num_layers # GRU层数self.input_size configs.input_size # 输入特征的维度self.hidden_size configs.hidden_size # 隐藏状态的维度self.dropout configs.dropout # 在非循环层之间应用的丢弃比例默认为0.0没有丢弃。self.bidirectional configs.bidirectional # 是否使用双向GRU# 创建GRU层 batch_firstTrue输入数据的维度顺序是 (batch_size, seq_len, input_size)self.gru nn.GRU(input_sizeself.input_size, hidden_sizeself.hidden_size, num_layersself.num_layers,dropoutself.dropout, bidirectionalself.bidirectional, batch_firstTrue)# 创建全连接层用于输出预测结果self.fc nn.Linear(self.hidden_size, self.output_size)def forward(self, x):# 初始化初始隐藏状态h_0 Variable(torch.zeros(self.num_layers, x.size(0), self.hidden_size))# 通过GRU层进行前向传播out, h_0 self.gru(x, h_0)# 取GRU的最后一个时间步的输出out out[:, -1]# 通过全连接层进行分类预测out self.fc(out)return out LSTM import torch import torch.nn as nn from torch.autograd import Variableclass Model(nn.Module):def init(self, configs):super(Model, self).init()self.input_size configs.input_size # 输入特征的大小。self.hidden_size configs.hidden_size # LSTM 隐藏状态的维度self.num_layers configs.num_layers # LSTM 层的堆叠层数self.output_size configs.output_size # 输出的大小预测结果的维度self.dropout configs.dropout # 在非循环层之间应用的丢弃比例默认为0.0没有丢弃。self.bidirectional configs.bidirectional # 如果为TrueLSTM将是双向的包括前向和后向默认为False。self.lstm nn.LSTM(input_sizeconfigs.input_size, hidden_sizeconfigs.hidden_size,num_layersconfigs.num_layers, dropoutself.dropout, bidirectionalself.bidirectional,batch_firstTrue) # 定义 LSTM 层self.fc nn.Linear(configs.hidden_size, configs.output_size) # 定义线性层将 LSTM 输出映射到预测结果的维度def forward(self, x):h_0 Variable(torch.zeros(self.num_layers, x.size(0), self.hidden_size)) # 初始化 LSTM 的隐藏状态c_0 Variable(torch.zeros(self.num_layers, x.size(0), self.hidden_size)) # 初始化 LSTM 的记忆状态ula, (h_out, _) self.lstm(x, (h_0, c_0)) # 前向传播过程返回 LSTM 层的输出序列和最后一个时间步的隐藏状态h_out h_out[-1, :, :].view(-1, self.hidden_size) # 提取最后一个时间步的隐藏状态并进行形状变换使用LSTM的最后一个时间步的隐藏状态h_out作为线性层的输入是因为模型将隐藏状态视为包含了序列信息的高层表示。在许多情况下使用最后一个时间步的隐藏状态进行预测已经足够。out self.fc(h_out) # 将最后一个时间步的隐藏状态通过线性层进行预测return out MLP import torch.nn as nn# MLP模型结构 class Model(nn.Module):def init(self, configs):super(Model, self).init()self.input_size configs.input_size # 输入特征的大小即输入层的维度。self.output_size configs.output_size # 输出的大小即预测结果的维度。self.channel_sizes [int(size) for size in configs.channel_sizes.split(,)] # 因为输入的是字符串转成列表# 一个整数列表指定每个隐藏层的单元数量。列表的长度表示隐藏层的层数每个元素表示对应隐藏层的单元数量。self.time_step configs.time_steplayers []input_adjust_size self.input_size * self.time_step # 将数据展开后的维度为特征数量*时间步长# 遍历channel_sizes列表for i in range(len(self.channel_sizes)):if i 0:# 对于第一层创建一个从input_size到channel_sizes[i]的线性层self.linear nn.Linear(input_adjust_size, self.channel_sizes[i])self.init_weights() # 初始化线性层的权重layers [self.linear, nn.ReLU()] # 将线性层和ReLU激活函数添加到layers列表中else:# 对于后续层创建一个从channel_sizes[i-1]到channel_sizes[i]的线性层self.linear nn.Linear(self.channel_sizes[i - 1], self.channel_sizes[i])self.init_weights() # 初始化线性层的权重layers [self.linear, nn.ReLU()] # 将线性层和ReLU激活函数添加到layers列表中# 创建最后一个线性层从channel_sizes[-1]到output_sizeself.linear nn.Linear(self.channel_sizes[-1], self.output_size)self.init_weights() # 初始化线性层的权重layers [self.linear] # 将最后一个线性层添加到layers列表中# 使用layers列表创建一个Sequential网络self.network nn.Sequential(*layers)def initweights(self):# 使用均值为0标准差为0.01的正态分布初始化线性层的权重self.linear.weight.data.normal(0, 0.01)def forward(self, x):# X输入的shape为 [batch_size, time_stepn_features]# 将输入数据的维度展平然后传递给线性层。# 无论输入数据的特征数和时间步数如何都能适应到模型中。这个修改应该可以适用于不同维度的输入数据。x x.view(x.size(0), -1)return self.network(x) RNN import torch import torch.nn as nn from torch.autograd import Variable# RNN模型结构 class Model(nn.Module):def init(self, configs):super(Model, self).init()self.input_size configs.input_size # 输入特征的大小self.hidden_size configs.hidden_size # 隐藏状态的维度self.num_layers configs.num_layers # RNN的层数self.output_size configs.output_size # 输出的大小即预测结果的维度self.dropout configs.dropout # 在非循环层之间应用的丢弃比例默认为0.0没有丢弃。self.bidirectional configs.bidirectional # 如果为TrueLSTM将是双向的包括前向和后向默认为False。# 定义RNN结构输入特征大小、隐藏状态维度、层数等参数self.rnn nn.RNN(input_sizeself.input_size, hidden_sizeself.hidden_size, dropoutself.dropout,bidirectionalself.bidirectional, num_layersself.num_layers, batch_firstTrue)# 将RNN的输出压缩到与输出大小相同的维度self.fc nn.Linear(self.hidden_size, self.output_size)def forward(self, x):# 创建初始隐藏状态h_0维度为(num_layers, batch_size, hidden_size)h_0 Variable(torch.zeros(self.num_layers, x.size(0), self.hidden_size))# 通过RNN传播输入数据获取输出out和最终隐藏状态h_0out, h_0 self.rnn(x, h_0)# 取RNN最后一个时间步的输出将其输入到全连接层进行预测out self.fc(out[:, -1, :])return out TCN import torch.nn as nn from torch.nn.utils import weight_norm# TCN模型结构Chomp1d模块用于从卷积层的输出中移除无效的时间步。 class Chomp1d(nn.Module):def init(self, chomp_size):super(Chomp1d, self).init()self.chomp_size chomp_sizedef forward(self, x):# Chomp1d模块的作用是从卷积层的输出中移除无效的时间步即通过切片操作去掉最后的self.chomp_size个时间步。# 由于切片操作可能导致存储不连续因此在返回结果之前需要使用contiguous()方法确保存储连续性。return x[:, :, :-self.chomp_size].contiguous() TemporalBlock模块包含两个卷积层和相应的正则化、激活函数和dropout操作。第一个卷积层使用权重归一化通过Chomp1d组件移除无效的时间步然后经过ReLU激活函数和dropout操作。第二个卷积层也经过相同的处理流程。通过残差连接将第二个卷积层的输出和输入进行相加并通过ReLU激活函数得到最终的输出。 class TemporalBlock(nn.Module):def init(self, n_inputs, n_outputs, kernel_size, stride, dilation, padding, dropout0.2):super(TemporalBlock, self).init()# 第一次卷积self.conv1 weight_norm(nn.Conv1d(n_inputs, 3096, kernel_size,stridestride, paddingpadding, dilationdilation))self.chomp1 Chomp1d(padding)self.relu1 nn.ReLU()# 随机失活dropout。随机失活是一种常用的正则化技术用于减少过拟合self.dropout1 nn.Dropout(dropout)# 第二次卷积self.conv2 weight_norm(nn.Conv1d(3096, n_outputs, kernel_size,stridestride, paddingpadding, dilationdilation))self.chomp2 Chomp1d(padding)self.relu2 nn.ReLU()self.dropout2 nn.Dropout(dropout)# 将两次卷积层按顺序组合成一个网络self.net nn.Sequential(self.conv1, self.chomp1, self.relu1, self.dropout1,self.conv2, self.chomp2, self.relu2, self.dropout2,)# 如果输入通道数和输出通道数不相同则需要进行下采样self.downsample nn.Conv1d(n_inputs, n_outputs, 1) if n_inputs ! n_outputs else Noneself.relu nn.ReLU()# 初始化权重self.init_weights()def initweights(self):# 使用均值为0标准差为0.01的正态分布初始化权重self.conv1.weight.data.normal(0, 0.01)self.conv2.weight.data.normal(0, 0.01)if self.downsample is not None:self.downsample.weight.data.normal(0, 0.01)def forward(self, x):# 前向传播out self.net(x) # 通过两个卷积层res x if self.downsample is None else self.downsample(x) # 下采样return self.relu(out res) # 残差连接# 残差连接Residual connection是一种在神经网络中引入跨层连接的技术。它的目的是解决深层神经网络训练中的梯度消失或梯度爆炸问题并促进信息在网络中的流动。# 在TCN模型中残差连接被用于将每个TemporalBlock的输出与输入进行相加。这种设计使得信息可以直接通过跨层连接流动有助于梯度的传播和模型的训练。# 具体地在TemporalBlock的forward方法中首先通过两个卷积层进行特征提取和建模然后将第二个卷积层的输出和输入进行相加。这个相加的操作实现了残差连接。最终通过ReLU激活函数对相加的结果进行非线性变换。# 残差连接的好处是即使在网络较深的情况下梯度可以通过跨层连接直接传播到前面的层次减少了梯度消失的问题。同时它也提供了一种捕捉输入与输出之间的细微差异和变化的机制有助于提高模型的性能。 TemporalConvNet模块是 TCN 模型的核心由多个TemporalBlock组成的网络层次结构。根据num_channels列表的长度确定网络层次的深度。每个层次上的TemporalBlock的参数根据当前层次的位置和前一层的输出通道数进行确定。通过层次化的结构模型可以捕捉序列中的长期依赖关系。 class TemporalConvNet(nn.Module):def init(self, num_inputs, num_channels, kernel_size2, dropout0.2):super(TemporalConvNet, self).init()layers []self.relu nn.ReLU()num_levels len(num_channels)for i in range(num_levels):dilation_size 2 ** iin_channels num_inputs if i 0 else num_channels[i - 1]out_channels num_channels[i]# 每个层次添加一个TemporalBlocklayers [TemporalBlock(in_channels, out_channels, kernel_size, stride1, dilationdilation_size,padding(kernel_size - 1) * dilation_size, dropoutdropout)]# 将所有的TemporalBlock按顺序组合成一个网络self.network nn.Sequential(*layers)def forward(self, x):return self.relu(self.network(x) x[:, 0, :].unsqueeze(1)) TCN模块TCN模型的主体部分。它包括一个TemporalConvNet一个线性层和一个下采样层。输入数据首先经过TemporalConvNet进行序列建模和特征提取然后通过ReLU激活函数和残差连接进行处理。最后通过线性层进行预测并通过下采样层将输入数据的通道数降低到与TemporalBlock的输出通道数相同以便在残差连接中使用。 class Model(nn.Module):def init(self,configs): # input_size 输入的不同的时间序列数目super(Model, self).init()self.input_size configs.input_size # 输入特征的大小self.output_size configs.output_size # 预测结果的维度self.num_channels [configs.nhid] * configs.levels # 卷积层通道数的列表用于定义TemporalConvNet的深度self.kernel_size configs.kernel_size # 卷积核的大小self.dropout configs.dropout # 随机丢弃率# TemporalConvNet层self.tcn TemporalConvNet(self.input_size, self.num_channels, kernel_sizeself.kernel_size, dropoutself.dropout)# 线性层用于预测self.linear nn.Linear(self.num_channels[-1], self.output_size)# 下采样层用于通道数降低self.downsample nn.Conv1d(self.input_size, self.num_channels[0], 1)self.relu nn.ReLU()# 初始化权重self.init_weights()def initweights(self):self.linear.weight.data.normal(0, 0.01)self.downsample.weight.data.normal_(0, 0.01)def forward(self, x):# 前向传播x x.transpose(1, 2)# 通过TemporalConvNet进行序列建模和特征提取y1 self.relu(self.tcn(x) x[:, 0, :].unsqueeze(1))# 线性层进行预测return self.linear(y1[:, :, -1]) Transformer import torch import torch.nn as nnfrom Models.layers.Transformer.decoder import Decoder from Models.layers.Transformer.encoder import Encoder from Models.layers.Transformer.utils import generate_original_PE, generate_regular_PEclass Model(nn.Module):基于Attention is All You Need的Transformer模型。适用于顺序数据的经典Transformer模型。嵌入Embedding已被替换为全连接层最后一层softmax函数替换为sigmoid函数。属性———-layers_encoding: :py:class:list of :class:Encoder.Encoder编码器层的堆叠。layers_decoding: :py:class:list of :class:Decoder.Decoder解码器层的堆叠。参数———-d_input:模型输入的维度。d_model:输入向量的维度。d_output:模型输出的维度。q:查询和键的维度。v:值的维度。h:头数。N:要堆叠的编码器和解码器层数量。attention_size:应用注意力机制的反向元素数量。如果为 None则不激活。默认为 None。dropout:每个多头自注意力MHA或前馈全连接PFF块之后的dropout概率。默认为 0.3。chunk_mode:切块模式可以是 chunk、window 或 None 之一。默认为 chunk。pe:要添加的位置编码类型可以是 original、regular 或 None 之一。默认为 None。pe_period:如果使用 regular 位置编码则可以定义周期。默认为 None。def init(self, configs):根据Encoder和Decoder块创建Transformer结构。super(Model, self).init()d_input configs.d_inputd_model configs.d_modeld_output configs.d_outputq configs.qv configs.vh configs.hN configs.Nattention_size configs.attention_sizedropout configs.dropoutchunk_mode configs.chunk_modepe configs.pepe_period configs.pe_periodself._d_model d_modelself.layers_encoding nn.ModuleList([Encoder(d_model,q,v,h,attention_sizeattention_size,dropoutdropout,chunk_modechunk_mode) for _ in range(N)])self.layers_decoding nn.ModuleList([Decoder(d_model,q,v,h,attention_sizeattention_size,dropoutdropout,chunk_modechunk_mode) for _ in range(N)])self._embedding nn.Linear(d_input, d_model)self._linear nn.Linear(d_model, d_output)pe_functions {original: generate_original_PE,regular: generate_regular_PE,}if pe in pe_functions.keys():self._generate_PE pe_functions[pe]self._pe_period pe_periodelif pe is None:self._generate_PE Noneelse:raise NameError(f未知的位置编码PE{pe}。必须为 {, .join(pe_functions.keys())} 或 None。)self.name transformerdef forward(self, x: torch.Tensor) - torch.Tensor:通过Transformer进行输入传播。通过嵌入模块、编码器和解码器堆叠以及输出模块进行输入传播。参数———-x:形状为 (batch_size, K, d_input) 的 torch.Tensor。返回——-形状为 (batch_size, K, d_output) 的输出张量。K x.shape[1]# 嵌入模块encoding self._embedding(x)# 添加位置编码if self._generate_PE is not None:pe_params {period: self._pe_period} if self._pe_period else {}positional_encoding self._generate_PE(K, self._d_model, **pe_params)positional_encoding positionalencoding.to(encoding.device)encoding.add(positional_encoding)# 编码器堆叠for layer in self.layers_encoding:encoding layer(encoding)# 解码器堆叠decoding encoding# 添加位置编码if self._generate_PE is not None:positional_encoding self._generate_PE(K, self._d_model)positional_encoding positionalencoding.to(decoding.device)decoding.add(positional_encoding)for layer in self.layers_decoding:decoding layer(decoding, encoding)# 输出模块output self._linear(decoding)output torch.sigmoid(output)return output[:, -1, :]