首页 - 技术栈

长垣县做网站的拓者设计吧官网案例

作者: 五速梦信息网
时间: 2026年06月19日 05:09

当前位置：首页 > news >正文

长垣县做网站的,拓者设计吧官网案例,百度网盟推广体验中心,插件功能wordpress原文链接
(beta) Dynamic Quantization on an LSTM Word Language Model — PyTorch Tutorials 2.3.0cu121 documentation 引言量化涉及将模型的权重和激活值从浮点数转换为整数#xff0c;这样可以缩小模型大小#xff0c;加快推理速度#xff0c;但对准确性的影响很小…原文链接 (beta) Dynamic Quantization on an LSTM Word Language Model — PyTorch Tutorials 2.3.0cu121 documentation 引言量化涉及将模型的权重和激活值从浮点数转换为整数这样可以缩小模型大小加快推理速度但对准确性的影响很小。在本教程中我们将把最简单的量化形式–动态量化–应用到基于 LSTM 的下一个单词预测模型中这与 PyTorch 示例中的单词语言模型密切相关。

imports

import os from io import open import timeimport torch import torch.nn as nn import torch.nn.functional as F定义模型在此我们按照单词语言模型示例中的模型定义 LSTM 模型架构。 class LSTMModel(nn.Module):Container module with an encoder, a recurrent module, and a decoder.def init(self, ntoken, ninp, nhid, nlayers, dropout0.5):super(LSTMModel, self).init()self.drop nn.Dropout(dropout)self.encoder nn.Embedding(ntoken, ninp)self.rnn nn.LSTM(ninp, nhid, nlayers, dropoutdropout)self.decoder nn.Linear(nhid, ntoken)self.init_weights()self.nhid nhidself.nlayers nlayersdef initweights(self):initrange 0.1self.encoder.weight.data.uniform(-initrange, initrange)self.decoder.bias.data.zero()self.decoder.weight.data.uniform(-initrange, initrange)def forward(self, input, hidden):emb self.drop(self.encoder(input))output, hidden self.rnn(emb, hidden)output self.drop(output)decoded self.decoder(output)return decoded, hiddendef init_hidden(self, bsz):weight next(self.parameters())return (weight.new_zeros(self.nlayers, bsz, self.nhid),weight.new_zeros(self.nlayers, bsz, self.nhid)) 加载文本数据接下来我们将 Wikitext-2 数据集加载到[Corpus]{.title-ref}中同样按照单词语言模型示例进行预处理。 class Dictionary(object):def init(self):self.word2idx {}self.idx2word []def add_word(self, word):if word not in self.word2idx:self.idx2word.append(word)self.word2idx[word] len(self.idx2word) - 1return self.word2idx[word]def len(self):return len(self.idx2word)class Corpus(object):def init(self, path):self.dictionary Dictionary()self.train self.tokenize(os.path.join(path, train.txt))self.valid self.tokenize(os.path.join(path, valid.txt))self.test self.tokenize(os.path.join(path, test.txt))def tokenize(self, path):Tokenizes a text file.print(path)assert os.path.exists(path), fError: The path {path} does not exist.# Add words to the dictionarywith open(path, r, encodingutf8) as f:for line in f:words line.split() [eos]for word in words:self.dictionary.add_word(word)# Tokenize file contentwith open(path, r, encodingutf8) as f:idss []for line in f:words line.split() [eos]ids []for word in words:ids.append(self.dictionary.word2idx[word])idss.append(torch.tensor(ids).type(torch.int64))ids torch.cat(idss)return idsmodel_data_filepath .\data\corpus Corpus(model_data_filepath wikitext-2) 加载预训练模型这是一个关于动态量化的教程一种在模型训练完成后应用的量化技术。因此我们只需将一些预先训练好的权重加载到该模型架构中这些权重是通过使用单词语言模型示例中的默认设置进行五次历时训练获得的。 ntokens len(corpus.dictionary)model LSTMModel(ntokenntokens,ninp512,nhid256,nlayers5, )# model.load_state_dict(

torch.load(

model_data_filepath word_language_model_quantize.pth,

map_locationtorch.device(cpu)

)

)model.eval()

print(model) 现在让我们生成一些文本以确保预训练模型正常工作 - 与之前类似我们遵循此处 input_ torch.randint(ntokens, (1, 1), dtypetorch.long) hidden model.init_hidden(1) temperature 1.0 num_words 1000with open(model_data_filepath out.txt, w) as outf:with torch.no_grad(): # no tracking historyfor i in range(numwords):output, hidden model(input, hidden)word_weights output.squeeze().div(temperature).exp().cpu()word_idx torch.multinomial(wordweights, 1)[0]input.fill_(word_idx)word corpus.dictionary.idx2word[word_idx]outf.write(str(word.encode(utf-8)) (\n if i % 20 19 else ))if i % 100 0:print(| Generated {}/{} words.format(i, 1000))with open(model_data_filepath out.txt, r) as outf:all_output outf.read()print(all_output) 虽然不是 GPT-2但看起来模型已经开始学习语言结构了我们差不多可以演示动态量化了。我们只需要再定义几个辅助函数 bptt 25 criterion nn.CrossEntropyLoss() eval_batch_size 1# create test data set def batchify(data, bsz):# Work out how cleanly we can divide the dataset into bsz parts.nbatch data.size(0) // bsz# Trim off any extra elements that wouldnt cleanly fit (remainders).data data.narrow(0, 0, nbatch * bsz)# Evenly divide the data across the bsz batches.return data.view(bsz, -1).t().contiguous()test_data batchify(corpus.test, eval_batch_size)# Evaluation functions def get_batch(source, i):seq_len min(bptt, len(source) - 1 - i)data source[i:i seq_len]target source[i 1:i 1 seq_len].reshape(-1)return data, targetdef repackage_hidden(h):Wraps hidden states in new Tensors, to detach them from their history.if isinstance(h, torch.Tensor):return h.detach()else:return tuple(repackagehidden(v) for v in h)def evaluate(model, datasource):# Turn on evaluation mode which disables dropout.model.eval()totalloss 0.hidden model.init_hidden(eval_batch_size)with torch.no_grad():for i in range(0, data_source.size(0) - 1, bptt):data, targets get_batch(datasource, i)output, hidden model(data, hidden)hidden repackage_hidden(hidden)output_flat output.view(-1, ntokens)total_loss len(data) * criterion(output_flat, targets).item()return total_loss / (len(data_source) - 1)测试动态量化最后我们可以在模型上调用 torch.quantization.quantize_dynamic具体来说就是我们指定要对模型中的 nn.LSTM 和 nn.Linear 模块进行量化我们指定要将权重转换为 int8 值 import torch.quantizationquantized_model torch.quantization.quantize_dynamic(model, {nn.LSTM, nn.Linear}, dtypetorch.qint8 ) print(quantized_model)# 模型看起来没有变化这对我们有什么好处呢首先我们看到模型的尺寸大幅缩小 def print_size_of_model(model):torch.save(model.state_dict(), temp.p)print(Size (MB):, os.path.getsize(temp.p) / 1e6)os.remove(temp.p)print_size_of_model(model) print_size_of_model(quantized_model) 其次我们看到推理时间更快而评估损失没有区别注我们将单线程比较的线程数设为一个因为量化模型是单线程运行的。 torch.set_num_threads(1)def time_model_evaluation(model, test_data):s time.time()loss evaluate(model, test_data)elapsed time.time() - sprint(loss: {0:.3f}\nelapsed time (seconds): {1:.1f}.format(loss, elapsed))time_model_evaluation(model, test_data) time_model_evaluation(quantized_model, test_data)在本地 MacBook Pro 上运行这个程序在不进行量化的情况下推理时间约为 200 秒而在进行量化的情况下推理时间仅为 100 秒左右。结论动态量化是减少模型大小的一种简单方法但对准确性的影响有限。感谢您的阅读我们一如既往地欢迎任何反馈如果您有任何问题请在此创建一个问题。