首页 - 技术栈

动漫制作专业平台百度人工优化

作者: 五速梦信息网
时间: 2026年06月19日 11:26

当前位置：首页 > news >正文

动漫制作专业平台,百度人工优化,二手购物网站建设方案,优秀电商设计网站有哪些内容手写数字识别文章目录手写数字识别1、线性回归VS逻辑回归Sigmoid函数 2、逻辑回归的基本模型-神经网络模型3、多元分类基本模型4、TensorFlow实战解决手写数字识别问题准备数据集数据集划分特征数据归一化归一化方法归一化场景标签数据独热编码One-Hot编码构建模型损失函数…手写数字识别文章目录手写数字识别1、线性回归VS逻辑回归Sigmoid函数 2、逻辑回归的基本模型-神经网络模型3、多元分类基本模型4、TensorFlow实战解决手写数字识别问题准备数据集数据集划分特征数据归一化归一化方法归一化场景标签数据独热编码One-Hot编码构建模型损失函数训练超参数梯度函数Adam优化器准确率模型训练显示训练过程数据在测试集完成评估模型模型预测定义可视化函数预测函数可视化预测结果 5、完整代码demo 说到数字识别问题这是一个分类问题也就是我们要探讨的逻辑回归问题。逻辑回归是机器学习算法中非常经典的一种算法。 1、线性回归VS逻辑回归线性回归和逻辑回归的关系就是逻辑回归是广义的线性回归。它们就是一个东西只是范围不同。我在文章《深度学习在单线性回归方程中的应用–TensorFlow实战详解》讲到的预测问题实则是线性回归本质就是用一堆数据集点去模拟出一个函数再用这个函数进行预测。逻辑回归是在这个基础上将得到的函数放在一个 Sigmoid()函数里求出来得到一堆概率值这些概率值就是在0和1之间的。这个时候我们在设置一个阈值通过比较概率和这个阈值的关系我们就能达到分类的效果了。总结一下就是线性回归解决的是回归问题逻辑回归相当于是线性回归的基础上来解决分类问题。线性回归逻辑回归从上面两个公式逻辑回归可以理解为在线性回归后加了一个Sigmoid 函数。将线性回归变成一个0~1输出的分类问题。 Sigmoid函数这个函数长成这个样子线性回归得到大于0的输出逻辑回归就会得到0.5 ~ 1的输出线性回归得到小于0的输出逻辑回归就会得到0 ~ 0.5的输出【其实就是上面把Z0和Z0两种情况讨论】他们的联系线性回归模型试图找到一个线性方程来拟合数据而逻辑回归模型则试图找到一个逻辑函数来拟合数据。线性回归解决预测问题逻辑回归解决分类问题。 2、逻辑回归的基本模型-神经网络模型许多问题的预测结果是一个在连续空间的数值比如房价预测问题可以用线性模型来描述但也有很多场景需要输出的是概率估算值例如根据邮件内容判断是垃圾邮件的可能性根据医学影像判断肿瘤是恶性的可能性手写数字分别是 0、1、2、3、4、5、6、7、8、9的可能性概率这时需要将预测输出值控制在 [01]区间内二元分类问题的目标是正确预测两个可能的标签中的一个。逻辑回归Logistic Regression可以用于处理这类问题
3、多元分类基本模型为什么要讨论多元分类呢因为我们上面引入了逻辑回归的基本模型我们把逻辑回归基本模型拼成如下图所示就可以得到一个多元分类模型了其实这个模型就是一个全连接神经网络。这个Softmax的作用就是让逻辑回归得到的概率值在0-1之间且概率值相加之和为1这个Softmax长成这样 4、TensorFlow实战解决手写数字识别问题我们说机器学习呢算法的套路如下准备数据集构建模型训练模型进行预测准备数据集我们现在去哪里搜集数据集呢 MNIST 数据集可在 http://yann.lecun.com/exdb/mnist/ 获取。 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt %matplotlib inline print(TensorFlow2.0版本是,tf.version) #打印当前的数据集 mnisttf.keras.datasets.mnist (train_images,train_labels),(test_images,test_labels)mnist.load_data() print(Train images_shape:,train_images.shape,Train label shape:,train_labels.shape) print(Test images shape:,test_images.shape,Test label shape:,test_labels.shape)数据集划分为了高考取得好成绩你需要模拟卷押题卷真题卷。其中模拟卷训练集押题卷验证集真题卷测试集这样分类才能更好的对你的大脑进行训练如果不按章法刷题你上来就做真题卷押题卷缺少了系统的训练如果你不做押题卷只做模拟卷那么你缺少了对真题命题规律的判断。这在机器学习中叫做过拟合或者欠拟合意思是你的大脑泛化能力不够好模型训练的不大好。我们建立了如下图的新的工作流程 total_numlen(train_images) valid_split0.2 # 验证集的比例占20% train_numint(total_num*(1-valid_split))#训练集的数目train_xtrain_images[:train_num]#前部分给训练集 train_ytrain_labels[:train_num]valid_xtrain_images[train_num:]#后20%给验证集 valid_ytrain_labels[train_num:]test_xtest_images test_ytest_labelsvalid_x.shape特征数据归一化特征数据归一化特征归一化是指将数据按比例缩放使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到去除数据的单位限制将其转化为无量纲的纯数值便于不同单位或量级的指标能够进行比较和加权。特征归一化通常将数据映射到[0,1]区间上常见的映射范围有[0,1]和[-1,1]。这样可以使得不同指标之间具有可比性。同时特征归一化也可以消除数据特征之间的量纲影响。例如分析一个人的身高和体重对健康的影响如果使用米 m) 和千克 kg 作为单位那么身高特征会在 1.6 l.8m 的数值范围内体重特征会在50 100kg 的范围内分析出来的结果显然会倾向于数值差别比较大的体重特征。想要得到更为准确的结果就需要进行特征归一化 Normalization 处理使各指标处于同一数值量级以便进行分析。归一化方法线性函数归化 Min-Max Scaling
它对原始数据进行线性变换使结果映射到0, 1 的范围实现对原始数据的等比缩放。归一化公式如下零均值归一化 Z-Score Normalization
它会将原始数据映射到均值为 0、标准差为1 的分布上。具体来说假设原始特征的均值为 μ、标准差为 σ那么归一化公式定义为归一化场景当然数据归一化并不是万能的。在实际应用中通过梯度下降法求解的模型通常是需要归一化的包括逻辑回归、线性回归、逻辑回归、支持向量机、神经网络等模型。但对于决策树模型则并不适用以C4.5 为例决策树在进行节点分裂时主要依据数据集 D 关于特征 x 的信息增益比而信息增益比跟特征是否经过归一化是无关的因为归一化并不会改变样本在特征 x 上的信息增益。

把(28,28)的结构拉成一行 784

train_xtrain_x.reshape(-1,784) valid_xvalid_x.reshape(-1,784) test_xtest_x.reshape(-1,784)

特征数据归一化

train_xtf.cast(train_x/255.0,tf.float32) valid_xtf.cast(valid_x/255.0,tf.float32) test_xtf.cast(test_x/255.0,tf.float32)train_x[1]标签数据独热编码在机器学习算法中我们经常会遇到分类特征例如人的性别有男女祖国有中国美国法国等。这些特征值并不是连续的而是离散的无序的。通常我们需要对其进行特征数字化。考虑以下三个特征 [“male”, “female”] [“from Europe”, “from US”, “from Asia”] [“uses Firefox”, “uses Chrome”, “uses Safari”, “uses Internet Explorer”] 如果将上述特征用数字表示效率会高很多。例如 [“male”, “from US”, “uses Internet Explorer”] 表示为[0, 1, 3] [“female”, “from Asia”, “uses Chrome”]表示为[1, 2, 1] 但是转化为数字表示后上述数据不能直接用在我们的分类器中。因为分类器往往默认数据数据是连续的并且是有序的。但按上述表示的数字并不有序的而是随机分配的。 One-Hot编码
One-Hot编码又称为一位有效编码主要是采用N位状态寄存器来对N个状态进行编码每个状态都由他独立的寄存器位并且在任意时候只有一位有效。就拿上面的例子来说吧性别特征[“男”,“女”]按照N位状态寄存器来对N个状态进行编码的原理咱们处理后应该是这样的这里只有两个特征所以N2 男 10 女 01 祖国特征[“中国”美国“法国”]这里N3 中国 100 美国 010 法国 001 运动特征[“足球”“篮球”“羽毛球”“乒乓球”]这里N4 足球 1000 篮球 0100 羽毛球 0010 乒乓球 0001 所以当一个样本为[“男”,“中国”,“乒乓球”]的时候完整的特征数字化的结果为 [101000001] 在回归分类聚类等机器学习算法中特征之间距离的计算或相似度的计算是非常重要的而我们常用的距离或相似度的计算都是在欧式空间的相似度计算计算余弦相似性基于的就是欧式空间。而我们使用one-hot编码将离散特征的取值扩展到了欧式空间离散特征的某个取值就对应欧式空间的某个点。将离散型特征使用one-hot编码确实会让特征之间的距离计算更加合理。

对标签数据进行独热编码

train_ytf.one_hot(train_y,depth10) valid_ytf.one_hot(valid_y,depth10) test_ytf.one_hot(test_y,depth10) train_y构建模型 #构建模型 def model(x,w,b):predtf.matmul(x,w)breturn tf.nn.softmax(pred)#定义变量 Wtf.Variable(tf.random.normal([784,10],mean0.0,stddev1.0,dtypetf.float32)) Btf.Variable(tf.zeros([10]),dtypetf.float32)损失函数我们在线性回归的实战中采用的损失函数是平方损失函数。在逻辑回归中我们采用的损失函数是对数损失函数。这个函数是一个凸函数它的图象如下在多元分类问题中我们通常采用交叉熵损失函数 def loss(x,y,w,b):predmodel(x,w,b)#计算模型预测值和标签值的差异loss_tf.keras.losses.categorical_crossentropy(y_truey,y_predpred)# 官方的交叉熵损失函数return tf.reducemean(loss)#求均值得到均方差训练超参数 training_epochs20#训练轮数 batch_size50#单次训练样本 learning_rate0.001 #学习率梯度函数 #计算样本数据在[x,y]在参数[w,b]点上的梯度 def grad(x,y,w,b):with tf.GradientTape() as tape:lossloss(x,y,w,b)return tape.gradient(loss,[w,b])#返回梯度向量Adam优化器 #Adam优化器 optimizertf.keras.optimizers.Adam(learning_ratelearning_rate)常用的优化器有 SGDAdagradRMSpropAdam 准确率 #定义准确率 def accuary(x,y,w,b):predmodel(x,w,b)#计算模型预测和标签值的差异# 检查预测类别tf.argmax(pred,1)与实际类别tf.argmax(pred,1)的匹配情况correct_predictiontf.equal(tf.argmax(pred,1),tf.argmax(y,1))#准确率return tf.reduce_mean(tf.cast(correct_prediction,tf.float32))模型训练 total_stepint(train_num/batch_size)#一轮训练有多少批次loss_list_train[]#用于保存训练集loss值的列表 loss_list_valid[]# 用于保存验证集loss值的列表 acc_list_train[]# 用于保存训练集Acc的值的列表 acc_list_valid[]# 用于保存验证集Acc值的列表for epoch in range(training_epochs):for step in range(total_step):xstrain_x[step*batch_size:(step1)*batch_size]ystrain_y[step*batch_size:(step1)*batch_size]gradsgrad(xs,ys,W,B)#计算梯度optimizer.apply_gradients(zip(grads,[W,B]))#优化器根据梯度自动调整变量w和bloss_trainloss(train_x,train_y,W,B).numpy() #计算当前轮训练损失loss_validloss(valid_x,valid_y,W,B).numpy() #计算当前轮损失验证acc_trainaccuary(train_x,train_y,W,B).numpy()acc_validaccuary(valid_x,valid_y,W,B).numpy()loss_list_train.append(loss_train)loss_list_valid.append(loss_valid)acc_list_train.append(acc_train)acc_list_valid.append(acc_valid)print(epoch{:3d},train_loss{:.4f},train_acc{:.4f},val_loss{:.4f},val_acc{:.4f}.format(epoch1,loss_train,acc_train,loss_valid,acc_valid))显示训练过程数据 plt.xlabel(Epochs) plt.ylabel(Loss) plt.plot(loss_list_train,blue,labelTrain Loss) plt.plot(loss_list_valid,red,labelValid Loss) plt.legend(loc1)#通过参数loc指定图例位置plt.xlabel(Epochs) plt.ylabel(Accuary) plt.plot(acc_list_train,blue,labelTrain Acc) plt.plot(acc_list_valid,red,labelValid Acc) plt.legend(loc1)#通过参数loc指定图例位置在测试集完成评估模型 acc_testaccuary(test_x,test_y,W,B).numpy() print(Test accuary:,acc_test)模型预测模型建立完成以后并训练完现在认为准确度可以接受了接下来可以使用这个模型进行预测了。

定义预测函数

def predict(x,w,b):predmodel(x,w,b)#计算预测值resulttf.argmax(pred,1).numpy()return result pred_testpredict(test_x,W,B) pred_test[0]定义可视化函数 def plot_images_labels_prediction(images,# 图象列表labels,# 标签列表preds,#预测值列表index0,#从第index个开始显示num10):#缺省一次显示10幅figplt.gcf() #获取当前图表fig.set_size_inches(10,4) # 1英寸2.54cmif num 10:num 10 #最多显示10个子图for i in range(0,num):axplt.subplot(2,5,i1)#获取当前要处理的子图ax.imshow(np.reshape(images[index],(28,28)),cmapbinary)# 显示第index个图titlelabelstr(labels[index])#构建图上要显示的title信息if len(preds)0:title,predictstr(preds[index])ax.set_title(title,fontsize10)#显示图上的title信息ax.set_xticks([])#不显示坐标ax.set_yticks([])indexindex1plt.show()预测函数可视化预测结果 #可视化预测结果 plot_images_labels_prediction(test_images,test_labels,pred_test,10,10)可以调整训练迭代次数来提高迭代的准确度。 5、完整代码demo import tensorflow as tf import numpy as np import matplotlib.pyplot as plt %matplotlib inline print(TensorFlow2.0版本是,tf.version)mnisttf.keras.datasets.mnist (train_images,train_labels),(test_images,test_labels)mnist.load_data()print(Train images_shape:,train_images.shape,Train label shape:,train_labels.shape) print(Test images shape:,test_images.shape,Test label shape:,test_labels.shape)print(image data:,train_images[1])def plot_image(image):plt.imshow(image.reshape(28,28),cmapbinary)plt.show() plot_image(train_images[1])total_numlen(train_images) valid_split0.2 # 验证集的比例占20% train_numint(total_num*(1-valid_split))#训练集的数目train_xtrain_images[:train_num]#前部分给训练集 train_ytrain_labels[:train_num]valid_xtrain_images[train_num:]#后20%给验证集 valid_ytrain_labels[train_num:]test_xtest_images test_ytest_labelsvalid_x.shape# 把(28,28)的结构拉成一行 784 train_xtrain_x.reshape(-1,784) valid_xvalid_x.reshape(-1,784) test_xtest_x.reshape(-1,784)

特征数据归一化

train_xtf.cast(train_x/255.0,tf.float32) valid_xtf.cast(valid_x/255.0,tf.float32) test_xtf.cast(test_x/255.0,tf.float32)train_x[1]# 对标签数据进行独热编码 train_ytf.one_hot(train_y,depth10) valid_ytf.one_hot(valid_y,depth10) test_ytf.one_hot(test_y,depth10) train_y#构建模型 def model(x,w,b):predtf.matmul(x,w)breturn tf.nn.softmax(pred)#定义变量 Wtf.Variable(tf.random.normal([784,10],mean0.0,stddev1.0,dtypetf.float32)) Btf.Variable(tf.zeros([10]),dtypetf.float32)def loss(x,y,w,b):predmodel(x,w,b)#计算模型预测值和标签值的差异loss_tf.keras.losses.categorical_crossentropy(y_truey,y_predpred)return tf.reducemean(loss)#求均值得到均方差training_epochs20#训练轮数 batch_size50#单次训练样本 learning_rate0.001 #学习率#计算样本数据在[x,y]在参数[w,b]点上的梯度 def grad(x,y,w,b):with tf.GradientTape() as tape:lossloss(x,y,w,b)return tape.gradient(loss,[w,b])#返回梯度向量#Adam优化器 optimizertf.keras.optimizers.Adam(learning_ratelearning_rate)#定义准确率 def accuary(x,y,w,b):predmodel(x,w,b)#计算模型预测和标签值的差异# 检查预测类别tf.argmax(pred,1)与实际类别tf.argmax(pred,1)的匹配情况correct_predictiontf.equal(tf.argmax(pred,1),tf.argmax(y,1))#准确率return tf.reduce_mean(tf.cast(correct_prediction,tf.float32))total_stepint(train_num/batch_size)#一轮训练有多少批次loss_list_train[]#用于保存训练集loss值的列表 loss_list_valid[]# 用于保存验证集loss值的列表 acc_list_train[]# 用于保存训练集Acc的值的列表 acc_list_valid[]# 用于保存验证集Acc值的列表for epoch in range(training_epochs):for step in range(total_step):xstrain_x[step*batch_size:(step1)*batch_size]ystrain_y[step*batch_size:(step1)*batch_size]gradsgrad(xs,ys,W,B)#计算梯度optimizer.apply_gradients(zip(grads,[W,B]))#优化器根据梯度自动调整变量w和bloss_trainloss(train_x,train_y,W,B).numpy() #计算当前轮训练损失loss_validloss(valid_x,valid_y,W,B).numpy() #计算当前轮损失验证acc_trainaccuary(train_x,train_y,W,B).numpy()acc_validaccuary(valid_x,valid_y,W,B).numpy()loss_list_train.append(loss_train)loss_list_valid.append(loss_valid)acc_list_train.append(acc_train)acc_list_valid.append(acc_valid)print(epoch{:3d},train_loss{:.4f},train_acc{:.4f},val_loss{:.4f},val_acc{:.4f}.format(epoch1,loss_train,acc_train,loss_valid,acc_valid))plt.xlabel(Epochs) plt.ylabel(Loss) plt.plot(loss_list_train,blue,labelTrain Loss) plt.plot(loss_list_valid,red,labelValid Loss) plt.legend(loc1)#通过参数loc指定图例位置plt.xlabel(Epochs) plt.ylabel(Accuary) plt.plot(acc_list_train,blue,labelTrain Acc) plt.plot(acc_list_valid,red,labelValid Acc) plt.legend(loc1)#通过参数loc指定图例位置acc_testaccuary(test_x,test_y,W,B).numpy() print(Test accuary:,acc_test)# 定义预测函数 def predict(x,w,b):predmodel(x,w,b)#计算预测值resulttf.argmax(pred,1).numpy()return result pred_testpredict(test_x,W,B) pred_test[0]def plot_images_labels_prediction(images,# 图象列表labels,# 标签列表preds,#预测值列表index0,#从第index个开始显示num10):#缺省一次显示10幅figplt.gcf() #获取当前图表fig.set_size_inches(10,4) # 1英寸2.54cmif num 10:num 10 #最多显示10个子图for i in range(0,num):axplt.subplot(2,5,i1)#获取当前要处理的子图ax.imshow(np.reshape(images[index],(28,28)),cmapbinary)# 显示第index个图titlelabelstr(labels[index])#构建图上要显示的title信息if len(preds)0:title,predictstr(preds[index])ax.set_title(title,fontsize10)#显示图上的title信息ax.set_xticks([])#不显示坐标ax.set_yticks([])indexindex1plt.show()#可视化预测结果 plot_images_labels_prediction(test_images,test_labels,pred_test,10,10)