首页 - 技术栈

四川市网站建设视频弹幕网站怎么做的

作者: 五速梦信息网
时间: 2026年04月20日 08:27

当前位置：首页 > news >正文

四川市网站建设,视频弹幕网站怎么做的,中国免费广告网,一般个人网址是什么目录 DAY 35 模型可视化与推理1.三种不同的模型可视化方法#xff1a;推荐torchinfo打印summary权重分布可视化2.进度条功能#xff1a;手动和自动写法#xff0c;让打印结果更加美观3.推理的写法#xff1a;评估模式作业#xff1a;调整模型定义时的超参数#xff0c;对… 目录 DAY 35 模型可视化与推理1.三种不同的模型可视化方法推荐torchinfo打印summary权重分布可视化2.进度条功能手动和自动写法让打印结果更加美观3.推理的写法评估模式作业调整模型定义时的超参数对比下效果。 DAY 35 模型可视化与推理 import torch import torch.nn as nn import torch.optim as optim from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.preprocessing import MinMaxScaler import time import matplotlib.pyplot as pltdevice torch.device(cuda:0 if torch.cuda.is_available() else cpu) print(f使用设备: {device})iris load_iris() X iris.data y iris.target X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42) scaler MinMaxScaler() X_train scaler.fit_transform(X_train) X_test scaler.transform(X_test) X_train torch.FloatTensor(X_train).to(device) y_train torch.LongTensor(y_train).to(device) X_test torch.FloatTensor(X_test).to(device) y_test torch.LongTensor(y_test).to(device)class MLP(nn.Module):def init(self):super(MLP, self).init()self.fc1 nn.Linear(4, 10)self.relu nn.ReLU()self.fc2 nn.Linear(10, 3)def forward(self, x):out self.fc1(x)out self.relu(out)out self.fc2(out)return outmodel MLP().to(device) criterion nn.CrossEntropyLoss() optimizer optim.SGD(model.parameters(), lr0.01) num_epochs 20000 losses [] start_time time.time()for epoch in range(num_epochs):outputs model(X_train)loss criterion(outputs, y_train)optimizer.zero_grad()loss.backward()optimizer.step()if (epoch 1) % 200 0:losses.append(loss.item())print(fEpoch [{epoch1}/{num_epochs}], Loss: {loss.item():.4f})if (epoch 1) % 100 0:print(fEpoch [{epoch1}/{num_epochs}], Loss: {loss.item():.4f})time_all time.time() - start_time print(fTraining time: {time_all:.2f} seconds)plt.plot(range(len(losses)), losses) plt.xlabel(Epoch) plt.ylabel(Loss) plt.title(Training Loss over Epochs) plt.show() 使用设备: cpu Epoch [¹⁰⁰⁄₂₀₀₀₀], Loss: 1.0420 Epoch [²⁰⁰⁄₂₀₀₀₀], Loss: 0.9975 Epoch [²⁰⁰⁄₂₀₀₀₀], Loss: 0.9975 Epoch [³⁰⁰⁄₂₀₀₀₀], Loss: 0.9480 Epoch [⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.8947 Epoch [⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.8947 Epoch [⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.8393 Epoch [⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.7838 Epoch [⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.7838 Epoch [⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.7300 Epoch [⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.6797 Epoch [⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.6797 Epoch [⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.6337 Epoch [¹⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.5927 Epoch [¹⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.5927 Epoch [¹¹⁰⁰⁄₂₀₀₀₀], Loss: 0.5566 Epoch [¹²⁰⁰⁄₂₀₀₀₀], Loss: 0.5251 Epoch [¹²⁰⁰⁄₂₀₀₀₀], Loss: 0.5251 Epoch [¹³⁰⁰⁄₂₀₀₀₀], Loss: 0.4975 Epoch [¹⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.4733 Epoch [¹⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.4733 Epoch [¹⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.4518 Epoch [¹⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.4325 Epoch [¹⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.4325 Epoch [¹⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.4150 Epoch [¹⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.3990 Epoch [¹⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.3990 Epoch [¹⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.3840 Epoch [²⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.3701 Epoch [²⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.3701 Epoch [²¹⁰⁰⁄₂₀₀₀₀], Loss: 0.3570 Epoch [²²⁰⁰⁄₂₀₀₀₀], Loss: 0.3447 Epoch [²²⁰⁰⁄₂₀₀₀₀], Loss: 0.3447 Epoch [²³⁰⁰⁄₂₀₀₀₀], Loss: 0.3329 Epoch [²⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.3218 Epoch [²⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.3218 Epoch [²⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.3112 Epoch [²⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.3011 Epoch [²⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.3011 Epoch [²⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.2914 Epoch [²⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.2822 Epoch [²⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.2822 Epoch [²⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.2735 Epoch [³⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.2651 Epoch [³⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.2651 Epoch [³¹⁰⁰⁄₂₀₀₀₀], Loss: 0.2572 Epoch [³²⁰⁰⁄₂₀₀₀₀], Loss: 0.2496 Epoch [³²⁰⁰⁄₂₀₀₀₀], Loss: 0.2496 Epoch [³³⁰⁰⁄₂₀₀₀₀], Loss: 0.2423 Epoch [³⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.2354 Epoch [³⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.2354 Epoch [³⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.2288 Epoch [³⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.2226 Epoch [³⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.2226 Epoch [³⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.2166 Epoch [³⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.2109 Epoch [³⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.2109 Epoch [³⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.2054 Epoch [⁴⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.2003 Epoch [⁴⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.2003 Epoch [⁴¹⁰⁰⁄₂₀₀₀₀], Loss: 0.1953 Epoch [⁴²⁰⁰⁄₂₀₀₀₀], Loss: 0.1906 Epoch [⁴²⁰⁰⁄₂₀₀₀₀], Loss: 0.1906 Epoch [⁴³⁰⁰⁄₂₀₀₀₀], Loss: 0.1861 Epoch [⁴⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.1818 Epoch [⁴⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.1818 Epoch [⁴⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.1777 Epoch [⁴⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.1738 Epoch [⁴⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.1738 Epoch [⁴⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.1700 Epoch [⁴⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.1664 Epoch [⁴⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.1664 Epoch [⁴⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.1630 Epoch [⁵⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.1597 Epoch [⁵⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.1597 Epoch [⁵¹⁰⁰⁄₂₀₀₀₀], Loss: 0.1566 Epoch [⁵²⁰⁰⁄₂₀₀₀₀], Loss: 0.1536 Epoch [⁵²⁰⁰⁄₂₀₀₀₀], Loss: 0.1536 Epoch [⁵³⁰⁰⁄₂₀₀₀₀], Loss: 0.1507 Epoch [⁵⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.1479 Epoch [⁵⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.1479 Epoch [⁵⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.1452 Epoch [⁵⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.1427 Epoch [⁵⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.1427 Epoch [⁵⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.1402 Epoch [⁵⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.1379 Epoch [⁵⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.1379 Epoch [⁵⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.1356 Epoch [⁶⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.1335 Epoch [⁶⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.1335 Epoch [⁶¹⁰⁰⁄₂₀₀₀₀], Loss: 0.1314 Epoch [⁶²⁰⁰⁄₂₀₀₀₀], Loss: 0.1294 Epoch [⁶²⁰⁰⁄₂₀₀₀₀], Loss: 0.1294 Epoch [⁶³⁰⁰⁄₂₀₀₀₀], Loss: 0.1274 Epoch [⁶⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.1256 Epoch [⁶⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.1256 Epoch [⁶⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.1238 Epoch [⁶⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.1220 Epoch [⁶⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.1220 Epoch [⁶⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.1204 Epoch [⁶⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.1188 Epoch [⁶⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.1188 Epoch [⁶⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.1172 Epoch [⁷⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.1157 Epoch [⁷⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.1157 Epoch [⁷¹⁰⁰⁄₂₀₀₀₀], Loss: 0.1143 Epoch [⁷²⁰⁰⁄₂₀₀₀₀], Loss: 0.1129 Epoch [⁷²⁰⁰⁄₂₀₀₀₀], Loss: 0.1129 Epoch [⁷³⁰⁰⁄₂₀₀₀₀], Loss: 0.1115 Epoch [⁷⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.1102 Epoch [⁷⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.1102 Epoch [⁷⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.1089 Epoch [⁷⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.1077 Epoch [⁷⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.1077 Epoch [⁷⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.1065 Epoch [⁷⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.1054 Epoch [⁷⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.1054 Epoch [⁷⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.1043 Epoch [⁸⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.1032 Epoch [⁸⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.1032 Epoch [⁸¹⁰⁰⁄₂₀₀₀₀], Loss: 0.1022 Epoch [⁸²⁰⁰⁄₂₀₀₀₀], Loss: 0.1012 Epoch [⁸²⁰⁰⁄₂₀₀₀₀], Loss: 0.1012 Epoch [⁸³⁰⁰⁄₂₀₀₀₀], Loss: 0.1002 Epoch [⁸⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0992 Epoch [⁸⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0992 Epoch [⁸⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0983 Epoch [⁸⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0974 Epoch [⁸⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0974 Epoch [⁸⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0965 Epoch [⁸⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0957 Epoch [⁸⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0957 Epoch [⁸⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0949 Epoch [⁹⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0941 Epoch [⁹⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0941 Epoch [⁹¹⁰⁰⁄₂₀₀₀₀], Loss: 0.0933 Epoch [⁹²⁰⁰⁄₂₀₀₀₀], Loss: 0.0926 Epoch [⁹²⁰⁰⁄₂₀₀₀₀], Loss: 0.0926 Epoch [⁹³⁰⁰⁄₂₀₀₀₀], Loss: 0.0918 Epoch [⁹⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0911 Epoch [⁹⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0911 Epoch [⁹⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0904 Epoch [⁹⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0898 Epoch [⁹⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0898 Epoch [⁹⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0891 Epoch [⁹⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0885 Epoch [⁹⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0885 Epoch [⁹⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0878 Epoch [¹⁰⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0872 Epoch [¹⁰⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0872 Epoch [¹⁰¹⁰⁰⁄₂₀₀₀₀], Loss: 0.0866 Epoch [¹⁰²⁰⁰⁄₂₀₀₀₀], Loss: 0.0861 Epoch [¹⁰²⁰⁰⁄₂₀₀₀₀], Loss: 0.0861 Epoch [¹⁰³⁰⁰⁄₂₀₀₀₀], Loss: 0.0855 Epoch [¹⁰⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0850 Epoch [¹⁰⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0850 Epoch [¹⁰⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0844 Epoch [¹⁰⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0839 Epoch [¹⁰⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0839 Epoch [¹⁰⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0834 Epoch [¹⁰⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0829 Epoch [¹⁰⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0829 Epoch [¹⁰⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0824 Epoch [¹¹⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0819 Epoch [¹¹⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0819 Epoch [¹¹¹⁰⁰⁄₂₀₀₀₀], Loss: 0.0815 Epoch [¹¹²⁰⁰⁄₂₀₀₀₀], Loss: 0.0810 Epoch [¹¹²⁰⁰⁄₂₀₀₀₀], Loss: 0.0810 Epoch [¹¹³⁰⁰⁄₂₀₀₀₀], Loss: 0.0806 Epoch [¹¹⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0802 Epoch [¹¹⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0802 Epoch [¹¹⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0797 Epoch [¹¹⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0793 Epoch [¹¹⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0793 Epoch [¹¹⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0789 Epoch [¹¹⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0785 Epoch [¹¹⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0785 Epoch [¹¹⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0781 Epoch [¹²⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0778 Epoch [¹²⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0778 Epoch [¹²¹⁰⁰⁄₂₀₀₀₀], Loss: 0.0774 Epoch [¹²²⁰⁰⁄₂₀₀₀₀], Loss: 0.0770 Epoch [¹²²⁰⁰⁄₂₀₀₀₀], Loss: 0.0770 Epoch [¹²³⁰⁰⁄₂₀₀₀₀], Loss: 0.0767 Epoch [¹²⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0763 Epoch [¹²⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0763 Epoch [¹²⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0760 Epoch [¹²⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0756 Epoch [¹²⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0756 Epoch [¹²⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0753 Epoch [¹²⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0750 Epoch [¹²⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0750 Epoch [¹²⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0747 Epoch [¹³⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0744 Epoch [¹³⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0744 Epoch [¹³¹⁰⁰⁄₂₀₀₀₀], Loss: 0.0741 Epoch [¹³²⁰⁰⁄₂₀₀₀₀], Loss: 0.0738 Epoch [¹³²⁰⁰⁄₂₀₀₀₀], Loss: 0.0738 Epoch [¹³³⁰⁰⁄₂₀₀₀₀], Loss: 0.0735 Epoch [¹³⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0732 Epoch [¹³⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0732 Epoch [¹³⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0729 Epoch [¹³⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0726 Epoch [¹³⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0726 Epoch [¹³⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0724 Epoch [¹³⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0721 Epoch [¹³⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0721 Epoch [¹³⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0719 Epoch [¹⁴⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0716 Epoch [¹⁴⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0716 Epoch [¹⁴¹⁰⁰⁄₂₀₀₀₀], Loss: 0.0713 Epoch [¹⁴²⁰⁰⁄₂₀₀₀₀], Loss: 0.0711 Epoch [¹⁴²⁰⁰⁄₂₀₀₀₀], Loss: 0.0711 Epoch [¹⁴³⁰⁰⁄₂₀₀₀₀], Loss: 0.0709 Epoch [¹⁴⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0706 Epoch [¹⁴⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0706 Epoch [¹⁴⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0704 Epoch [¹⁴⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0702 Epoch [¹⁴⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0702 Epoch [¹⁴⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0699 Epoch [¹⁴⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0697 Epoch [¹⁴⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0697 Epoch [¹⁴⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0695 Epoch [¹⁵⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0693 Epoch [¹⁵⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0693 Epoch [¹⁵¹⁰⁰⁄₂₀₀₀₀], Loss: 0.0691 Epoch [¹⁵²⁰⁰⁄₂₀₀₀₀], Loss: 0.0689 Epoch [¹⁵²⁰⁰⁄₂₀₀₀₀], Loss: 0.0689 Epoch [¹⁵³⁰⁰⁄₂₀₀₀₀], Loss: 0.0687 Epoch [¹⁵⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0685 Epoch [¹⁵⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0685 Epoch [¹⁵⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0683 Epoch [¹⁵⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0681 Epoch [¹⁵⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0681 Epoch [¹⁵⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0679 Epoch [¹⁵⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0677 Epoch [¹⁵⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0677 Epoch [¹⁵⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0675 Epoch [¹⁶⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0673 Epoch [¹⁶⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0673 Epoch [¹⁶¹⁰⁰⁄₂₀₀₀₀], Loss: 0.0671 Epoch [¹⁶²⁰⁰⁄₂₀₀₀₀], Loss: 0.0670 Epoch [¹⁶²⁰⁰⁄₂₀₀₀₀], Loss: 0.0670 Epoch [¹⁶³⁰⁰⁄₂₀₀₀₀], Loss: 0.0668 Epoch [¹⁶⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0666 Epoch [¹⁶⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0666 Epoch [¹⁶⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0664 Epoch [¹⁶⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0663 Epoch [¹⁶⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0663 Epoch [¹⁶⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0661 Epoch [¹⁶⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0660 Epoch [¹⁶⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0660 Epoch [¹⁶⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0658 Epoch [¹⁷⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0656 Epoch [¹⁷⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0656 Epoch [¹⁷¹⁰⁰⁄₂₀₀₀₀], Loss: 0.0655 Epoch [¹⁷²⁰⁰⁄₂₀₀₀₀], Loss: 0.0653 Epoch [¹⁷²⁰⁰⁄₂₀₀₀₀], Loss: 0.0653 Epoch [¹⁷³⁰⁰⁄₂₀₀₀₀], Loss: 0.0652 Epoch [¹⁷⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0650 Epoch [¹⁷⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0650 Epoch [¹⁷⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0649 Epoch [¹⁷⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0647 Epoch [¹⁷⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0647 Epoch [¹⁷⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0646 Epoch [¹⁷⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0645 Epoch [¹⁷⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0645 Epoch [¹⁷⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0643 Epoch [¹⁸⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0642 Epoch [¹⁸⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0642 Epoch [¹⁸¹⁰⁰⁄₂₀₀₀₀], Loss: 0.0640 Epoch [¹⁸²⁰⁰⁄₂₀₀₀₀], Loss: 0.0639 Epoch [¹⁸²⁰⁰⁄₂₀₀₀₀], Loss: 0.0639 Epoch [¹⁸³⁰⁰⁄₂₀₀₀₀], Loss: 0.0638 Epoch [¹⁸⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0636 Epoch [¹⁸⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0636 Epoch [¹⁸⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0635 Epoch [¹⁸⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0634 Epoch [¹⁸⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0634 Epoch [¹⁸⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0633 Epoch [¹⁸⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0631 Epoch [¹⁸⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0631 Epoch [¹⁸⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0630 Epoch [¹⁹⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0629 Epoch [¹⁹⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0629 Epoch [¹⁹¹⁰⁰⁄₂₀₀₀₀], Loss: 0.0628 Epoch [¹⁹²⁰⁰⁄₂₀₀₀₀], Loss: 0.0627 Epoch [¹⁹²⁰⁰⁄₂₀₀₀₀], Loss: 0.0627 Epoch [¹⁹³⁰⁰⁄₂₀₀₀₀], Loss: 0.0626 Epoch [¹⁹⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0624 Epoch [¹⁹⁴⁰⁰⁄₂₀₀₀₀], Loss: 0.0624 Epoch [¹⁹⁵⁰⁰⁄₂₀₀₀₀], Loss: 0.0623 Epoch [¹⁹⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0622 Epoch [¹⁹⁶⁰⁰⁄₂₀₀₀₀], Loss: 0.0622 Epoch [¹⁹⁷⁰⁰⁄₂₀₀₀₀], Loss: 0.0621 Epoch [¹⁹⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0620 Epoch [¹⁹⁸⁰⁰⁄₂₀₀₀₀], Loss: 0.0620 Epoch [¹⁹⁹⁰⁰⁄₂₀₀₀₀], Loss: 0.0619 Epoch [²⁰⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0618 Epoch [²⁰⁰⁰⁰⁄₂₀₀₀₀], Loss: 0.0618 Training time: 8.60 seconds1.三种不同的模型可视化方法推荐torchinfo打印summary权重分布可视化 print(model) MLP((fc1): Linear(in_features4, out_features10, biasTrue)(relu): ReLU()(fc2): Linear(in_features10, out_features3, biasTrue) )for name, param in model.named_parameters():print(fParameter name: {name}, Shape: {param.shape}) Parameter name: fc1.weight, Shape: torch.Size([10, 4]) Parameter name: fc1.bias, Shape: torch.Size([10]) Parameter name: fc2.weight, Shape: torch.Size([3, 10]) Parameter name: fc2.bias, Shape: torch.Size([3])import numpy as np weight_data {} for name, param in model.named_parameters():if weight in name:weight_data[name] param.detach().cpu().numpy()fig, axes plt.subplots(1, len(weight_data), figsize(15, 5)) fig.suptitle(Weight Distribution of Layers)for i, (name, weights) in enumerate(weight_data.items()):weights_flat weights.flatten()axes[i].hist(weights_flat, bins50, alpha0.7)axes[i].set_title(name)axes[i].set_xlabel(Weight Value)axes[i].set_ylabel(Frequency)axes[i].grid(True, linestyle–, alpha0.7)plt.tight_layout() plt.subplots_adjust(top0.85) plt.show()print(\n 权重统计信息 )for name, weights in weight_data.items():mean np.mean(weights)std np.std(weights)min_val np.min(weights)max_val np.max(weights)print(f{name}:)print(f 均值: {mean:.6f})print(f 标准差: {std:.6f})print(f 最小值: {min_val:.6f})print(f 最大值: {max_val:.6f})print(- * 30) 权重统计信息

fc1.weight:均值: 0.038066标准差: 0.929686最小值: -2.286270最大值: 2.450587

fc2.weight:均值: -0.023167标准差: 1.232054最小值: -3.803612最大值: 2.585007 ——————————from torchsummary import summarysummary(model, input_size(4,)) —————————————————————-Layer (type) Output Shape Param # Linear-1 [-1, 10] 50ReLU-2 [-1, 10] 0Linear-3 [-1, 3] 33Total params: 83 Trainable params: 83

Non-trainable params: 0

Input size (MB): 0.00 Forward/backward pass size (MB): 0.00 Params size (MB): 0.00 Estimated Total Size (MB): 0.00 —————————————————————-from torchinfo import summarysummary(model, input_size(4, )) Layer (type:depth-idx) Output Shape Param #MLP [3] – ├─Linear: 1-1 [10] 50 ├─ReLU: 1-2 [10] – ├─Linear: 1-3 [3] 33Total params: 83 Trainable params: 83 Non-trainable params: 0 Total mult-adds (M): 0.00Input size (MB): 0.00 Forward/backward pass size (MB): 0.00 Params size (MB): 0.00 Estimated Total Size (MB): 0.002.进度条功能手动和自动写法让打印结果更加美观 from tqdm import tqdm import timewith tqdm(total10) as pbar: for i in range(10):time.sleep(0.5)pbar.update(1) 100%|██████████| ¹⁰⁄₁₀ [00:0500:00, 1.95it/s]from tqdm import tqdm import timewith tqdm(total5, desc下载文件, unit个) as pbar:for i in range(5):time.sleep(1)pbar.update(1) 下载文件: 100%|██████████| ⁵⁄₅ [00:0500:00, 1.01s/个]from tqdm import tqdm import timefor i in tqdm(range(3), desc处理任务, unitepoch):time.sleep(1) 处理任务: 100%|██████████| ³⁄₃ [00:0300:00, 1.01s/epoch]from tqdm import tqdm import timetotal 0 with tqdm(total10, desc累加进度) as pbar:for i in range(1, 11):time.sleep(0.3)total ipbar.update(1)pbar.set_postfix({当前总和: total}) 累加进度: 100%|██████████| ¹⁰⁄₁₀ [00:0300:00, 3.27it/s, 当前总和55]import torch import torch.nn as nn import torch.optim as optim from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.preprocessing import MinMaxScaler import time import matplotlib.pyplot as plt from tqdm import tqdm device torch.device(cuda:0 if torch.cuda.is_available() else cpu) print(f使用设备: {device})iris load_iris() X iris.data y iris.target X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42) scaler MinMaxScaler() X_train scaler.fit_transform(X_train) X_test scaler.transform(X_test) X_train torch.FloatTensor(X_train).to(device) y_train torch.LongTensor(y_train).to(device) X_test torch.FloatTensor(X_test).to(device) y_test torch.LongTensor(y_test).to(device)class MLP(nn.Module):def init(self):super(MLP, self).init()self.fc1 nn.Linear(4, 10)self.relu nn.ReLU()self.fc2 nn.Linear(10, 3)def forward(self, x):out self.fc1(x)out self.relu(out)out self.fc2(out)return outmodel MLP().to(device) criterion nn.CrossEntropyLoss() optimizer optim.SGD(model.parameters(), lr0.01) num_epochs 20000 losses [] epochs [] start_time time.time()with tqdm(totalnum_epochs, desc训练进度, unitepoch) as pbar:for epoch in range(num_epochs):outputs model(X_train)loss criterion(outputs, y_train)optimizer.zero_grad()loss.backward()optimizer.step()if (epoch 1) % 200 0:losses.append(loss.item())epochs.append(epoch 1)pbar.set_postfix({Loss: f{loss.item():.4f}})if (epoch 1) % 1000 0:pbar.update(1000)if pbar.n num_epochs:pbar.update(num_epochs - pbar.n)time_all time.time() - start_time print(fTraining time: {time_all:.2f} seconds) 使用设备: cpu训练进度: 100%|██████████| ²⁰⁰⁰⁰⁄₂₀₀₀₀ [00:0800:00, 2395.41epoch/s, Loss0.0608]Training time: 8.35 seconds3.推理的写法评估模式 model.eval()with torch.no_grad():outputs model(Xtest), predicted torch.max(outputs, 1)correct (predicted y_test).sum().item()accuracy correct / y_test.size(0)print(f测试集准确率: {accuracy * 100:.2f}%) 测试集准确率: 96.67%作业调整模型定义时的超参数对比下效果。 import torch import torch.nn as nn import torch.optim as optim from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.preprocessing import MinMaxScaler import time import matplotlib.pyplot as plt from tqdm import tqdm device torch.device(cuda:0 if torch.cuda.is_available() else cpu) print(f使用设备: {device}\n)iris load_iris() X iris.data y iris.target X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42) scaler MinMaxScaler() X_train scaler.fit_transform(X_train) X_test scaler.transform(X_test) X_train torch.FloatTensor(X_train).to(device) y_train torch.LongTensor(y_train).to(device) X_test torch.FloatTensor(X_test).to(device) y_test torch.LongTensor(y_test).to(device)class MLP_Original(nn.Module):def init(self):super(MLP_Original, self).init()self.fc1 nn.Linear(4, 10)self.relu nn.ReLU()self.fc2 nn.Linear(10, 3)def forward(self, x):out self.fc1(x)out self.relu(out)out self.fc2(out)return outclass MLP_Larger(nn.Module):def init(self):super(MLP_Larger, self).init()self.fc1 nn.Linear(4, 20)self.relu nn.ReLU()self.fc2 nn.Linear(20, 10)self.fc3 nn.Linear(10, 3)def forward(self, x):out self.fc1(x)out self.relu(out)out self.fc2(out)out self.relu(out)out self.fc3(out)return outclass MLP_Smaller(nn.Module):def init(self):super(MLP_Smaller, self).init()self.fc1 nn.Linear(4, 5)self.relu nn.ReLU()self.fc2 nn.Linear(5, 3)def forward(self, x):out self.fc1(x)out self.relu(out)out self.fc2(out)return outclass MLP_Tanh(nn.Module):def init(self):super(MLP_Tanh, self).init()self.fc1 nn.Linear(4, 10)self.act nn.Tanh()self.fc2 nn.Linear(10, 3)def forward(self, x):out self.fc1(x)out self.act(out)out self.fc2(out)return outdef train_and_evaluate(model_class, optimizer_class, lr, num_epochs20000):model model_class().to(device)criterion nn.CrossEntropyLoss()optimizer optimizer_class(model.parameters(), lrlr)losses []epochs []start_time time.time()with tqdm(totalnum_epochs, descf训练 {model_class.name}, unitepoch) as pbar:for epoch in range(num_epochs):outputs model(X_train)loss criterion(outputs, y_train)optimizer.zero_grad()loss.backward()optimizer.step()if (epoch 1) % 200 0:losses.append(loss.item())epochs.append(epoch 1)pbar.set_postfix({Loss: f{loss.item():.4f}})if (epoch 1) % 1000 0:pbar.update(1000)if pbar.n num_epochs:pbar.update(num_epochs - pbar.n)time_all time.time() - start_timewith torch.no_grad():outputs model(Xtest), predicted torch.max(outputs.data, 1)accuracy (predicted y_test).sum().item() / y_test.size(0)print(f{model_class.name} 训练时间: {time_all:.2f}秒, 测试准确率: {accuracy:.4f}\n)return epochs, losses, accuracyconfigs [(MLP_Original, optim.SGD, 0.01),(MLP_Larger, optim.SGD, 0.01),(MLP_Smaller, optim.SGD, 0.01),(MLP_Tanh, optim.SGD, 0.01),(MLP_Original, optim.Adam, 0.001),(MLP_Original, optim.SGD, 0.1),(MLP_Original, optim.SGD, 0.001) ]plt.figure(figsize(12, 8)) for config in configs:epochs, losses, accuracy train_and_evaluate(*config)plt.plot(epochs, losses, labelf{config[0].name} {config[1].name} lr{config[2]} (Acc:{accuracy:.2f}))plt.xlabel(Epoch) plt.ylabel(Loss) plt.title(Training Loss Comparison with Different Hyperparameters) plt.legend() plt.grid(True) plt.show() 使用设备: cpu训练 MLP_Original: 100%|██████████| ²⁰⁰⁰⁰⁄₂₀₀₀₀ [00:0800:00, 2347.88epoch/s, Loss0.0629]MLP_Original 训练时间: 8.52秒, 测试准确率: 0.9667训练 MLP_Larger: 100%|██████████| ²⁰⁰⁰⁰⁄₂₀₀₀₀ [00:1000:00, 1848.93epoch/s, Loss0.0480]MLP_Larger 训练时间: 10.82秒, 测试准确率: 1.0000训练 MLP_Smaller: 100%|██████████| ²⁰⁰⁰⁰⁄₂₀₀₀₀ [00:0800:00, 2366.75epoch/s, Loss0.1377]MLP_Smaller 训练时间: 8.45秒, 测试准确率: 0.9667训练 MLP_Tanh: 100%|██████████| ²⁰⁰⁰⁰⁄₂₀₀₀₀ [00:0800:00, 2326.77epoch/s, Loss0.0646]MLP_Tanh 训练时间: 8.60秒, 测试准确率: 0.9667训练 MLP_Original: 100%|██████████| ²⁰⁰⁰⁰⁄₂₀₀₀₀ [00:1300:00, 1468.79epoch/s, Loss0.0466]MLP_Original 训练时间: 13.62秒, 测试准确率: 1.0000训练 MLP_Original: 100%|██████████| ²⁰⁰⁰⁰⁄₂₀₀₀₀ [00:0800:00, 2334.48epoch/s, Loss0.0468]MLP_Original 训练时间: 8.57秒, 测试准确率: 1.0000训练 MLP_Original: 100%|██████████| ²⁰⁰⁰⁰⁄₂₀₀₀₀ [00:0800:00, 2334.72epoch/s, Loss0.4256]MLP_Original 训练时间: 8.57秒, 测试准确率: 0.9000浙大疏锦行

四川市网站建设视频弹幕网站怎么做的

fc1.weight:均值: 0.038066标准差: 0.929686最小值: -2.286270最大值: 2.450587

Non-trainable params: 0

相关文章

四川石油天然气建设工程有限责任公司网站企业网站制作策划书

四川省住房建设厅网站app开发哪个公司好

四川省住房和城乡建设厅网站发wordpress中文官网

四川外国语大学网站建设系想找人做网站怎么了解

四川网站建设公司登录厦门网页搜索排名提升

四川网站建设哪家专业建设网站公司建网页

成都网站开发收费定制网站制作广州

成都网站开发培训网站上的百度地图标注咋样做

成都网站开发工资百度竞价产品

成都网站建设招标企业网络推广运营技巧

成都网站建设优点项目

成都网站建设赢展网络架构种类

四川市网站建设视频弹幕网站怎么做的

fc1.weight:均值: 0.038066标准差: 0.929686最小值: -2.286270最大值: 2.450587

Non-trainable params: 0

相关文章

四川石油天然气建设工程有限责任公司网站企业网站制作策划书

四川省住房建设厅网站app开发哪个公司好

四川省住房和城乡建设厅网站发wordpress中文官网

四川外国语大学网站建设系想找人做网站怎么了解

四川网站建设公司 登录厦门网页搜索排名提升

四川网站建设哪家专业建设网站公司建网页

成都网站开发收费定制网站制作广州

成都网站开发培训网站上的百度地图标注咋样做

成都网站开发工资百度竞价产品

成都网站建设招标企业网络推广运营技巧

成都网站建设优点项目

成都网站建设赢展网络架构种类

四川网站建设公司登录厦门网页搜索排名提升