Aayu Yain = 学无止境 = 世界上大部分事，都没太大意义。真理与热爱除外

2023-07-25 2.8k 字 3 分钟

K折交叉验证和F1-Score学习笔记

# 前言最近在做模型评估，看到有论文涉及到 18 折交叉验证和 F1 分数以及宏观 F1 分数，有点被搞晕了，遂查了些资料，记录于此 # K 折交叉验证 K 折交叉验证实际上可以有两种功能，模型选择，和模型评估。参考：N 折交叉验证的作用（如何使用交叉验证）重点如下： N 折交叉验证有两个用途：模型评估、模型选择。 N 折交叉只是一种划分数据集的策略 **。**...

more...

2023-07-20 7.2k 字 7 分钟

B 站视频：《十分钟讲解 Matplotlib 的核心内容与基本逻辑》 Matplotlib_examples.ipynb # 入门 # 基本设置 import matplotlib.pyplot as pltimport numpy as np# 一些基本设置# 设置支持中文字体（黑体）matplotlib.rcParams['font.family'] = ['SimHei']matplotlib.rcParams['axes.unicode_minus'] = False# 设置图片清晰度（200dpi: 200...

more...

2023-07-19 9.8k 字 9 分钟

PyTorch学习笔记（8）迁移学习实战

# 原理迁移学习可以通过小数据量样本对模型进行微调，达到针对小数据量数据集更好的拟合效果 # 训练 / 验证 / 测试集伪代码流程 # 代码实战 # 自定义数据集 import torchimport os, globimport random, csvfrom torch.utils.data import Dataset, DataLoaderfrom torchvision import transformsfrom PIL import Imageclass Pokemon(Dataset): def __init__(self, root, resize, mode):...

more...

2023-07-19 4.6k 字 4 分钟

PyTorch学习笔记（7）ResNet实战

# Lenet5 网络模型 import torchfrom torch import nnfrom torch.nn import functional as Fclass Lenet5(nn.Module): """ for cifar10 dataset. """ def __init__(self): super(Lenet5, self).__init__() self.conv_unit = nn.Sequential( # x: [b, 3, 32, 32] => [b, 16, ] nn.Conv2d(3,...

more...

2023-07-19 8.1k 字 7 分钟

PyTorch学习笔记（6）卷积神经网络

# 什么是卷积神经网络注意，是把一个 kernel 里的三个窗口做完运算后生成的三个值累加起来，得到新的 feature map。对于下一层有 16 个通道，则是把一个 kernel 里的 16 个窗口做完运算后生成的 16 个值累加起来，算作一个新的 feature。 # 代码示例 # 类风格 API # 函数风格 API ‍ # 池化层和采样 # 池化层最大池化：取 kernel 里的最大值平均池化：取 kernel 里的平均值 # 上采样将特征图放大 # BatchNorm # Image Normalization 这里的均值和方差是统计了数百万张图片在 RGB...

more...

2023-07-18 1k 字 1 分钟

PyTorch学习笔记（5）过拟合问题

# 过拟合问题 # 欠拟合当 train acc. is bad 并且 test acc. is bad as well 可以认为是欠拟合，但现在神经网络的学习能力太强了，所以这种问题不常见 # 过拟合当 train loss and acc. is much better 但是 test acc. is worse 就是过拟合，也就是泛化能力 Generalization Performance 不够，所以目前的主要问题就是如何缓解过拟合问题 # 训练 / 验证 / 测试集的划分对于测试集，我们不能做任何事情，所以通常来说将训练集划分为训练集和验证集 #...

more...

2023-07-18 9.7k 字 9 分钟

PyTorch学习笔记（4）神经网络与全连接层

# Logistic Regression # Q1 why not maximize accuracy? acc.=∑I(predi==yi)len(Y)acc.=\frac{\sum I\left(pred_{i}==y_{i}\right)}{len\left(Y\right)} acc.=len(Y)∑I(predi==yi) 如果最小化 accuracy，会造成 gradient = 0 的现象。因为用 sigmoid 做激活函数，小于 0.5 判断为 0，大于 0.5 判断为 1，如果参数 w 从 0.4 提升到...

more...

2023-07-17 3.3k 字 3 分钟

PyTorch学习笔记（3）随机梯度下降

# 常见函数的梯度 # 基础导数 derivative 偏微分 partial derivative 梯度 gradient ∇f=(∂f∂x1;∂f∂x2;…;∂f∂xn)\nabla f=\left(\frac{\partial f}{\partial x_1};\frac{\partial f}{\partial x_2};\ldots;\frac{\partial f}{\partial...

more...

2023-07-17 1.9k 字 2 分钟

PyTorch学习笔记（2）

# Broadcasting 自动扩展维度语法糖 # 关键点 A 和 B 张量做 broadcasting，如果 B 前面缺失一个维度，则自动在前面插入一个维度插入的维度大小为 1，接下来会自动将其维度大小为 1 的维度扩张到和 A 张量相同位置维度一样的大小例子：Bias [32, 1, 1] -> [1, 32, 1, 1] -> [4, 32, 14, 14] 所以 broadcasting 的本质就是 unsqueeze + expand # 案例 for actual demanding [class, students,...

more...

2023-07-16 2k 字 2 分钟

PyTorch学习笔记（1）

# 基本数据类型 # 基本数据类型 # 常用类型 FloatTensor DoubleTensor ByteTensor IntTensor LongTensor # 标量常用来表示 Loss # 一维张量有三种方式：给定内容生成一维张量给定维度大小生成一维张量从 np 中得到一维张量常用于 Bias 神经元的偏置，和 Linear Input # 二维张量 dim、size () 和 shape 的区分。对于一个维度为 [2, 2] 这样的张量，它的： dim 为 2，也就是数学上的 Rank，秩； size () 和 shape...

more...