标签: 神经网络

Xenny原创2024/4/16大约 4 分钟

在之前的网络中我们都是在关心层与层之间的协作，同层节点之间是无连接状态，信息按顺序从上一层到下一层，这种网络如果要处理一些上下文强关联的问题便显得无能为力。例如在NLP中要预测下一个单词则需要处理前文包含的各种特征，此时提出了一种新的神经网络，循环神经网络（Recurrent Neural Network，RNN），它对于序列化数据有很强的拟合能力。

延迟器

在RNN隐藏层之中的节点不再是相互独立的，每个节点将包含三部分输入数据

上一层的输出、自身上一时刻输出、上一节点输出。

RNN网络结构

可以看到隐藏层中的节点不仅有来自输入层的连接，还有节点之间的自连和互连。
其中节点的自连接代表节点的输出会再次作为节点的输入，但这并不是马上完成的，数据会经过延迟器在下一时刻再进入该节点。

也就是说在RNN中包含了对时序特征的处理，对于同一数据根据其前文不同也将得到不同的输出。这也便是RNN中最重要的特征，通过引入延迟器来让网络模型包含“记忆”。
延迟器只是一个虚拟单元，也称为RNN的记忆单元，它的作用便是保存上一次的节点状态信息，每次节点计算时将使用上一次的状态信息参与进行并更新状态，可以理解为一个动态偏置，状态信息的计算与神经元计算类似，它也包含权重参数
$s_t = f(\boldsymbol{w}x_t + \boldsymbol{v}s_{t-1})$
其中 $t$ 代表时刻信息， $f$ 是一个非线性激活函数， $\boldsymbol{w},\boldsymbol{v}$ 分别为输入的权重参数和状态的权重参数。

Xenny原创2024/4/16大约 4 分钟

Xenny原创2024/4/15大约 10 分钟

在神经网络基本概念中已经介绍了感知机的概念，它是使用神经元进行二分类线性分类模型，本质也就是计算输入特征的线性组合 $\boldsymbol{wx} + b$ 来对样本进行分类。在训练过程中通过不断的修正参数来找到一个能够正确对样本进行分类的超平面（决策边界） $\boldsymbol{wx} + b=0$ 。我们已经了解了感知机的基本结果以及工作流程，同时我们也知道感知机只能对线性可分的数据进行分类，而对线性不可分的数据无法处理。而多层感知机正是为了处理这一问题而提出的。

Xenny原创2024/4/14大约 3 分钟

这个函数我们已经很熟悉了，它又称为S形函数，能够将输入压缩到 $(0,1)$ 中并且处处连续可导，输出非常平滑。

函数表达式为
$\Lambda(z) = \frac{1}{1+e^{-z}}$
其中 $(0, 0.5)$ 是函数中心点。虽然该函数在ML中应用广泛，但在神经网络模型中有些情况下并不是一个最好的选择，由于数据的不同，该函数可能会引起如下问题。

Xenny原创2024/4/10大约 6 分钟

Xenny原创2024/4/10大约 4 分钟

神经网络特指人工神经网络（Artificial Neural Networks），其通过模拟人类大脑的工作方式而来。大脑以大量神经元（神经细胞）为基本单位，通过神经元与神经元之间的接触产生一个神经网络。

神经元之间的连接

当大脑思考时，各个树突会收到其他神经元发出的电化学信号，当信号强度达到某个临界值时便产生新的电化学进行沿着轴突继续传递给新的神经元。也就是每个神经元都类似一个门结构，当收到足够多的信号时便继续向后传递信号。
而我们的ANN便是模拟这个过程，使用ANN模拟大脑神经网络时候，只需对每个“神经元”设置它收到的输入权重，自身的阈值和激活后的输出即可。

Xenny原创2024/4/9大约 8 分钟