正则化

2021-10-04 statistic 人工智能, 原创, 机器学习 0 评论字数统计: 542(字) 阅读时长: 1(分)

一、正则化

在统计机器学习中，我们常常希望将我们的变量或者权重进行一定的约束，假设我们的模型为y=ax+b，我们希望对a加以限制，一般有两种选择：

注意这两种选择中要求的值都是，而不是，所以对进行了约束

约束问题：对a的取值加以限制，然后用最小二乘法进行求解，分为等式约束、大小于号约束

constraint form:

其中，

无约束问题：同时对最小二乘法和参数a进行最小化

Unconstrained form:

其中，

约束与无约束问题的解区别在于的分母是否有，进行正则化的原因是希望引入额外的信息能够帮助解决不适定的问题

二、约束问题

1. 转化为广义拉格朗日函数

考虑一个最优化问题，对于任意的，原始问题可以表述为

我们引入广义拉格朗日函数，其中：

将上述公式进行转化为，其中表示原始问题：

考虑极小值问题，注意此问题与等价，问题被称为广义拉格朗日函数的极小极大问题，定义其最优解：

2. 引入对偶解拉格朗日函数

对偶问题：

注意对偶问题和上述问题不同，上述问题是求的最大值，这里是求最小值

考虑极大值问题，问题被称为广义拉格朗日函数的极大极小问题，定义其最优解：

3. 拉格朗日与其对偶问题的关系

上面我们已经写出了拉格朗日问题的最优解以及其对偶问题的最优解，二者关系：

上述关系是弱对偶条件，当““成立时，变成强对偶条件，此时，可以用此结论来通过求解对偶问题得到拉格朗日函数的答案

对于可微函数，在KKT条件下强对偶成立，此时：

**KKT条件：**分为三种，一种是无约束，一种是等式约束，另一种是不等式约束

本文链接： https://harrytea.netlify.app/2021/10/04/正则化/

版权声明： 本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处！

harryteaustc

computer vision

Error: API rate limit exceeded for 18.204.137.164. (But here's the good news: Authenticated requests get a higher rate limit. Check out the documentation for more details.)

文章

pytorch中输出模型参数名和梯度的一些操作

1. 输出参数名字的一些操作输出需要梯度的参数的名字 123for n,p in self.lm_head.named_parameters(): if p.requires_grad == True: print(n)

LLaMA源码解读

1. LLaMA源码解读这里以Huggingface中的LLaMA源码为例，LLaMA是一个因果模型，不论是做下游任务（例如分类等）还是生成任务，我们都要使用其中的LlamaModel模型作为base模型，此模型的就是初始化词向量以及Transformer模块，下面我们从LlamaModel源码开

LoRA代码解析

1. LoRA论文解读这里先不解读了，直接看Microsoft的代码 2. LoRA代码解析 lora代码最初由微软GitHub提供，我对代码进行了精简，可以在这里下载lora，此代码主要为了学习使用，方便理解lora的整个流程。这里以NLG任务中的e2e数据集为例 2.1 对数据的预处理如下

pytorch获取网络中的模块和参数

1. pytorch获取网络结构在写深度学习程序时，我们通常要将网络打印出来查看网络结构，一个最简单的方法就是直接print(model)来打印模型结构，这里我们以下面程序为例 1234567891011121314151617181920212223242526272829import torc

Qwen-VL代码解析

c Qwen-VL: A Versatile Vision-Language Model for Understanding, Localization, Text Reading, and Beyond. Alibaba Group 1.1 论文动机本文是在Qwen-LM的基础上进行改的，本文的

页面

分类

Repositories

标签

(未命名)

— title: about date: 2022-07-30 17:05:33 layout: about —

分类

pytorchpytorch

paperreadingpaperreading

blogblog

huggingfacehuggingface

torch.nntorch-nn

标签

pythonpython

pytorchpytorch

原创原创

paperreadingpaperreading

计算机视觉计算机视觉