harrytea

ustc

Hefei, China
  • 首页
  • 归档
  • 分类
  • 标签
  • 项目
  • 关于

公告

python学习记录

分类

  • blog4
  • config2
  • docker4
  • html1
  • huggingface6
  • imageprocess14
  • linux18
  • nlp2
  • nn.functional4
  • numpy7
  • paperreading25
  • python26
  • pytorch52
  • statistic11
  • torch.nn7
  • torch.operator6
  • torchvision2
  • utils8
  • visual5
  • vscode2
  • wordpress4

标签

  • attention5
  • bash1
  • bert2
  • blog5
  • conda3
  • docker6
  • frp1
  • git5
  • github3
  • google1
  • huggingface5
  • ide1
  • jupyter1
  • linux23
  • llm1
  • matlab1
  • matplotlib4
  • mmlab2
  • nlp8
  • numpy7
  • opencv12
  • paperreading7
  • python126
  • pytorch70
  • ssh3
  • torch2
  • torchvision2
  • transform1
  • transformer6
  • ubuntu5
  • vscode4
  • warmup2
  • wget1
  • wordpress4
  • zotero1
  • 人工智能12
  • 分布式2
  • 前端3
  • 原创120
  • 机器学习12
  • 计算机视觉40

标签云

attention bash bert blog conda docker frp git github google huggingface ide jupyter linux llm matlab matplotlib mmlab nlp numpy opencv paperreading python pytorch ssh torch torchvision transform transformer ubuntu vscode warmup wget wordpress zotero 人工智能 分布式 前端 原创 机器学习 计算机视觉

归档

  • 一月 20241
  • 十二月 202310
  • 十一月 20233
  • 八月 20231
  • 七月 20234
  • 六月 20238
  • 五月 202312
  • 四月 20232
  • 三月 202312
  • 二月 20235
  • 一月 20236
  • 十二月 20222
  • 十一月 20221
  • 十月 20223
  • 九月 20223
  • 八月 202212
  • 七月 20226
  • 四月 20222
  • 三月 20226
  • 二月 202219
  • 一月 202212
  • 十二月 20218
  • 十一月 202122
  • 十月 202151
  • 九月 20211

最新文章

  • pytorch

    pytorch中输出模型参数名和梯度的一些操作

    2024-01-17

  • paperreading

    LLaMA源码解读

    2023-12-22

  • paperreading

    LoRA代码解析

    2023-12-21

  • pytorch

    pytorch获取网络中的模块和参数

    2023-12-21

  • paperreading

    Qwen-VL代码解析

    2023-12-20

pytorch中输出模型参数名和梯度的一些操作

1月 17 pytorch python, pytorch 评论 字数统计: 37(字) 阅读时长: 1(分)

LLaMA源码解读

12月 22 paperreading paperreading, 原创 评论 字数统计: 941(字) 阅读时长: 4(分)

LoRA代码解析

12月 21 paperreading paperreading, 原创 评论 字数统计: 631(字) 阅读时长: 2(分)

pytorch获取网络中的模块和参数

12月 21 pytorch python, pytorch, 计算机视觉 评论 字数统计: 633(字) 阅读时长: 3(分)

Qwen-VL代码解析

12月 20 paperreading paperreading, 原创 评论 字数统计: 1.2k(字) 阅读时长: 4(分)

Monkey论文阅读

12月 19 paperreading paperreading, 原创 评论 字数统计: 1.4k(字) 阅读时长: 5(分)

MiniGPT-v2代码解析

12月 18 paperreading paperreading, 原创 评论 字数统计: 1.6k(字) 阅读时长: 6(分)

MiniGPT-4代码解析

12月 18 paperreading paperreading, 原创 评论 字数统计: 1.3k(字) 阅读时长: 4(分)

Hexo基本设置

12月 14 blog git, github, 前端 评论 字数统计: 570(字) 阅读时长: 2(分)

BLIP-2代码解析

12月 13 paperreading paperreading, 原创 评论 字数统计: 299(字) 阅读时长: 1(分)

  • 上一页
  • 下一页
Page 1 of 22
Theme by cofess base on pure.
文章
pytorch中输出模型参数名和梯度的一些操作

1. 输出参数名字的一些操作 输出需要梯度的参数的名字 123for n,p in self.lm_head.named_parameters(): if p.requires_grad == True: print(n)

LLaMA源码解读

1. LLaMA源码解读 这里以Huggingface中的LLaMA源码为例,LLaMA是一个因果模型,不论是做下游任务(例如分类等)还是生成任务,我们都要使用其中的LlamaModel模型作为base模型,此模型的就是初始化词向量以及Transformer模块,下面我们从LlamaModel源码开

LoRA代码解析

1. LoRA论文解读 这里先不解读了,直接看Microsoft的代码 2. LoRA代码解析 lora代码最初由微软GitHub提供,我对代码进行了精简,可以在这里下载lora,此代码主要为了学习使用,方便理解lora的整个流程。 这里以NLG任务中的e2e数据集为例 2.1 对数据的预处理 如下

pytorch获取网络中的模块和参数

1. pytorch获取网络结构 在写深度学习程序时,我们通常要将网络打印出来查看网络结构,一个最简单的方法就是直接print(model)来打印模型结构,这里我们以下面程序为例 1234567891011121314151617181920212223242526272829import torc

Qwen-VL代码解析

c Qwen-VL: A Versatile Vision-Language Model for Understanding, Localization, Text Reading, and Beyond. Alibaba Group 1.1 论文动机 本文是在Qwen-LM的基础上进行改的,本文的

页面
分类
Repositories
标签
(未命名)

​— title: about date: 2022-07-30 17:05:33 layout: about ​—

分类
pytorchpytorch
paperreadingpaperreading
blogblog
huggingfacehuggingface
torch.nntorch-nn
标签
pythonpython
pytorchpytorch
原创原创
paperreadingpaperreading
计算机视觉计算机视觉