包含关键字分层学习率的文章 - 科学空间|Scientific Spaces

30 Nov

用热传导方程来指导自监督学习

By 苏剑林 | 2022-11-30 | 29473位读者 | 引用

用理论物理来卷机器学习已经不是什么新鲜事了，比如上个月介绍的《生成扩散模型漫谈（十三）：从万有引力到扩散模型》就是经典一例。最近一篇新出的论文《Self-Supervised Learning based on Heat Equation》，顾名思义，用热传导方程来做（图像领域的）自监督学习，引起了笔者的兴趣。这种物理方程如何在机器学习中发挥作用？同样的思路能否迁移到NLP中？让我们一起来读读论文。

基本方程

如下图，左边是物理中热传导方程的解，右端则是CAM、积分梯度等显著性方法得到的归因热力图，可以看到两者有一定的相似之处，于是作者认为热传导方程可以作为好的视觉特征的一个重要先验。

热方程的热力图（左）和视觉模型的热力图（右）

点击阅读全文...

分类：信息时代标签：物理, 无监督阅读全文 9 评论

18 Jun

OCR技术浅探：3. 特征提取(1)

By 苏剑林 | 2016-06-18 | 55719位读者 | 引用

作为OCR系统的第一步，特征提取是希望找出图像中候选的文字区域特征，以便我们在第二步进行文字定位和第三步进行识别. 在这部分内容中，我们集中精力模仿肉眼对图像与汉字的处理过程，在图像的处理和汉字的定位方面走了一条创新的道路. 这部分工作是整个OCR系统最核心的部分，也是我们工作中最核心的部分.

传统的文本分割思路大多数是“边缘检测 + 腐蚀膨胀 + 联通区域检测”，如论文[1]. 然而，在复杂背景的图像下进行边缘检测会导致背景部分的边缘过多(即噪音增加)，同时文字部分的边缘信息则容易被忽略，从而导致效果变差. 如果在此时进行腐蚀或膨胀，那么将会使得背景区域跟文字区域粘合，效果进一步恶化.（事实上，我们在这条路上已经走得足够远了，我们甚至自己写过边缘检测函数来做这个事情，经过很多测试，最终我们决定放弃这种思路。）

因此，在本文中，我们放弃了边缘检测和腐蚀膨胀，通过聚类、分割、去噪、池化等步骤，得到了比较良好的文字部分的特征，整个流程大致如图2，这些特征甚至可以直接输入到文字识别模型中进行识别，而不用做额外的处理.由于我们每一部分结果都有相应的理论基础作为支撑，因此能够模型的可靠性得到保证.

图2：特征提取大概流程

点击阅读全文...

分类：信息时代标签：图像, OCR, 特征, 聚类, 文字阅读全文 9 评论

17 Apr

梯度视角下的LoRA：简介、分析、猜测及推广

By 苏剑林 | 2023-04-17 | 70822位读者 | 引用

随着ChatGPT及其平替的火热，各种参数高效（Parameter-Efficient）的微调方法也“水涨船高”，其中最流行的方案之一就是本文的主角LoRA了，它出自论文《LoRA: Low-Rank Adaptation of Large Language Models》。LoRA方法上比较简单直接，而且也有不少现成实现，不管是理解还是使用都很容易上手，所以本身也没太多值得细写的地方了。

然而，直接实现LoRA需要修改网络结构，这略微麻烦了些，同时LoRA给笔者的感觉是很像之前的优化器AdaFactor，所以笔者的问题是：能否从优化器角度来分析和实现LoRA呢？本文就围绕此主题展开讨论。

方法简介

以往的一些结果（比如《Exploring Aniversal Intrinsic Task Subspace via Prompt Tuning》）显示，尽管预训练模型的参数量很大，但每个下游任务对应的本征维度（Intrinsic Dimension）并不大，换句话说，理论上我们可以微调非常小的参数量，就能在下游任务取得不错的效果。

LoRA借鉴了上述结果，提出对于预训练的参数矩阵$W_0\in\mathbb{R}^{n\times m}$，我们不去直接微调$W_0$，而是对增量做低秩分解假设：
\begin{equation}W = W_0 + A B,\qquad A\in\mathbb{R}^{n\times r},B\in\mathbb{R}^{r\times m}\end{equation}

点击阅读全文...

分类：数学研究标签：梯度, 优化器, 低秩, lora 阅读全文 34 评论

16 Aug

澳大利亚网站请您向外星人问好

By 苏剑林 | 2009-08-16 | 17557位读者 | 引用

图片说明：Gliese581d模拟图，最小的那个弧形亮点就是它

如果真有外星人存在，你想对他说什么？

赶紧准备好要说的话，登录澳大利亚一个网站写下来。据英国《每日电讯报》日前报道，该网站将把信息传递到外太空，让外星人“听”见你的问候。

点击阅读全文...

分类：天文探索标签：转载, 网站, 外星人, 澳大利亚阅读全文抢沙发

5 Apr

【生物总结】到细胞内旅游

By 苏剑林 | 2010-04-05 | 25337位读者 | 引用

人类（高加索人种）男性与女性

这篇文章是上学期期末老师要求我们写的生物总结，我不想写得太古板，索性趣味大发了....给大家学习生物做一下参考，有任何意见尽管提出！

每当我们坐在镜子前仔细的端详着自己时，我们会发现自己是多么的普通，而又有众多的独特。使得，即使放眼于自然，我们也是平凡的，但也是“非凡”的。我们还有另外一个名词：生命。

点击阅读全文...

分类：生物自然标签：细胞, 生物阅读全文 1 评论

27 Jun

威力巨大的“有向线段”

By 苏剑林 | 2010-06-27 | 20312位读者 | 引用

向量

向量，又称矢量，定义为线性空间中需要大小和方向才能完整表示的一个量。而对于我们来说，还是使用最简单的概念比较合适：向量就是“有向线段”。向量这一概念，来源于物理，而又不仅仅应用于物理。向量的出现，使得几何学和物理学的发展又多了一个强有力的工具，记得有一句这样的话：“对数的出现，延长了天文学家的寿命。”而我可以毫不夸张地说，向量的发展，也在不断地延长着数学家和物理学家的寿命！

点击阅读全文...

分类：数学研究标签：向量, 矢量, 几何阅读全文抢沙发

24 Oct

扬帆——在宇宙的海洋中航行

By 苏剑林 | 2010-10-24 | 22034位读者 | 引用

以下内容来源于《天文爱好者》杂志2010年10期（作者庞统，责任编辑李良）。
作为消息通告和交流学习所用，请勿用于商业或其他非法用途
ikaros图片版权：ISAS / JAXA；其余来自互联网搜索得到。

2010年5月21曰，日本用H-2A火箭成功发射了耗资15亿曰元（合1600万美元）的“伊卡洛斯”太阳帆，以检验它是否能够利用太阳能实现加速飞行，从而拉开了研制和发射太阳帆式新型推进航天器高潮的序幕。2010年9月和年底，美国还将先后发射纳帆-D2和光帆-1太阳帆。

ikaros

点击阅读全文...

分类：天文探索标签：探测器, 转载, 辐射, 航天, 太阳帆, 光压, 光子阅读全文抢沙发

27 Nov

《自然极值》系列——1.前言

By 苏剑林 | 2010-11-27 | 52165位读者 | 引用

附：期中考过后，课程紧了，自由时间少了，因此科学空间的更新也放缓了。不过BoJone也会尽量地更新一些内容，和大家一同分享学习的乐趣。

闭区间[a,b]上的连续函数?(x)，其最大值为红色点，最小值为蓝色点

上一周和这一周的时间里，BoJone将自己学习物理和极值的一些内容进行了总结和整合，写成了《自然极值》一文。因此从今天起，到十二月的大多数时间里，科学空间将和大家讲述并讨论关于“极值”的问题，希望读者会喜欢这部分内容。当然，我不是专业的研究人员，更不是经验丰富的物理和数学教师，甚至可以说是一个“乳臭未干的小子”，因此，错误在所难免，只希望同好不吝指出，更希冀能够起到我抛出的这一块“砖”能够引出美妙的“玉”。

点击阅读全文...

分类：数学研究标签：物理, 极值, 自然阅读全文 8 评论

关于站长

苏剑林|BoJone，科学空间博主，【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者（但不专业）......目前31岁，还在单调递增。希望能一直在此分享科学之美～

你也许会关心：

科学空间|Scientific Spaces 介绍

科学空间QQ交流群：67729435

科学空间微信交流群：spaces_ac_cn

常见问题集：《科学空间FAQ》

智能搜索

支持整句搜索！网站自动使用结巴分词进行分词，并结合ngrams排序算法给出合理的搜索结果。

SEARCH

MENU

CATEGORIES

NEWPOSTS

COMMENTS

USERLOGIN

科学空间|Scientific Spaces

用热传导方程来指导自监督学习

基本方程

OCR技术浅探：3. 特征提取(1)

梯度视角下的LoRA：简介、分析、猜测及推广

方法简介

澳大利亚网站请您向外星人问好

【生物总结】到细胞内旅游

威力巨大的“有向线段”

扬帆——在宇宙的海洋中航行

《自然极值》系列——1.前言

关于站长

智能搜索

热门标签

随机文章

最近评论

友情链接