30 Nov

用热传导方程来指导自监督学习

用理论物理来卷机器学习已经不是什么新鲜事了,比如上个月介绍的《生成扩散模型漫谈(十三):从万有引力到扩散模型》就是经典一例。最近一篇新出的论文《Self-Supervised Learning based on Heat Equation》,顾名思义,用热传导方程来做(图像领域的)自监督学习,引起了笔者的兴趣。这种物理方程如何在机器学习中发挥作用?同样的思路能否迁移到NLP中?让我们一起来读读论文。

基本方程

如下图,左边是物理中热传导方程的解,右端则是CAM积分梯度等显著性方法得到的归因热力图,可以看到两者有一定的相似之处,于是作者认为热传导方程可以作为好的视觉特征的一个重要先验。

热方程的热力图(左)和视觉模型的热力图(右)

热方程的热力图(左)和视觉模型的热力图(右)

点击阅读全文...

18 Jun

OCR技术浅探:3. 特征提取(1)

作为OCR系统的第一步,特征提取是希望找出图像中候选的文字区域特征,以便我们在第二步进行文字定位和第三步进行识别. 在这部分内容中,我们集中精力模仿肉眼对图像与汉字的处理过程,在图像的处理和汉字的定位方面走了一条创新的道路. 这部分工作是整个OCR系统最核心的部分,也是我们工作中最核心的部分.

传统的文本分割思路大多数是“边缘检测 + 腐蚀膨胀 + 联通区域检测”,如论文[1]. 然而,在复杂背景的图像下进行边缘检测会导致背景部分的边缘过多(即噪音增加),同时文字部分的边缘信息则容易被忽略,从而导致效果变差. 如果在此时进行腐蚀或膨胀,那么将会使得背景区域跟文字区域粘合,效果进一步恶化.(事实上,我们在这条路上已经走得足够远了,我们甚至自己写过边缘检测函数来做这个事情,经过很多测试,最终我们决定放弃这种思路。)

因此,在本文中,我们放弃了边缘检测和腐蚀膨胀,通过聚类、分割、去噪、池化等步骤,得到了比较良好的文字部分的特征,整个流程大致如图2,这些特征甚至可以直接输入到文字识别模型中进行识别,而不用做额外的处理.由于我们每一部分结果都有相应的理论基础作为支撑,因此能够模型的可靠性得到保证.

图2:特征提取大概流程

图2:特征提取大概流程

点击阅读全文...

17 Apr

梯度视角下的LoRA:简介、分析、猜测及推广

随着ChatGPT及其平替的火热,各种参数高效(Parameter-Efficient)的微调方法也“水涨船高”,其中最流行的方案之一就是本文的主角LoRA了,它出自论文《LoRA: Low-Rank Adaptation of Large Language Models》。LoRA方法上比较简单直接,而且也有不少现成实现,不管是理解还是使用都很容易上手,所以本身也没太多值得细写的地方了。

然而,直接实现LoRA需要修改网络结构,这略微麻烦了些,同时LoRA给笔者的感觉是很像之前的优化器AdaFactor,所以笔者的问题是:能否从优化器角度来分析和实现LoRA呢?本文就围绕此主题展开讨论。

方法简介

以往的一些结果(比如《Exploring Aniversal Intrinsic Task Subspace via Prompt Tuning》)显示,尽管预训练模型的参数量很大,但每个下游任务对应的本征维度(Intrinsic Dimension)并不大,换句话说,理论上我们可以微调非常小的参数量,就能在下游任务取得不错的效果。

LoRA借鉴了上述结果,提出对于预训练的参数矩阵$W_0\in\mathbb{R}^{n\times m}$,我们不去直接微调$W_0$,而是对增量做低秩分解假设:
\begin{equation}W = W_0 + A B,\qquad A\in\mathbb{R}^{n\times r},B\in\mathbb{R}^{r\times m}\end{equation}

点击阅读全文...

16 Aug

澳大利亚网站请您向外星人问好

图片说明:Gliese581d模拟图,最小的那个弧形亮点就是它

图片说明:Gliese581d模拟图,最小的那个弧形亮点就是它

如果真有外星人存在,你想对他说什么?

赶紧准备好要说的话,登录澳大利亚一个网站写下来。据英国《每日电讯报》日前报道,该网站将把信息传递到外太空,让外星人“听”见你的问候。

点击阅读全文...

5 Apr

【生物总结】到细胞内旅游

人类(高加索人种)男性与女性

人类(高加索人种)男性与女性

这篇文章是上学期期末老师要求我们写的生物总结,我不想写得太古板,索性趣味大发了....给大家学习生物做一下参考,有任何意见尽管提出!

每当我们坐在镜子前仔细的端详着自己时,我们会发现自己是多么的普通,而又有众多的独特。使得,即使放眼于自然,我们也是平凡的,但也是“非凡”的。我们还有另外一个名词:生命。

点击阅读全文...

27 Jun

威力巨大的“有向线段”

向量

向量

向量,又称矢量,定义为线性空间中需要大小和方向才能完整表示的一个量。而对于我们来说,还是使用最简单的概念比较合适:向量就是“有向线段”。向量这一概念,来源于物理,而又不仅仅应用于物理。向量的出现,使得几何学和物理学的发展又多了一个强有力的工具,记得有一句这样的话:“对数的出现,延长了天文学家的寿命。”而我可以毫不夸张地说,向量的发展,也在不断地延长着数学家和物理学家的寿命!

点击阅读全文...

24 Oct

扬帆——在宇宙的海洋中航行

以下内容来源于《天文爱好者》杂志2010年10期(作者庞统,责任编辑李良)。
作为消息通告和交流学习所用,请勿用于商业或其他非法用途
ikaros图片版权:ISAS / JAXA;其余来自互联网搜索得到。

2010年5月21曰,日本用H-2A火箭成功发射了耗资15亿曰元(合1600万美元)的“伊卡洛斯”太阳帆,以检验它是否能够利用太阳能实现加速飞行,从而拉开了研制和发射太阳帆式新型推进航天器高潮的序幕。2010年9月和年底,美国还将先后发射纳帆-D2和光帆-1太阳帆。

ikaros

ikaros

点击阅读全文...

27 Nov

《自然极值》系列——1.前言

附:期中考过后,课程紧了,自由时间少了,因此科学空间的更新也放缓了。不过BoJone也会尽量地更新一些内容,和大家一同分享学习的乐趣。

闭区间[a,b]上的连续函数?(x),其最大值为红色点,最小值为蓝色点

闭区间[a,b]上的连续函数?(x),其最大值为红色点,最小值为蓝色点

上一周和这一周的时间里,BoJone将自己学习物理和极值的一些内容进行了总结和整合,写成了《自然极值》一文。因此从今天起,到十二月的大多数时间里,科学空间将和大家讲述并讨论关于“极值”的问题,希望读者会喜欢这部分内容。当然,我不是专业的研究人员,更不是经验丰富的物理和数学教师,甚至可以说是一个“乳臭未干的小子”,因此,错误在所难免,只希望同好不吝指出,更希冀能够起到我抛出的这一块“砖”能够引出美妙的“玉”。

点击阅读全文...