生成扩散模型漫谈(二十七):将步长作为条件输入
By 苏剑林 | 2024-12-15 | 9265位读者 | 引用这篇文章我们再次聚焦于扩散模型的采样加速。众所周知,扩散模型的采样加速主要有两种思路,一是开发更高效的求解器,二是事后蒸馏。然而,据笔者观察,除了上两篇文章介绍过的SiD外,这两种方案都鲜有能将生成步数降低到一步的结果。虽然SiD能做到单步生成,但它需要额外的蒸馏成本,并且蒸馏过程中用到了类似GAN的交替训练过程,总让人感觉差点意思。
本文要介绍的是《One Step Diffusion via Shortcut Models》,其突破性思想是将生成步长也作为扩散模型的条件输入,然后往训练目标中加入了一个直观的正则项,这样就能直接稳定训练出可以单步生成模型,可谓简单有效的经典之作。
ODE扩散
原论文的结论是基于ODE式扩散模型的,而对于ODE式扩散的理论基础,我们在本系列的(六)、(十二)、(十四)、(十五)、(十七)等博客中已经多次介绍,其中最简单的一种理解方式大概是(十七)中的ReFlow视角,下面我们简单重复一下。
有理直角三角形的面积能否为整数?
By 苏剑林 | 2011-08-21 | 39080位读者 | 引用这是一个古老而有趣的问题,但在引入这个问题之前,我们首先来看一个简单的问题:
整数边直角三角形的面积能否为一个完全平方数?
答案是不能。我们可以举一些例子来检验一下,例如边长为3,4,5的直角三角形面积为6,6不是一个平方数;再如边长为5,12,13的直角三角形面积为30,30也不是一个平方数...当然,数学的最近目的是要求严格证明,而不是简单举例,否则就只得称为不完全归纳,这样得出来的是一个猜想,而不是“定理”,就好象著名的“哥德巴赫猜想”...本文我们将试图证明这个命题。
我们稍后还会发现,这个问题和以下问题是等价的:
是否存在一个面积为1的三边长都是有理数的直角三角形?
更让人意外的是,这个问题也等价于方程$x^4+y^4=z^4$并没有整数解,换句话说,我们要证明n=4时的“费马大定理”!
数学竞赛广东预赛|组成三角形的概率
By 苏剑林 | 2011-09-12 | 59681位读者 | 引用九月三日BoJone和九个同学到云浮参加了今年广东省的数学竞赛预赛,那一起出发、玩笑、作战、吃饭的情景依然历历在目,让我久久不能忘怀。是呀,能够并肩作战的感觉真好!九日数学成绩出来了,遗憾的是今年政策改变了,我被告知整个市只有三个名额能够参加复赛,于是新兴只有我一个人进入了复赛(另外两个据说是罗定的,我们三个并列第一)。有点无语,我想,大概是要把那些为了功利而参赛的人都给刷下去吧...
今年广东的预赛题前所未有的简单,不论是和全国其他地方相比还是和上一年的题目相比,都简单了不少,但我还是做得不大理想,据我估计,120分的卷子我顶多能够拿个68分,所以BoJone的基本技能实在不容乐观。从云浮考试回来后,和同行的同学讨论试题,得出了一些很有趣的结果,那过程可谓其乐无穷呀!下面是倒数第二题预赛题的几个绝妙解法,供大家欣赏。解法由我和伍泽麒(人称“兔子、神兔”,人如其名,天资聪颖,性格可爱)完成。
题目:
在一条线段中随意选取两个点,把这条线段截成三段,求这三段线段能够组成一个三角形的概率。
开学啦!咱们来做完形填空~(讯飞杯)
By 苏剑林 | 2017-09-03 | 207631位读者 | 引用前言
从今年开始,CCL会议将计划同步举办评测活动。笔者这段时间在一创业公司实习,公司也报名参加这个评测,最后实现上就落在我这里,今年的评测任务是阅读理解,名曰《第一届“讯飞杯”中文机器阅读理解评测》。虽说是阅读理解,但事实上任务比较简单,是属于完形填空类型的,即一段材料中挖了一个空,从上下文中选一个词来填入这个空中。最后我们的模型是单系统排名第6,验证集准确率为73.55%,测试集准确率为75.77%,大家可以在这里观摩排行榜。(“广州火焰信息科技有限公司”就是文本的模型)
事实上,这个数据集和任务格式是哈工大去年提出的,所以这次的评测也是哈工大跟科大讯飞一起联合举办的。哈工大去年的论文《Consensus Attention-based Neural Networks for Chinese Reading Comprehension》就研究过另一个同样格式但不同内容的数据集,是用通用的阅读理解模型做的(通用的阅读理解是指给出材料和问题,从材料中找到问题的答案,完形填空可以认为是通用阅读理解的一个非常小的子集)。
虽然,在这次评测任务的介绍中,评测方总有意无意地引导我们将这个问题理解为阅读理解问题。但笔者觉得,阅读理解本身就难得多,这个就一完形填空,只要把它作为纯粹的完形填空题做就是了,所以本文仅仅是采用类似语言模型的做法来做。这种做法的好处是思路简明直观,计算量低(在笔者的GTX1060上可以跑到batch size为160),便于实验。
模型
回到模型上,我们的模型其实比较简单,完全紧扣了“从上下文中选一个词来填空”这一思想,示意图如下。
你跳绳的时候,想过绳子的形状曲线是怎样的吗?
By 苏剑林 | 2019-07-06 | 50848位读者 | 引用科学空间:2009年10月重要天象
By 苏剑林 | 2009-09-20 | 33153位读者 | 引用9月意味着秋的到来,而十月更加是秋高气爽的季节,这样的气候对于天文爱好者来说是莫大的喜讯。而中秋和国庆的同喜,则更加令人高兴。在此提前祝愿大家国庆快乐、中秋快乐!大家想好去哪里玩了吗?
在玩之前,不妨关注下10月的天象。近期主要有三个方面的星象可供天文爱好者们观测,其中包含两场流星雨、行星合月和行星相合。喜欢拍照的朋友一定会喜欢的。
主要天象:
◆10月◆ 太阳由室女座运行到天秤座
03日 中秋快乐!
06日 水星西大距
08日 月掩昴星团;水星合土星
09日 天龙座流星雨极大(00:40, ZHR=20)
12日 月掩火星
13日 金星合土星
14日 金星合木星
18日 双子座ε流星雨极大(ZHR=2)
21日 月掩心宿二;猎户座流星雨极大(ZHR=30)
23日 小狮座流星雨极大(ZHR=2)
27日 木星合月
科学空间:2010年9月重要天象
By 苏剑林 | 2010-08-30 | 21987位读者 | 引用《自然极值》系列——4.费马点问题
By 苏剑林 | 2010-11-28 | 89852位读者 | 引用通过上面众多的文字描述,也许你还不大了解这两个原理有何美妙之处,也或者你已经迫不及待地想去应用它们却不知思路。为了不至于让大家产生“审美疲劳”,接下来我们将试图利用这两个原理对费马点问题进行探讨,看看原理究竟是怎么发挥作用的。运用的关键在于:如何通过适当的变换将其与光学或势能联系起来。
传统费马点问题是指在ΔABC中寻找点P,使得$AP+BP+CP$最小的问题;而广义的费马点则改成使$k_1 AP+k_2 BP+k_3 CP$最小。这是很具有现实意义的,是“在三个村庄之间建立一个中转站,如何才能使运送成为最低”之类的最优问题。我们将从光学和势能两个角度对这个问题进行探讨(也许有的读者已经阅读过了利用重力的原理来求解费马点,但是我想光学的方法依然会是你眼前一亮的。)
最近评论