29 Dec

SquarePlus:可能是运算最简单的ReLU光滑近似

ReLU函数,也就是$\max(x,0)$,是最常见的激活函数之一,然而它在$x=0$处的不可导通常也被视为一个“槽点”。为此,有诸多的光滑近似被提出,比如SoftPlus、GeLU、Swish等,不过这些光滑近似无一例外地至少都使用了指数运算$e^x$(SoftPlus还用到了对数),从“精打细算”的角度来看,计算量还是不小的(虽然当前在GPU加速之下,我们很少去感知这点计算量了)。最近有一篇论文《Squareplus: A Softplus-Like Algebraic Rectifier》提了一个更简单的近似,称为SquarePlus,我们也来讨论讨论。

需要事先指出的是,笔者是不建议大家花太多时间在激活函数的选择和设计上的,所以虽然分享了这篇论文,但主要是提供一个参考结果,并充当一道练习题来给大家“练练手”。

定义

SquarePlus的形式很简单,只用到了加、乘、除和开方:
\begin{equation}\text{SquarePlus}(x)=\frac{x+\sqrt{x^2+b}}{2}\end{equation}

点击阅读全文...

30 Jul

冥王星呀,你究竟是什么?

Stephen Battersby 文 Shea 编译

太阳系中有多少颗行星?官方的回答是八颗——除非你碰巧住在美国伊利诺斯州。2009年初,“目中无人”的伊利诺斯州政府宣布,为”行星”制定标准的国际天文学联合会(IAU)其实是不公正地剥夺了冥王星的”行星”头衔。

三年前,IAU决定为“行星”一词起草首个科学上的定义。

在捷克首都布拉格召开的IAU大会上经过数天的激烈争论,与会代表投票通过了一个行星的定义。根据这个定义,冥王星被排除在了行星的行列之外,降级为“矮行星”。

[图片说明]:冥王星系统的想象画。

[图片说明]:冥王星系统的想象画。

点击阅读全文...

31 Oct

《新理解矩阵2》:矩阵是什么?

上一篇文章中我从纯代数运算的角度来讲述了我对矩阵的一个理解,可以看到,我们赋予了矩阵相应的运算法则,它就在代数、分析等领域显示出了巨大作用。但是纯粹的代数是不足够的,要想更加完美,最好是找到相应的几何对象能够与之对应,只有这样,我们才能够直观地理解它,以达到得心应手的效果。

几何理解

我假设读者已经看过孟岩的《理解矩阵》三篇文章,所以更多的细节我就不重复了。我们知道,矩阵A

$$\begin{pmatrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix}$$

事实上由两个向量$[a_{11},a_{21}]^T$和$[a_{12},a_{22}]^T$(这里的向量都是列向量)组成,它描述了一个平面(仿射)坐标系。换句话说,这两个向量其实是这个坐标系的两个基,而运算$y=Ax$则是告诉我们,在$A$这个坐标系下的x向量,在$I$坐标系下是怎样的。这里的$I$坐标系就是我们最常用的直角坐标系,也就是说,任何向量(包括矩阵里边的向量),只要它前面没有矩阵作用于它,那么它都是在直角坐标系下度量出来的。

点击阅读全文...

18 Aug

世界各国能否联手应对气候变化?

笔者:这一次的翻译有点乱,不过先不管这个,说说内容。


会议、会议、会议......关于气候问题的会议不断,但是仍然没有达到一个很好的共识,而气候恶化却在不断地进行中,而且情况越来越严峻。抑制温室效应的其它途径又未成熟......解决气候变化,路在何方?

点击阅读全文...

28 Nov

《自然极值》系列——3.平衡态公理

黄果树大瀑布

黄果树大瀑布

光学定律无疑是一个美妙的原理,而自然界中还存在另外一个我们随处可见的“公理”。平时的生活中,我们总能看见“水往低处流”的现象,这是因为水处于地球重力场的结果(也正因为如此,某些轻生者的自杀活动才得以顺利进行;当然,我们并不需要为了验证这一点而亲自试验。)。由此我们可以联想到一个名词:重力势能。“水往低处流”意味着什么呢?高度变低了。高度更低意味着什么呢?重力势能降低了!换句话说,自然界中物体有趋于势能最低的倾向。我们可以从这个角度来解释:体系总有趋于稳定的倾向,而拥有的能量(势能)越高,则越不稳定。

点击阅读全文...

30 Jun

今天傍晚出现了彩虹

今天傍晚看到了彩虹!当然这算不上什么奇观,但还是一道美丽的风景。

人说“不经历风雨,怎么见彩虹”,我发现彩虹不一定是在雨后的,今天我看彩虹的时候,就是暴风雨前夕。彩虹是在18点10分左右出现的,持续了5分钟左右吧,看着看着,雨越下越大,我被迫停止欣赏了,不过彩虹也随之消失了。

用一个老相机简单记录了一下这道亮丽的风景!这是我第一次拍摄彩虹^_^

不知道是相机问题还是真有其事,在照片上发现有两条彩虹。难道这次的彩虹是”双彩虹“?那可真是奇观了!


很老的家用数码相机,没有广角,不能拍摄全景,这是用photoshop把两张图片拼凑起来的,效果不好

点击阅读全文...

2 Dec

相对运动的一道妙题!

这是在《200道物理学难题》中的第五道题,题目看起来没有什么特色,但是解法却非常巧妙:

四只蜗牛在做匀速直线运动(速度各不同),它们的运动轨迹是两两相交的直线,但是没有三条直线交于一点,也就是说他们的轨迹有六个交点。在它们之间,已经发生了五次相遇,问第六次相遇是否一定发生?换句话说,有没有可能只发生五次相遇的?

点击阅读全文...

27 Dec

费曼路径积分思想的发展(四)

4、量子场论中的泛函方法

路径积分出现之初,大多数物理学家反映都很冷淡,甚至怀疑它的正确性。这一方面是对路径积分方法的陌生与误解所致。在泊珂淖会议上,玻尔就把费曼图误解成粒子运动的轨迹,并对之进行了尖锐的批评。([19],P.459)另一方面,费曼并没有用公理化的方法,从作用量或拉格朗日量出发系统地推导出费曼规则,他是靠经验、猜测、检验和比较来给出与各种图相应的规则的。尽管如此,费曼却能把他的方法推广到当时热门的介子理论,并且只需一个晚上就可解决他人用正则哈密顿方法要用几个月的时间才能解决的问题。费曼方法的有效性,使戴逊大为惊讶,并促使他相信路径积分“必定是根本上正确的”([1],P.54)理论。随之,戴逊便决定把“理解费曼(的思想)并用一种他人能理解的语言来加以阐述”([1],p.54)作为自己的主要工作。1948年,戴逊成功地证明了朝永振一朗、施温格和费曼三人的理论“在其共同适用领域内”[25]的等价性。费曼的粒子图像的路径积分方法由此改头换面,变成了场论形式的泛函积分方法。

点击阅读全文...