24 May

《虚拟的实在(1)》——为什么需要场?

迈克尔·法拉第肖像画

迈克尔·法拉第肖像画

这段时间我接触的物理学都是场论,从各种方面为广义相对论奠基。自我感觉,我的数学基础还算可以的,但是物理“底蕴”就不够了,通常是能够把物理理论的数学描述看懂,但是对每一步的物理基础和来源却不甚了解,真是“数学有余而物理不足”呀。陶醉在场论的海洋一段时间之后,对场论也有了个大概的印象。但是有一个最基础的问题,直到今天我才算是得到了比较满意的解答——为什么要引入场?

在传统的牛顿力学中并没有“场”这一概念,比如天体力学我们只需要考虑天体之间的相互作用力就可以完美解决很多问题,根本不需要场。估计广大读者首次接触到“场”的概念是在高中学习电学的时候,那时教科书给我们带来了电场、场线等诸多诡异的概念。事实上就是如此,可以这样说,历史上“场”是为了电磁学而诞生的——法拉第首次引入的场线具有独特的魅力。

点击阅读全文...

1 Jul

与首都机场的“难分难舍”

无尽的等待

无尽的等待

上个月的最后三天(06.28-06.30),我去国家天文台参加了第三届宇宙驿站的站长联谊会及科普研讨会。会议在河北兴隆天文台举行,我们按照计划是先到北京总部,然后去兴隆,然后回到北京总部解散。具体的故事我会另写文章与大家分享,本文主要想说一下我与北京首都国际机场的“难分难舍”的返程之旅。

按照计划,我是昨晚9点的飞机,今天凌晨应该可以到广州。我七点多到机场,八点左右就办完了登记手续,然而,我们等了两三个钟,最终得到的结果是:由于雷暴雨的影响(北京并没有下雨,估计是途中某个地方的上空天气太糟糕),该航班取消,补到第二天七点......这对我来说可真是个大考验。虽说航空公司会为我们联系宾馆,但是效率之低让不少人在机场抗议,于是乎冰冷的机场一下子就热闹起来的(取消的不知我们一趟航班,还有很多其他航班)。而我虽然来过好几次北京,毕竟还属于“异客”,自然经验不足,但我做出了一个很大胆的决定:在机场过夜!

点击阅读全文...

18 May

简明条件随机场CRF介绍(附带纯Keras实现)

笔者去年曾写过博文《果壳中的条件随机场(CRF In A Nutshell)》,以一种比较粗糙的方式介绍了一下条件随机场(CRF)模型。然而那篇文章显然有很多不足的地方,比如介绍不够清晰,也不够完整,还没有实现,在这里我们重提这个模型,将相关内容补充完成。

本文是对CRF基本原理的一个简明的介绍。当然,“简明”是相对而言中,要想真的弄清楚CRF,免不了要提及一些公式,如果只关心调用的读者,可以直接移到文末。

图示

按照之前的思路,我们依旧来对比一下普通的逐帧softmax和CRF的异同。

逐帧softmax

CRF主要用于序列标注问题,可以简单理解为是给序列中的每一帧都进行分类,既然是分类,很自然想到将这个序列用CNN或者RNN进行编码后,接一个全连接层用softmax激活,如下图所示

逐帧softmax并没有直接考虑输出的上下文关联

逐帧softmax并没有直接考虑输出的上下文关联

点击阅读全文...

21 May

厨房,菜市场,其实都是武林

蒜蓉蒸虾-准备-20180520

蒜蓉蒸虾-准备-20180520

蒜蓉蒸虾-出锅-20180520

蒜蓉蒸虾-出锅-20180520

我喜欢吃东西,不过我一般是怀着欣赏的眼光来吃,并不是特别吃货的那种。我更喜欢的是做吃的,喜欢食物“从菜市场到出炉”的华丽变身的那种过程,我认为这是生活必备的一部分。

点击阅读全文...

6 Sep

【NASA每日一图】微波背景辐射双极化

图片说明:微波背景辐射,版权:DMR, COBE, NASA, Four-Year Sky Map

图片说明:微波背景辐射,版权:DMR, COBE, NASA, Four-Year Sky Map

点击阅读全文...

1 Jan

科学空间:2011年1月重要天象

与前两年相比,即将到来的2011年,天空剧场似乎略显沉寂。全年都缺少观测条件较好的日食,几大著名的流星雨观测条件也普遍较差。然而年初的象限仪流星雨将会是个例外,并且当天还会有一次日偏食上演。此外,一月金星、水星这两颗地内行星的观测条件都不错。可以说,2011年的多数精彩天象将集中出现在年初的几天。当然,世界上并不缺少精彩,只是需要发现精彩的眼睛,新的一年里,我们的天象预报还将继续做您的眼睛,带您探寻、发现天空的精彩。

天象动态:

01日 金星距太阳: 46.8° W
02日 02:07 月合心宿二: 2.6° S
02日 22:32 水星合月: 4° N
04日 03:59 地球过近日点: 0.9833 AU
04日 09:14 象限仪座流星雨: ZHR = 120
04日 16:52 日偏食
08日 22:59 金星大距: 47° W
09日 21:59 水星大距: 23.3° W
15日 20:39 月合昴宿星团: 1.3° N
29日 07:53 月合心宿二: 2.7° S
30日 00:26 月球过最南点: 24.2° S
30日 11:36 金星合月: 3.7° N

点击阅读全文...

6 Jun

闲聊:神经网络与深度学习

神经网络

神经网络

在所有机器学习模型之中,也许最有趣、最深刻的便是神经网络模型了。笔者也想献丑一番,说一次神经网络。当然,本文并不打算从头开始介绍神经网络,只是谈谈我对神经网络的个人理解。如果希望进一步了解神经网络与深度学习的朋友,请移步阅读下面的教程:
http://deeplearning.stanford.edu/wiki/index.php/UFLDL教程

http://blog.csdn.net/zouxy09/article/details/8775360

机器分类

这里以分类工作为例,数据挖掘或机器学习中,有很多分类的问题,比如讲一句话的情况进行分类,粗略点可以分类为“积极”或“消极”,精细点分为开心、生气、忧伤等;另外一个典型的分类问题是手写数字识别,也就是将图片分为10类(0,1,2,3,4,5,6,7,8,9)。因此,也产生了很多分类的模型。

点击阅读全文...

1 Jul

从Boosting学习到神经网络:看山是山?

前段时间在潮州给韩师的同学讲文本挖掘之余,涉猎到了Boosting学习算法,并且做了一番头脑风暴,最后把Boosting学习算法的一些本质特征思考清楚了,而且得到一些意外的结果,比如说AdaBoost算法的一些理论证明也可以用来解释神经网络模型这么强大。

AdaBoost算法

Boosting学习,属于组合模型的范畴,当然,与其说它是一个算法,倒不如说是一种解决问题的思路。以有监督的分类问题为例,它说的是可以把弱的分类器(只要准确率严格大于随机分类器)通过某种方式组合起来,就可以得到一个很优秀的分类器(理论上准确率可以100%)。AdaBoost算法是Boosting算法的一个例子,由Schapire在1996年提出,它构造了一种Boosting学习的明确的方案,并且从理论上给出了关于错误率的证明。

以二分类问题为例子,假设我们有一批样本$\{x_i,y_i\},i=1,2,\dots,n$,其中$x_i$是样本数据,有可能是多维度的输入,$y_i\in\{1,-1\}$为样本标签,这里用1和-1来描述样本标签而不是之前惯用的1和0,只是为了后面证明上的方便,没有什么特殊的含义。接着假设我们已经有了一个弱分类器$G(x)$,比如逻辑回归、SVM、决策树等,对分类器的唯一要求是它的准确率要严格大于随机(在二分类问题中就是要严格大于0.5),所谓严格大于,就是存在一个大于0的常数$\epsilon$,每次的准确率都不低于$\frac{1}{2}+\epsilon$

点击阅读全文...