包含关键字极大似然估计的文章 - 科学空间|Scientific Spaces

18 May

基于量子化假设推导模型的尺度定律（Scaling Law）

By 苏剑林 | 2023-05-18 | 33524位读者 | 引用

尺度定律（Scaling Law），指的是模型能力与模型尺度之间的渐近关系。具体来说，模型能力我们可以简单理解为模型的损失函数，模型尺度可以指模型参数量、训练数据量、训练步数等，所谓尺度定律，就是研究损失函数跟参数量、数据量、训练步数等变量的大致关系。《Scaling Laws for Neural Language Models》、《Training Compute-Optimal Large Language Models》等工作的实验结果表明，神经网络的尺度定律多数呈现“幂律（Power law）”的形式。

为什么会是幂律呢？能否从理论上解释呢？论文《The Quantization Model of Neural Scaling》基于“量子化”假设给出了一个颇为有趣的推导。本文一同来欣赏一下。

点击阅读全文...

分类：数学研究,信息时代标签：模型, 分析, 量子, 尺度阅读全文 13 评论

13 Nov

【生活杂记】炒锅的尽头是铁锅

By 苏剑林 | 2023-11-13 | 54009位读者 | 引用

铁锅（网络图）

很多会下厨的同学估计都纠结过一件事情，那就是炒锅的选择。

对于炒锅的纠结，归根结底是不粘与方便的权衡。最简单的不粘锅自然是带涂层的不粘锅，如果家里的热源只有电磁炉，并且炒菜习惯比较温和，那么涂层不粘锅往往是最佳选择了。不过，一旦有了明火的燃气灶，又或者是比较喜欢爆炒，那么涂层锅可能就不是那么适合了，毕竟温度过高涂层总有脱落的风险，此时一般就考虑无涂层不粘锅。

无涂层不粘锅也有五花八门的选择，比如朴素的铁锅、带蜂窝纹的不锈钢锅、有钛锅、纯钛锅等等，价格大体上也单调递增。不过用到最后，我觉得大部分人都会回归到朴素的铁锅。

点击阅读全文...

分类：生活/情感标签：生活, 厨房, 美食阅读全文 18 评论

26 Sep

利用“熄火保护 + 通断器”实现燃气灶智能关火

By 苏剑林 | 2024-09-26 | 13062位读者 | 引用

燃气灶智能化主要有两个方向：一是检测开关火状态，实现跟抽油烟机等其他设备的联动；二是实现智能关火，这包括定时关火以及接入米家（或者其他智能家居）实现语音关火、远程关火等。目前带有这两点功能的燃气灶选择并不多，并且相比普通燃气灶贵不少，单纯为了这两点功能而换一个新燃气灶并不划算，所以就出现了一些将普通燃气灶智能化的的魔改方案。

接入方案示意图

本文主要分享基于燃气灶自带的熄火保护装置，利用通断器将燃气灶接入米家，实现智能关火功能。

点击阅读全文...

分类：生活/情感标签：生活, 智能家居, 米家阅读全文 3 评论

30 Aug

折腾windows 8和ubuntu 12

By 苏剑林 | 2012-08-30 | 20698位读者 | 引用

这是一篇用Windows 8完成的文章。

快开学了，华师2号就要报道了，所以就提前入手一台手提电脑，联想Z575AM-ASI，四千元的AMD，4核，64位机器。

我的台式机已经是六年前的产品了，联想的家悦系列，只有512MB内存。所以相比之下，这新机器配置还过得去吧，对于CPU，我个人还是倾向于AMD的，因为我的那台家悦台式也是AMD的CPU，所以对它很有好感。新兴的联想专卖店没有AMD手提，所以还得提前向他们预订。

Windows8

手提本身没有预装操作系统，专卖店很随手地为我装了一个win7，而且还只是ghost版本的，时不时会卡死，感觉很不好，刚好前些日子在网上开始发布Windows8了，所以就马上把Win7格掉，装上Windows8了。安装过程很顺利，由于还没有正式发布，所以还没有激活，这段时间纯粹体验中。等正式版发布了，再计划买一个正版光盘吧

点击阅读全文...

分类：生活/情感标签：linux, 纪念, 系统, 计算机阅读全文 1 评论

19 Jul

太阳中心的压强和温度

By 苏剑林 | 2010-07-19 | 31447位读者 | 引用

太阳

为了准备IOAA，同时也加深对天体物理的理解，所以就系统地学习一下天体物理学了。今天看到“太阳”这一章，并由此简单估算了一下太阳的中心压强和温度。

天体物理学给出了关于恒星结构的一些方程。假设存在一颗各项同性的球形恒星，则有
$\frac{dm(r)}{dr}=4\pi r^2 \rho(r)$————质量方程
其中m(r)是与恒星球心距离为r的一个球形区域内的总质量，$\rho(r)$是距离球心r处的物质的密度。我们也可以写成积分的形式
$$m(r)=\int_0^R 4\pi r^2 \rho(r)dr$$
其中R是恒星半径。这个方程的意思其实就是每一个壳层的质量叠加，所以就不详细推导了。

点击阅读全文...

分类：天文探索标签：恒星, 太阳, 压强, 温度, 流体阅读全文抢沙发

27 Apr

[备忘]历史天气查询

By 苏剑林 | 2013-04-27 | 52716位读者 | 引用

天气预报查询我相信大家用过不少了，如果精度要求不高，那么随便打开谷歌输入“城市名+tq”就可以查询到了。可是你有没有想过过去的天气怎么查询呢？比如我要研究最近十年的气候变化，我想得到最近十年每天的天气数据（最高温、最低温等等），那要怎么查呢？

我在很早以前就想查询到这些数据，但是在网上随便搜索了一下，无果，所以一直搁置着。前两天一个同学问我同样的问题，所以就查找了一番，功夫不负有心人，终于找到了。原来关键字应该是“历史天气查询”（之前我搜索了很多关键字，比如“气象数据下载”、“气象统计”等等，都没有搜索到有用的结果）。

一个支持历史天气查询的中文网站是：
http://lishi.tianqi.com/

点击阅读全文...

分类：问题百科标签：网站, 历史, 天气阅读全文 1 评论

11 May

AdaX优化器浅析（附开源实现）

By 苏剑林 | 2020-05-11 | 33181位读者 | 引用

这篇文章简单介绍一个叫做AdaX的优化器，来自《AdaX: Adaptive Gradient Descent with Exponential Long Term Memory》。介绍这个优化器的原因是它再次印证了之前在《AdaFactor优化器浅析（附开源实现）》一文中提到的一个结论，两篇文章可以对比着阅读。

Adam & AdaX

AdaX的更新格式是
\begin{equation}\left\{\begin{aligned}&g_t = \nabla_{\theta} L(\theta_t)\\
&m_t = \beta_1 m_{t-1} + \left(1 - \beta_1\right) g_t\\
&v_t = (1 + \beta_2) v_{t-1} + \beta_2 g_t^2\\
&\hat{v}_t = v_t\left/\left(\left(1 + \beta_2\right)^t - 1\right)\right.\\
&\theta_t = \theta_{t-1} - \alpha_t m_t\left/\sqrt{\hat{v}_t + \epsilon}\right.
\end{aligned}\right.\end{equation}
其中$\beta_2$的默认值是$0.0001$。对了，顺便附上自己的Keras实现：https://github.com/bojone/adax

点击阅读全文...

分类：信息时代标签：优化器阅读全文 7 评论

3 Oct

不在家的国庆

By 苏剑林 | 2013-10-03 | 14875位读者 | 引用

在生活上，我是一个比较传统的人，因此每到节日我都会尽量回家跟家人团聚。也许会让大家比较吃惊的是，今年的国庆是我第一个不在家的国庆。的确，从小学到高中，上学的地方离家都比较近，每周回去一次都是不成问题的。现在来到了广州，就不能太随心了。虽然跟很多同学相比，我离家还是比较近的，但是来回也要考虑车费、时间等等。国庆假期时间虽然很长，但是中秋已经回去一趟了，所以我决定国庆就不再回去了。

对我来说，中秋跟国庆相比，中秋的意义更大些。所以我选择了国庆不回家。对家人而言，看到自己平安就好，因此哪一天回去他们都会很高兴，当然，对于农村人来说，中秋的味道更浓，更希望团聚。

点击阅读全文...

分类：生活/情感标签：生活, 珍惜阅读全文抢沙发

关于站长

苏剑林|BoJone，科学空间博主，【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者（但不专业）......目前31岁，还在单调递增。希望能一直在此分享科学之美～

你也许会关心：

科学空间|Scientific Spaces 介绍

科学空间QQ交流群：67729435

科学空间微信交流群：spaces_ac_cn

常见问题集：《科学空间FAQ》

智能搜索

支持整句搜索！网站自动使用结巴分词进行分词，并结合ngrams排序算法给出合理的搜索结果。

SEARCH

MENU

CATEGORIES

NEWPOSTS

COMMENTS

USERLOGIN

科学空间|Scientific Spaces

基于量子化假设推导模型的尺度定律（Scaling Law）

【生活杂记】炒锅的尽头是铁锅

利用“熄火保护 + 通断器”实现燃气灶智能关火

折腾windows 8和ubuntu 12

太阳中心的压强和温度

[备忘]历史天气查询

AdaX优化器浅析（附开源实现）

Adam & AdaX

不在家的国庆

关于站长

智能搜索

热门标签

随机文章

最近评论

友情链接