MobileSideBar

SEARCH

MENU

  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档

CATEGORIES

  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

NEWPOSTS

  • 基于流式幂迭代的Muon实现:5. 延伸
  • 基于流式幂迭代的Muon实现:4. 原理
  • 基于流式幂迭代的Muon实现:3. 雕琢
  • 中位数(Median)简介
  • 基于流式幂迭代的Muon实现:2. 加速
  • Attention Residua...
  • 基于流式幂迭代的Muon实现:1. 初识
  • MuP之上:3. 特殊情况特殊处理
  • MoE环游记:7、动态激活极简解
  • MoE环游记:6、最优分配促均衡

COMMENTS

  • 苏剑林: 关于网络该预测什么目标,这个后来确实有一些争议和讨论,实际上有...
  • 苏剑林: 我没试过,不过也就少一个自由度,猜测影响应该比较有限吧。
  • 苏剑林: 我没看明白你这里的推导,有时间我再翻翻你提到的论文,但是“Ad...
  • 苏剑林: 现在的我,似乎一看到“语义空间”这些词就有点血压飙升的感觉,脑...
  • 苏剑林: 常规内积到加权内积的转变,至少黎曼几何了(即便直角坐标到极坐标...
  • 苏剑林: 这一层的输出,就是下一层的输入,这个能理解吗?内还是外,仅仅是...
  • 苏剑林: attention学的是$q_t, k_{\leq t}, v...
  • YameChi: 苏神,我还有另一个问题请教您,对于公式(10)中,能否直接构造...
  • Oriend: 苏神好,请问一下如果进一步给V也加L2 norm会有什么影响吗...
  • EIFY: AdamW优化器的$\Vert\boldsymbol{u}_t...

USERLOGIN

  • 登录
科学空间|Scientific Spaces
  • 登录
  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档
渴望成为一个小飞侠

  • 欢迎订阅

  • 个性邮箱

  • 天象信息

  • 观测ISS

  • LaTeX

  • 关于博主

欢迎访问“科学空间”,这里将与您共同探讨自然科学,回味人生百态;也期待大家的分享~

  • 千奇百怪Everything
  • 天文探索Astronomy
  • 数学研究Mathematics
  • 物理化学Phy-chem
  • 信息时代Big-Data
  • 生物自然Biology
  • 图片摄影Photograph
  • 问题百科Questions
  • 生活/情感Life-Feeling
  • 资源共享Resources
  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

链接

  • Cool Papers
  • 数学研发
  • Seatop
  • Xiaoxia
  • 积分表-网络版
  • 丝路博傲
  • 数学之家
  • 有趣天文奇观
  • TwistedW
  • godweiyang
  • AI柠檬
  • 王登科-DK博客
  • ESON
  • 枫之羽
  • coding-zuo
  • 博科园
  • 孔皮皮的博客
  • 运鹏的博客
  • jiming.site
  • OmegaXYZ
  • EAI猩球
  • 文举的博客
  • 申请链接

科学空间

微信打赏

科学空间

支付宝打赏

因为网站后台对打赏并无记录,因此欢迎在打赏时候备注留言。
你还可以点击这里或在下方评论区留言来告知你的建议或需求。

你也许还对下面的内容感兴趣

  • 智能家居之手搓一套能接入米家的零冷水装置
  • 薛定谔方程的启发式推导
  • 【搜出来的文本】⋅(四)通过增、删、改来用词造句
  • 小论文《欧拉数学在数列级数的妙用》
  • 词向量与Embedding究竟是怎么回事?
  • 评论功能修复了
  • 重新思考学习率与Batch Size(四):EMA
  • 引力透镜——用经典力学推导光的偏转公式
  • RNN模型中输入的重要性的评估
  • Transformer升级之路:7、长度外推性与局部注意力
发表你的看法
    1. «
    2. 1
    3. 2
    4. 3
    5. 4
    6. 5
    7. 6
    8. »
liuxingyu

December 5th, 2012

你好,非常喜欢这个科学博客!可以做个连接么!贵站的连接我已经做上了。我的站是http://www.iliuxingyu.com

回复评论
动物世界

August 6th, 2013

很喜欢贵站,希望互相交流!

回复评论
虫子

February 5th, 2014

新年好!http://www.neilianba.com内链吧已经收录贵站,如果方便的话就在贵站任意页面加上内链吧的链接,非常感谢!

回复评论
茶园逸士

March 15th, 2014

您好,非常喜欢您这个科学博客!这是我的博客 http://www.ifreethinking.com ,刚刚起步,主要记录一些科学和思考的文章,希望能够互相交流!

回复评论
苏剑林 发表于 March 15th, 2014

谢谢你的抬举!你的网站也很好呀,欢迎多多互相来访^_^

回复评论
茶园逸士 发表于 March 15th, 2014

不知道是否能和贵站做个友情链接呢?

回复评论
苏剑林 发表于 March 15th, 2014

已经加上,欢迎常来^_^

回复评论
聆弋

March 15th, 2014

我也转到typecho了,想问一下在这个平台上有没有邮件回复的功能?如果有该怎么弄,谢谢了~

回复评论
苏剑林 发表于 March 15th, 2014

有是有,需要插件,你在plugins.typecho.me这个网站找找。关键是,这个插件有好几个版本,哪个版本管用,似乎和服务器有关,也和typecho的版本有关...你一个个试试吧。

回复评论
羽中

March 15th, 2014

我去 就这么扒了啊。。自己看有点奇怪 = =

回复评论
苏剑林 发表于 March 15th, 2014

你的配色和风格都弄得很好呀~我只会copy了,谢谢!
话说你那个的点击图片显示下一张是怎么实现的呢?

回复评论
山东大学天文爱好者协会

July 25th, 2015

您好,我们是山东大学天文爱好者协会。想和贵站做友情链接!

回复评论
苏剑林 发表于 July 25th, 2015

幸会幸会,已经添加。
(由于字数限制,只能将贵站的名字改为“山东大学天文协会”,如有不妥请指出)

回复评论
山东大学天文爱好者协会 发表于 August 2nd, 2015

也不发个邮件提醒一下。。我们也添加啦

回复评论
陌生客

September 23rd, 2015

科普剪报网希望交换友链

回复评论
Joyful Physics

September 29th, 2015

以下是我的物理博客,每周更新,希望能收入到你的链接列表。

http://blog.scholarnet.cn/joyfulphysics/

http://www.cnblogs.com/joyfulphysics/

两个博客的内容是完全一样的。

回复评论
Joeng4

September 27th, 2016

不知道从什么时候起,你的网站似乎不再关注天文了,我有点犹豫,要不要加友链?
“有趣天文奇观”(http://interesting-sky.loveno.net/)、
“地理520”(http://www.dili520.com/)

回复评论
    1. «
    2. 1
    3. 2
    4. 3
    5. 4
    6. 5
    7. 6
    8. »
取消回复

1. 可以使用LaTeX代码,点击“预览效果”可查看效果;
2. 可以通过点击评论楼层编号来引用该楼层;
3. 网站可能会有点卡,如非确认评论失败,请不要重复点击提交。

关于站长

科学空间logo
苏剑林|BoJone,科学空间博主,【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者(但不专业)......目前33岁,还在单调递增。希望能一直在此分享科学之美~
你也许会关心:
  • 科学空间|Scientific Spaces 介绍
  • 科学空间QQ交流群:67729435
  • 科学空间微信交流群:spaces_ac_cn
  • 常见问题集:《科学空间FAQ》
  • 智能搜索

    支持整句搜索!网站自动使用结巴分词进行分词,并结合ngrams排序算法给出合理的搜索结果。

    热门标签

      生成模型 attention 优化 语言模型 模型 梯度 网站 概率 优化器 矩阵 转载 微分方程 分析 天象 深度学习 积分 python 几何 扩散 力学 无监督 节日 生活 文本生成 数论

    随机文章

    • 新年新天象:2010年1月重要天象
    • 高阶MuP:更简明但更高明的谱条件缩放
    • 基于Conv1D的光谱分类模型(一维序列分类)
    • 均值不等式的两个巧妙证明
    • “十字架”组合计数问题浅试
    • TeaForN:让Teacher Forcing更有“远见”一些
    • 视频演示:费曼的茶杯
    • 变分自编码器(四):一步到位的聚类方案
    • 基于流式幂迭代的Muon实现:3. 雕琢
    • 当时七夕笑牵牛

    最近评论

    • 苏剑林: 关于网络该预测什么目标,这个后来确实有一些争议和讨论,实际上有九种组合,可以参考:https:...
    • 苏剑林: 我没试过,不过也就少一个自由度,猜测影响应该比较有限吧。
    • 苏剑林: 我没看明白你这里的推导,有时间我再翻翻你提到的论文,但是“AdamW的最优学习率不会随着$\b...
    • 苏剑林: 现在的我,似乎一看到“语义空间”这些词就有点血压飙升的感觉,脑中出现一群老古董试图用自己的古董...
    • 苏剑林: 常规内积到加权内积的转变,至少黎曼几何了(即便直角坐标到极坐标,也可以说是黎曼几何的特例)。然...
    • 苏剑林: 这一层的输出,就是下一层的输入,这个能理解吗?内还是外,仅仅是取决于你的视角,attnres论...
    • 苏剑林: attention学的是$q_t, k_{\leq t}, v_{\leq t}$到$o_t$...
    • YameChi: 苏神,我还有另一个问题请教您,对于公式(10)中,能否直接构造一个网络,输入xt,输出为x0来...
    • Oriend: 苏神好,请问一下如果进一步给V也加L2 norm会有什么影响吗?V携带的信息量应该变少了,但是...
    • EIFY: AdamW优化器的$\Vert\boldsymbol{u}_t\Vert_{RMS}$取决于$...

    友情链接

    • Cool Papers
    • 数学研发
    • Seatop
    • Xiaoxia
    • 积分表-网络版
    • 丝路博傲
    • 数学之家
    • 有趣天文奇观
    • TwistedW
    • godweiyang
    • AI柠檬
    • 王登科-DK博客
    • ESON
    • 枫之羽
    • coding-zuo
    • 博科园
    • 孔皮皮的博客
    • 运鹏的博客
    • jiming.site
    • OmegaXYZ
    • EAI猩球
    • 文举的博客
    • 申请链接

    署名-非商业用途-保持一致 本站采用创作共用版权协议,要求署名、非商业用途和保持一致。转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议。
    © 2009-2026 Scientific Spaces. All rights reserved. Theme by laogui. Powered by Typecho. 备案号: 粤ICP备09093259号-1/2。