MobileSideBar

SEARCH

MENU

  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档

CATEGORIES

  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

NEWPOSTS

  • 滑动平均视角下的权重衰减和学习率
  • 生成扩散模型漫谈(三十一):预测数...
  • Muon优化器指南:快速上手与关键细节
  • AdamW的Weight RMS的...
  • n个正态随机数的最大值的渐近估计
  • 流形上的最速下降:5. 对偶梯度下降
  • 低精度Attention可能存在有...
  • MuP之上:1. 好模型的三个特征
  • 随机矩阵的谱范数的快速估计
  • DiVeQ:一种非常简洁的VQ训练方案

COMMENTS

  • WindATree: 苏老师您好,我也想问一个问题: 我在哔站看过 19 年李宏毅老...
  • WindATree: 苏老师您好,我也想问一个问题: 我在哔站看过 19 年李宏毅老...
  • Aikoin: 考古看到了这篇,太有意思了,原来RoPE的前身是这么来的
  • Iris_16: 了解了,感谢回答
  • 董振晨: 大佬您好,想和您交流下meanflow的推理效果
  • Zhancun: Get! 最近Vincent Sitzmann对video g...
  • 苏剑林: 我知道,但你pretrain不是已经反超了吗,所以算是正常了。...
  • Mornmirror: 实验3关闭了warmup,但还是很奇怪
  • Mornmirror: pretrain的实验是from scratch的
  • baolinzheng: 不好意思,写错了,是后向。

USERLOGIN

  • 登录

科学空间|Scientific Spaces

  • 登录
  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档
渴望成为一个小飞侠

  • 欢迎订阅

  • 个性邮箱

  • 天象信息

  • 观测ISS

  • LaTeX

  • 关于博主

欢迎访问“科学空间”,这里将与您共同探讨自然科学,回味人生百态;也期待大家的分享~

  • 千奇百怪Everything
  • 天文探索Astronomy
  • 数学研究Mathematics
  • 物理化学Phy-chem
  • 信息时代Big-Data
  • 生物自然Biology
  • 图片摄影Photograph
  • 问题百科Questions
  • 生活/情感Life-Feeling
  • 资源共享Resources
  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

找不到相关内容。


你也许对下面的内容感兴趣

  • 我19岁了
  • 从费马大定理谈起(十二):再谈谈切线法
  • 【龟鱼记】全陶粒的同程底滤生态缸
  • 多任务学习漫谈(二):行梯度之事
  • 注意力机制真的可以“集中注意力”吗?
  • 当生成模型肆虐:互联网将有“疯牛病”之忧?
  • 为什么是抛物线?——聚光面研究
  • 今天出发,奔向自招考试...
  • 从Boosting学习到神经网络:看山是山?
  • 从动力学角度看优化算法(六):为什么SimSiam不退化?

关于站长

科学空间logo
苏剑林|BoJone,科学空间博主,【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者(但不专业)......目前32岁,还在单调递增。希望能一直在此分享科学之美~
你也许会关心:
  • 科学空间|Scientific Spaces 介绍
  • 科学空间QQ交流群:67729435
  • 科学空间微信交流群:spaces_ac_cn
  • 常见问题集:《科学空间FAQ》
  • 智能搜索

    支持整句搜索!网站自动使用结巴分词进行分词,并结合ngrams排序算法给出合理的搜索结果。

    热门标签

      生成模型 attention 优化 语言模型 模型 网站 梯度 概率 矩阵 转载 优化器 微分方程 分析 天象 深度学习 积分 python 扩散 力学 无监督 几何 节日 生活 文本生成 数论

    随机文章

    • 地球“黑暗”的一小时
    • 一维弹簧的运动(下)
    • 新年快乐:2010年2月重要天象
    • 基于fine tune的图像分类(百度分狗竞赛)
    • 新词发现的信息熵方法与实现
    • 三百年之谜——费马大定理(历史+证明)
    • 小数的二进制表示
    • 混沌的世界——“星之轨迹”的研究
    • 今日七夕笑牵牛
    • 用ALBERT和ELECTRA之前,请确认你真的了解它们

    最近评论

    • WindATree: 苏老师您好,我也想问一个问题: 我在哔站看过 19 年李宏毅老师讲 Glow 的视频,他提到了...
    • WindATree: 苏老师您好,我也想问一个问题: 我在哔站看过 19 年李宏毅老师讲 Glow 的视频,他提到了...
    • Aikoin: 考古看到了这篇,太有意思了,原来RoPE的前身是这么来的
    • Iris_16: 了解了,感谢回答
    • 董振晨: 大佬您好,想和您交流下meanflow的推理效果
    • Zhancun: Get! 最近Vincent Sitzmann对video generation的分享(知乎上...
    • 苏剑林: 我知道,但你pretrain不是已经反超了吗,所以算是正常了。目前不正常的是sft,我猜是不是...
    • Mornmirror: 实验3关闭了warmup,但还是很奇怪
    • Mornmirror: pretrain的实验是from scratch的
    • baolinzheng: 不好意思,写错了,是后向。

    友情链接

    • Cool Papers
    • 数学研发
    • Seatop
    • Xiaoxia
    • 积分表-网络版
    • 丝路博傲
    • 数学之家
    • 有趣天文奇观
    • TwistedW
    • godweiyang
    • AI柠檬
    • 王登科-DK博客
    • ESON
    • 枫之羽
    • Mathor's blog
    • coding-zuo
    • 博科园
    • 孔皮皮的博客
    • 运鹏的博客
    • jiming.site
    • OmegaXYZ
    • EAI猩球
    • 文举的博客
    • 申请链接

    署名-非商业用途-保持一致 本站采用创作共用版权协议,要求署名、非商业用途和保持一致。转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议。
    © 2009-2025 Scientific Spaces. All rights reserved. Theme by laogui. Powered by Typecho. 备案号: 粤ICP备09093259号-1/2。