MobileSideBar

SEARCH

MENU

  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档

CATEGORIES

  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

NEWPOSTS

  • NBCE:使用朴素贝叶斯扩展LLM...
  • 基于量子化假设推导模型的尺度定律(...
  • Transformer升级之路:9...
  • 如何度量数据的稀疏程度?
  • 注意力和Softmax的两点有趣发...
  • 梯度视角下的LoRA:简介、分析、...
  • 从JL引理看熵不变性Attention
  • Bias项的神奇作用:RoPE +...
  • Google新作试图“复活”RNN...
  • 《为什么现在的LLM都是Decod...

COMMENTS

  • 郑思远: 感谢苏神,之前用多gpu并行直接叠加loss发现效果并没有变好...
  • 苏剑林: 这个问题刚好之前讨论过,请参考:https://kexue.f...
  • 苏剑林: [comment=21782]nil[/comment]给定$...
  • nil: 首先给定$S_k$不代表$p(S_k)$是常数,你掷骰子掷到某...
  • 廖奕凯: 苏神好,看见您文章里有这么一段> 前面L−1层的RoPE已经足...
  • o_glay: 奇怪了,我这里的实验也表明直接预测$x0$的效果要好于预测速度...
  • 苏剑林: 既然是常数了,写成$\propto$有何不可?$p(A|B)=...
  • o_glay: 纠正一下,之前没仔细看论文附带的代码,它的逻辑实际上是用n阶龙...
  • nil: 给定$S_k$不代表$p(S_k)$就取消掉了啊,只听过$p(...
  • hhh: 苏神你好,看到这里的并行化(LRU,prefixsum)部分,...

USERLOGIN

  • 登录
科学空间|Scientific Spaces
  • 登录
  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档
渴望成为一个小飞侠

  • 欢迎订阅

  • 个性邮箱

  • 天象信息

  • 观测ISS

  • LaTeX

  • 关于博主

欢迎访问“科学空间”,这里将与您共同探讨自然科学,回味人生百态;也期待大家的分享~

  • 千奇百怪Everything
  • 天文探索Astronomy
  • 数学研究Mathematics
  • 物理化学Phy-chem
  • 信息时代Big-Data
  • 生物自然Biology
  • 图片摄影Photograph
  • 问题百科Questions
  • 生活/情感Life-Feeling
  • 资源共享Resources
  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

链接

  • 宇宙驿站
  • 数学研发
  • Seatop
  • Xiaoxia
  • 积分表-网络版
  • 丝路博傲
  • ph4ntasy 饭特稀
  • 数学之家
  • 有趣天文奇观
  • bsky
  • TwistedW
  • godweiyang
  • AI柠檬
  • 王登科-DK博客
  • 瓦特兰蒂斯
  • maamx
  • ESON
  • 枫之羽
  • Mathor's blog
  • 孙云增的博客
  • coding-zuo
  • 博科园
  • 孔皮皮的博客
  • 运鹏的博客
  • 申请链接

科学空间

微信打赏

科学空间

支付宝打赏

因为网站后台对打赏并无记录,因此欢迎在打赏时候备注留言。
你还可以点击这里或在下方评论区留言来告知你的建议或需求。

你也许还对下面的内容感兴趣

  • 【NASA每日一图】土星上的春分
  • 线性Transformer应该不是你要等的那个模型
  • 现在可以用Keras玩中文GPT2了(GPT2_ML)
  • 欲对接广义相对论,新量子引力模型能否成功?
  • 梯度视角下的LoRA:简介、分析、猜测及推广
  • RNN模型中输入的重要性的评估
  • “二体+恒力”问题
  • [追溯]封装界传奇人物
  • 施密特系统的校正镜方程求解
  • 开普勒方程求根器(继续VB,继续拙作..)
发表你的看法
    1. «
    2. 1
    3. 2
    4. 3
    5. 4
    6. 5
    7. »
李旭东

June 26th, 2019

大神好~我关注苏神的博客已经有段时间了,内容充实又深度而且很通俗,受益良多!我的个人网站主要是机器学习、设备健康管理与深度学习相关的内容,希望能在这里申请一个链接~我的网站上已经添加了苏神的网址啦~非常感谢~
我的网址(贾维斯的小屋):https://5663015.github.io/

回复评论
苏剑林 发表于 June 27th, 2019

已加

回复评论
Benedict Jin

January 30th, 2020

名称:宇宙湾
简介:主要是大数据和人工智能的原创文章。
网址:https://yuzhouwan.com/
头像:https://picture.yuzhouwan.com/yuzhouwan_logo_128x128.ico

大佬大佬,友链否

回复评论
Benedict Jin 发表于 February 8th, 2020

已经过去好久了,如果仍然希望互加友链的话,欢迎到 https://yuzhouwan.com/links/ 下留言吧,谢谢

回复评论
maamx

January 30th, 2020

天文科普类,申请链接,贵站链接已做好。

回复评论
maamx

January 30th, 2020

名称:maamx
简介:天文科普类
网址:https:/www.maamx.com/

回复评论
苏剑林 发表于 February 3rd, 2020

已经添加。

回复评论
maamx 发表于 February 4th, 2020

https://spaces.ac.cn/www.maamx.com/
链接有点问题,要修改一下下。

回复评论
苏剑林 发表于 February 6th, 2020

已经修正了,谢谢提醒

回复评论
Dawei Ma

March 5th, 2020

名称:构建我的被动收入
简介:主要分享自我管理/全栈开发/投资理财类的知识
网址:https://www.bmpi.dev

回复评论
苏剑林 发表于 March 9th, 2020

老兄你这网站太慢了,半天都打不开,好不容易打开了,再刷新又打不开了...

回复评论
xu-song

May 27th, 2020

名称:ESON
简介:个人博客(机器学习、自然语言处理等)
网址:https://blog.eson.org/

回复评论
苏剑林 发表于 May 28th, 2020

已加

回复评论
彭子良

June 4th, 2020

申请互链 贵站链接在首页 谢谢
网站名 科学星空间

回复评论
苏剑林 发表于 June 5th, 2020

太简陋了,暂不通过,抱歉。

回复评论
余锋

August 15th, 2020

苏神好,关注你的博客很久了,学到了不少数学和算法知识。目前在研究区块链和人工智能安全方面的问题。希望进一步向你学习,可以互加友链吗?(已添加你的链接)
我的博客(Feng Yu的空间):https://yu-feng.top/

回复评论
苏剑林 发表于 March 18th, 2021

不好意思,之前可能没留意到,已加。

回复评论
mathor

March 18th, 2021

大佬好,我看您的博客很久了,每次您在群里发文章我都会看,虽然有些看不太懂。希望能和您交换个友链

我的博客(Mother's blog):https://wmathor.com

回复评论
苏剑林 发表于 March 18th, 2021

已加

回复评论
孙云增

March 21st, 2021

大佬你好,关注您很久了,尤其是您发的有关深度学习的文章我受益匪浅,记忆深刻是 self-attention注意力机制那篇文章,让自己入门了深度学习,自己目前也在这一块摸索,同时也对前端开发、数据挖掘与算法感兴趣,自己的博客里也会放一些读书心得跟生活感悟,希望能和您交换友链,共同进步!
我的博客(孙云增的博客)https://sunyunzeng.com/

回复评论
苏剑林 发表于 March 22nd, 2021

谢谢,已加。

回复评论
    1. «
    2. 1
    3. 2
    4. 3
    5. 4
    6. 5
    7. »
取消回复

1. 可以在评论中使用LaTeX代码,点击“预览效果”可即时查看效果,点击这里可以查看更多内容;
2. 可以通过点击评论楼层编号来引用该楼层。

关于站长

科学空间logo
苏剑林|BoJone,科学空间博主,数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房爱好者......目前30岁,还在单调递增。正在追一科技打杂,并致力于分享科学之美~
你也许会关心:
  • 科学空间|Scientific Spaces 介绍
  • 科学空间QQ交流群:808623966
  • 科学空间微信交流群:spaces_ac_cn
  • 常见问题集:《科学空间FAQ》
  • 智能搜索

    支持整句搜索!网站自动使用结巴分词进行分词,并结合ngrams排序算法给出合理的搜索结果。

    热门标签

      模型 生成模型 语言模型 优化 attention 网站 概率 转载 天象 深度学习 微分方程 积分 python 分析 力学 无监督 节日 几何 文本生成 数论 矩阵 生活 梯度 情感 复数

    随机文章

    • 轻微的扰动——摄动法简介(1)
    • 基于Conditional Layer Normalization的条件文本生成
    • 月全食刚过...
    • 【NASA每日一图】火星上的奇形黑色陨石
    • 能量视角下的GAN模型(一):GAN=“挖坑”+“跳坑”
    • 国际观月夜(InOMN)
    • 三连杆装置曲线方程
    • 生成扩散模型漫谈(五):一般框架之SDE篇
    • 正项级数敛散性最有力的判别法?
    • 精确自由落体运动定律的讨论(二)

    最近评论

    • 郑思远: 感谢苏神,之前用多gpu并行直接叠加loss发现效果并没有变好,当时就没太想清楚,这篇博客算是...
    • 苏剑林: 这个问题刚好之前讨论过,请参考:https://kexue.fm/archives/9105
    • 苏剑林: [comment=21782]nil[/comment]给定$x=2$,2不是常数;抛骰子,给...
    • nil: 首先给定$S_k$不代表$p(S_k)$是常数,你掷骰子掷到某个点数也不代表这个点数的先验概率...
    • 廖奕凯: 苏神好,看见您文章里有这么一段> 前面L−1层的RoPE已经足够为模型补充位置信息,最后一层不...
    • o_glay: 奇怪了,我这里的实验也表明直接预测$x0$的效果要好于预测速度,不知道为啥
    • 苏剑林: 既然是常数了,写成$\propto$有何不可?$p(A|B)=\frac{p(B|A)p(A)...
    • o_glay: 纠正一下,之前没仔细看论文附带的代码,它的逻辑实际上是用n阶龙格-库塔算法来估计当前点$x_t...
    • nil: 给定$S_k$不代表$p(S_k)$就取消掉了啊,只听过$p(A|B)\propto p(B|...
    • hhh: 苏神你好,看到这里的并行化(LRU,prefixsum)部分,联系到FLASH paper中说...

    友情链接

    • 宇宙驿站
    • 数学研发
    • Seatop
    • Xiaoxia
    • 积分表-网络版
    • 丝路博傲
    • ph4ntasy 饭特稀
    • 数学之家
    • 有趣天文奇观
    • bsky
    • TwistedW
    • godweiyang
    • AI柠檬
    • 王登科-DK博客
    • 瓦特兰蒂斯
    • maamx
    • ESON
    • 枫之羽
    • Mathor's blog
    • 孙云增的博客
    • coding-zuo
    • 博科园
    • 孔皮皮的博客
    • 运鹏的博客
    • 申请链接

    署名-非商业用途-保持一致 本站采用创作共用版权协议,要求署名、非商业用途和保持一致。转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议。
    © 2009-2023 Scientific Spaces. All rights reserved. Theme by laogui. Powered by Typecho. 备案号: 粤ICP备09093259号-1/2。