MobileSideBar

SEARCH

MENU

  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档

CATEGORIES

  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

NEWPOSTS

  • MuP之上:4. 坚守参数的稳定性
  • 基于流式幂迭代的Muon实现:5. 延伸
  • 基于流式幂迭代的Muon实现:4. 原理
  • 基于流式幂迭代的Muon实现:3. 雕琢
  • 中位数(Median)简介
  • 基于流式幂迭代的Muon实现:2. 加速
  • Attention Residua...
  • 基于流式幂迭代的Muon实现:1. 初识
  • MuP之上:3. 特殊情况特殊处理
  • MoE环游记:7、动态激活极简解

COMMENTS

  • yzlnew: 并且可以解释 $\mathrm{max}$ 优于 $\math...
  • 高智涵: 我在GPT-2规模的模型上尝试 full attention ...
  • yzlnew: 嗯是的,我感觉是个不错的议题,类似羽毛球拍击球有甜区,数值计算...
  • Aaron552: 苏神怎么看待Deepseek-V4的CSA机制中也用了一个sh...
  • 苏剑林: 只要编码可逆就行。$\boldsymbol{x}_t$是由$(...
  • 苏剑林: 期待,希望能超越SCQR。
  • 苏剑林: 第一个问题,如果你这里的$L$是层数,那么$O(L^2)$的复...
  • 苏剑林: 确实如此,但从直到本文的推导来说,这一簇解感觉本质上没有优劣之...
  • YameChi: 苏老师,您好,编码模型部分,如果对x0编码到另一个数据域,这样...
  • Ruiyi Zhan: 我们组的工作有针对稠密 FP32 QR 做优化,性能会比 FP...

USERLOGIN

  • 登录
科学空间|Scientific Spaces
  • 登录
  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档
渴望成为一个小飞侠

  • 欢迎订阅

  • 个性邮箱

  • 天象信息

  • 观测ISS

  • LaTeX

  • 关于博主

欢迎访问“科学空间”,这里将与您共同探讨自然科学,回味人生百态;也期待大家的分享~

  • 千奇百怪Everything
  • 天文探索Astronomy
  • 数学研究Mathematics
  • 物理化学Phy-chem
  • 信息时代Big-Data
  • 生物自然Biology
  • 图片摄影Photograph
  • 问题百科Questions
  • 生活/情感Life-Feeling
  • 资源共享Resources
  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

链接

  • Cool Papers
  • 数学研发
  • Seatop
  • Xiaoxia
  • 积分表-网络版
  • 丝路博傲
  • 数学之家
  • 有趣天文奇观
  • TwistedW
  • godweiyang
  • AI柠檬
  • 王登科-DK博客
  • ESON
  • 枫之羽
  • coding-zuo
  • 博科园
  • 孔皮皮的博客
  • 运鹏的博客
  • jiming.site
  • OmegaXYZ
  • EAI猩球
  • 文举的博客
  • 申请链接

科学空间

微信打赏

科学空间

支付宝打赏

因为网站后台对打赏并无记录,因此欢迎在打赏时候备注留言。
你还可以点击这里或在下方评论区留言来告知你的建议或需求。

你也许还对下面的内容感兴趣

  • MoE环游记:4、难处应当多投入
  • 洗手盆里的学问
  • [电子书]《最小作用量原理与物理学的发展》
  • 求解微分方程的李对称方法(二)
  • Welcome New Server for CosmoStation
  • 科学空间:2010年3月重要天象
  • 对比学习可以使用梯度累积吗?
  • BN究竟起了什么作用?一个闭门造车的分析
  • Transformer升级之路:7、长度外推性与局部注意力
  • 线性注意力简史:从模仿、创新到反哺
发表你的看法
    1. «
    2. 1
    3. 2
    4. 3
    5. 4
    6. 5
    7. 6
    8. »
liuxingyu

December 5th, 2012

你好,非常喜欢这个科学博客!可以做个连接么!贵站的连接我已经做上了。我的站是http://www.iliuxingyu.com

回复评论
动物世界

August 6th, 2013

很喜欢贵站,希望互相交流!

回复评论
虫子

February 5th, 2014

新年好!http://www.neilianba.com内链吧已经收录贵站,如果方便的话就在贵站任意页面加上内链吧的链接,非常感谢!

回复评论
茶园逸士

March 15th, 2014

您好,非常喜欢您这个科学博客!这是我的博客 http://www.ifreethinking.com ,刚刚起步,主要记录一些科学和思考的文章,希望能够互相交流!

回复评论
苏剑林 发表于 March 15th, 2014

谢谢你的抬举!你的网站也很好呀,欢迎多多互相来访^_^

回复评论
茶园逸士 发表于 March 15th, 2014

不知道是否能和贵站做个友情链接呢?

回复评论
苏剑林 发表于 March 15th, 2014

已经加上,欢迎常来^_^

回复评论
聆弋

March 15th, 2014

我也转到typecho了,想问一下在这个平台上有没有邮件回复的功能?如果有该怎么弄,谢谢了~

回复评论
苏剑林 发表于 March 15th, 2014

有是有,需要插件,你在plugins.typecho.me这个网站找找。关键是,这个插件有好几个版本,哪个版本管用,似乎和服务器有关,也和typecho的版本有关...你一个个试试吧。

回复评论
羽中

March 15th, 2014

我去 就这么扒了啊。。自己看有点奇怪 = =

回复评论
苏剑林 发表于 March 15th, 2014

你的配色和风格都弄得很好呀~我只会copy了,谢谢!
话说你那个的点击图片显示下一张是怎么实现的呢?

回复评论
山东大学天文爱好者协会

July 25th, 2015

您好,我们是山东大学天文爱好者协会。想和贵站做友情链接!

回复评论
苏剑林 发表于 July 25th, 2015

幸会幸会,已经添加。
(由于字数限制,只能将贵站的名字改为“山东大学天文协会”,如有不妥请指出)

回复评论
山东大学天文爱好者协会 发表于 August 2nd, 2015

也不发个邮件提醒一下。。我们也添加啦

回复评论
陌生客

September 23rd, 2015

科普剪报网希望交换友链

回复评论
Joyful Physics

September 29th, 2015

以下是我的物理博客,每周更新,希望能收入到你的链接列表。

http://blog.scholarnet.cn/joyfulphysics/

http://www.cnblogs.com/joyfulphysics/

两个博客的内容是完全一样的。

回复评论
Joeng4

September 27th, 2016

不知道从什么时候起,你的网站似乎不再关注天文了,我有点犹豫,要不要加友链?
“有趣天文奇观”(http://interesting-sky.loveno.net/)、
“地理520”(http://www.dili520.com/)

回复评论
    1. «
    2. 1
    3. 2
    4. 3
    5. 4
    6. 5
    7. 6
    8. »
取消回复

1. 可以使用LaTeX代码,点击“预览效果”可查看效果;
2. 可以通过点击评论楼层编号来引用该楼层;
3. 网站可能会有点卡,如非确认评论失败,请不要重复点击提交。

关于站长

科学空间logo
苏剑林|BoJone,科学空间博主,【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者(但不专业)......目前33岁,还在单调递增。希望能一直在此分享科学之美~
你也许会关心:
  • 科学空间|Scientific Spaces 介绍
  • 科学空间QQ交流群:67729435
  • 科学空间微信交流群:spaces_ac_cn
  • 常见问题集:《科学空间FAQ》
  • 智能搜索

    支持整句搜索!网站自动使用结巴分词进行分词,并结合ngrams排序算法给出合理的搜索结果。

    热门标签

      生成模型 attention 优化 语言模型 模型 梯度 网站 概率 优化器 矩阵 转载 微分方程 分析 天象 深度学习 积分 python 几何 扩散 力学 无监督 节日 生活 文本生成 数论

    随机文章

    • 期待上学,期待九月
    • 关于维度公式“n > 8.33 log N”的可用性分析
    • 继续观测国际空间站
    • 只要我们曾经拥有过——《萍聚》
    • CAN:借助先验分布提升分类性能的简单后处理技巧
    • 滑动平均视角下的权重衰减和学习率
    • 让人惊叹的Johnson-Lindenstrauss引理:应用篇
    • [欧拉数学]素数有无穷多个的两个证明
    • CreaWriter,惬意创作!
    • 采样定理:有限个点构建出整个函数

    最近评论

    • yzlnew: 并且可以解释 $\mathrm{max}$ 优于 $\mathbb{E}$ 的问题
    • 高智涵: 我在GPT-2规模的模型上尝试 full attention residuals 加上 inp...
    • yzlnew: 嗯是的,我感觉是个不错的议题,类似羽毛球拍击球有甜区,数值计算可能也有这样的 sweet ar...
    • Aaron552: 苏神怎么看待Deepseek-V4的CSA机制中也用了一个shortconv: 计算当前m个t...
    • 苏剑林: 只要编码可逆就行。$\boldsymbol{x}_t$是由$(17)$构造而来的,又不是与生俱...
    • 苏剑林: 期待,希望能超越SCQR。
    • 苏剑林: 第一个问题,如果你这里的$L$是层数,那么$O(L^2)$的复杂度确实是无法避免的,这是所有密...
    • 苏剑林: 确实如此,但从直到本文的推导来说,这一簇解感觉本质上没有优劣之分。但是采样方差本身是可以从另外...
    • YameChi: 苏老师,您好,编码模型部分,如果对x0编码到另一个数据域,这样和xt还可以构成公式(17)的关系吗
    • Ruiyi Zhan: 我们组的工作有针对稠密 FP32 QR 做优化,性能会比 FP32 的 cusolver 好,...

    友情链接

    • Cool Papers
    • 数学研发
    • Seatop
    • Xiaoxia
    • 积分表-网络版
    • 丝路博傲
    • 数学之家
    • 有趣天文奇观
    • TwistedW
    • godweiyang
    • AI柠檬
    • 王登科-DK博客
    • ESON
    • 枫之羽
    • coding-zuo
    • 博科园
    • 孔皮皮的博客
    • 运鹏的博客
    • jiming.site
    • OmegaXYZ
    • EAI猩球
    • 文举的博客
    • 申请链接

    署名-非商业用途-保持一致 本站采用创作共用版权协议,要求署名、非商业用途和保持一致。转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议。
    © 2009-2026 Scientific Spaces. All rights reserved. Theme by laogui. Powered by Typecho. 备案号: 粤ICP备09093259号-1/2。