05
6月
趋势·来源 · www.reddit.com·2026/06/05
Reddit /r/MachineLearning 社区招聘与求职月度帖子
Reddit r/MachineLearning 社区发布月度招聘与求职帖子,鼓励公司发布职位,求职者介绍自己,涵盖地点、薪资、远程工作等信息。
05
6月
趋势·来源 · x.com·2026/06/05
Anthropic 强调模型发布前的严格“破坏性测试”流程
Anthropic 通过其Claude AI账号表示,在新模型发布前,会有专门团队尝试“破坏”模型,通过极限测试找出其不足,以确保最终模型的质量。此消息在X平台被多个账号转发。
05
6月
趋势·来源 · arxiv.org·2026/06/05
研究探讨 Transformer 模型是否需要三种投影 (QKV) 变体
一篇在arXiv上发布并在Hacker News上被讨论的论文《Do transformers need three projections? Systematic study of QKV variants》深入研究了Transformer模型中QKV(查询、键、值)投影机制的变体及其必要性。
05
6月
趋势·来源 · www.reddit.com·2026/06/05
Hugging Face 揭示“在策略蒸馏”(On-policy distillation)成为 PapersWithCode 热词
Hugging Face 团队指出,“在策略蒸馏” (On-policy distillation) 是 PapersWithCode 上最热门的术语之一,表明它在AI研究中受到广泛关注。