06
6月
趋势·来源 · arxiv.org·2026/06/06
个人AI代理用于相册视觉问答的研究
一项研究探索了利用个人AI代理对用户相册进行视觉问答,使会话式AI助手能够访问并检索相关图像。
06
6月
AI·来源 · blog.google·2026/06/06
Gemma 4 QAT 模型:优化压缩以提高移动和笔记本电脑效率
Google推出了Gemma 4的量化感知训练(QAT)模型,旨在通过优化压缩来提高在移动设备和笔记本电脑上的运行效率。
06
6月
趋势·来源 · www.reddit.com·2026/06/06
Unsloth 发布 Gemma 4 的 MTP GGUF 权重,支持多尺寸量化版本
Unsloth已经发布了针对Gemma 4模型的MTP GGUF权重,包括31B、26B-A4B和12B等不同规模的Q8、F16和BF16量化版本。
06
6月
趋势·来源 · www.reddit.com·2026/06/06
TinyTPU:SystemVerilog脉动阵列编译为WASM并在浏览器中运行
TinyTPU是一个使用SystemVerilog实现的4x4脉动阵列,可编译为WASM并在浏览器中实时运行,其RTL经过numpy验证。
06
6月
趋势·来源 · arxiv.org·2026/06/06
研究分析秘密LLM代理在实验中的劝说策略
一项研究分析了Reddit上一个已中止的现场实验中,秘密大型语言模型(LLM)代理所使用的劝说策略。
06
6月
趋势·来源 · arxiv.org·2026/06/06
模型崩溃的流行病学研究:通过双层SIR动力学模拟合成数据污染
一项研究通过双层SIR动力学模型来分析合成数据污染如何导致模型崩溃,揭示了AI生态系统中的交叉污染问题。
05
6月
重点·来源 · github.com·2026/06/05
llama.cpp CUDA性能显著提升,MTP吞吐量增强
llama.cpp 更新 (b9521) 显著优化了其CUDA实现,特别是通过将 `mul_mat_vec_q_moe` 操作纳入PDL,大幅提高了MTP(多线程处理)的性能。
05
6月
趋势·来源 · www.reddit.com·2026/06/05
Reddit r/MachineLearning 版块每月项目自荐帖再次开启
Reddit r/MachineLearning 社区定期开放自荐帖,允许用户发布个人项目、创业公司、产品、协作需求和博客等,并明确提及付费和定价信息。