Bansheng
Open Menu
Close Menu
首页
博客
标签
联系我
Tech
视频号推荐超长序列技术演进:从端到端到 Cross-Mask …
Tech
2026-04-13
视频号推荐超长序列技术演进:从端到端到 Cross-Mask Transformer
推荐系统
序列建模
超长序列
Tech
2026-04-09
NormFormer:用额外归一化改进 Transformer 预训练
论文精读
NormFormer
Transformer
Tech
2026-04-08
UniMixer:统一推荐系统三大架构范式的缩放定律探索
论文精读
推荐系统
深度学习
Tech
2026-04-02
NEO:用统一语言模型重新定义搜索、推荐与推理
论文精读
推荐系统
LLM
Tech
2026-04-01
SORT:面向工业级推荐系统的系统优化排序 Transformer
论文精读
推荐系统
Transformer
Tech
2026-03-24
GPSD:让判别式推荐模型也拥有 Scaling Law 的魔力
论文精读
推荐系统
Transformer
Tech
2026-03-20
M-FALCON:HSTU 中解决“一对多”推荐推理的终极武器
推荐系统
HSTU
KV-Cache
Tech
2026-03-20
万亿参数推荐大模型:HSTU 架构如何超越传统 Self-Attention
论文精读
推荐系统
HSTU
Tech
2026-03-19
FuXi-Linear:释放线性注意力在超长序列推荐中的潜力
论文精读
推荐系统
线性注意力
Tech
2026-03-18
TokenMixer-Large: 突破工业级推荐系统的大模型扩展瓶颈
论文精读
推荐系统
深度学习