Bansheng
Open Menu
Close Menu
首页
博客
标签
联系我
深度学习
KV 高效的 2K 长序列电商精排:OneTrans V3.1 工程实践
Tech
2026-04-28
KV 高效的 2K 长序列电商精排:OneTrans V3.1 工程实践
推荐系统
精排
Transformer
LLM 范式重构电商推荐召回:生成式召回的工程实践全记录
Tech
2026-04-28
LLM 范式重构电商推荐召回:生成式召回的工程实践全记录
推荐系统
生成式召回
Foundation Model
Sparse MoE 在推荐序列建模中的工程实践:四个关键设计的背后逻辑
Tech
2026-04-23
Sparse MoE 在推荐序列建模中的工程实践:四个关键设计的背后逻辑
推荐系统
Sparse MoE
序列建模
Tech
2026-04-09
NormFormer:用额外归一化改进 Transformer 预训练
论文精读
NormFormer
Transformer
Tech
2026-04-08
UniMixer:统一推荐系统三大架构范式的缩放定律探索
论文精读
推荐系统
深度学习
Tech
2026-03-18
TokenMixer-Large: 突破工业级推荐系统的大模型扩展瓶颈
论文精读
推荐系统
深度学习