Bansheng
Open Menu
Close Menu
首页
博客
标签
联系我
Transformer
DeepSeek V4 技术报告深度解读:百万 Token 长上下文的系统工程学
Tech
2026-05-09
DeepSeek V4 技术报告深度解读:百万 Token 长上下文的系统工程学
DeepSeek
大语言模型
长上下文
KV 高效的 2K 长序列电商精排:OneTrans V3.1 工程实践
Tech
2026-04-28
KV 高效的 2K 长序列电商精排:OneTrans V3.1 工程实践
推荐系统
精排
Transformer
LLM 范式重构电商推荐召回:生成式召回的工程实践全记录
Tech
2026-04-28
LLM 范式重构电商推荐召回:生成式召回的工程实践全记录
推荐系统
生成式召回
Foundation Model
Sparse MoE 在推荐序列建模中的工程实践:四个关键设计的背后逻辑
Tech
2026-04-23
Sparse MoE 在推荐序列建模中的工程实践:四个关键设计的背后逻辑
推荐系统
Sparse MoE
序列建模
Tech
2026-04-15
TokenFormer:终结推荐系统的两个平行世界
推荐系统
Transformer
序列建模
视频号推荐超长序列技术演进:从端到端到 Cross-Mask …
Tech
2026-04-13
视频号推荐超长序列技术演进:从端到端到 Cross-Mask Transformer
推荐系统
序列建模
超长序列
Tech
2026-04-09
NormFormer:用额外归一化改进 Transformer 预训练
论文精读
NormFormer
Transformer
Tech
2026-04-01
SORT:面向工业级推荐系统的系统优化排序 Transformer
论文精读
推荐系统
Transformer
AI技术解析
2026-03-25
美团推荐大模型 MTFM (Meituan Foundation Model) 深度硬核解析:跨场景推荐的终极答案?
推荐系统
大模型
Transformer
Tech
2026-03-24
GPSD:让判别式推荐模型也拥有 Scaling Law 的魔力
论文精读
推荐系统
Transformer
下一页 »