一、核心目标与挑战
1. 目标
- 提升用户购买转化率与复购率
- 优化库存周转率,减少损耗
- 增强用户粘性,形成“搜索-推荐-购买”闭环
2. 挑战
- 生鲜特性:保质期短、价格波动大、需求受季节/天气影响显著
- 冷启动问题:新用户/新商品缺乏历史数据
- 实时性要求:需动态调整推荐(如突发热门商品、库存变化)
二、数据层构建
1. 用户画像
- 基础属性:地理位置、家庭结构、消费能力
- 行为数据:浏览历史、加购/购买记录、搜索关键词、退货原因
- 情境数据:购买时间(工作日/周末)、天气(影响生鲜需求)、配送时效偏好
2. 商品画像
- 静态属性:品类、产地、规格、价格带
- 动态属性:库存量、保质期剩余天数、促销状态、用户评价(新鲜度、配送速度)
- 关联关系:替代品(如车厘子缺货时推荐草莓)、互补品(买牛肉推荐葱姜)
3. 上下文数据
- 实时库存、配送运力、区域性消费趋势(如节假日礼品需求)
三、算法模型设计
1. 召回层(Candidate Generation)
- 多路召回策略:
- 协同过滤:基于用户-商品交互矩阵,挖掘相似用户/商品(如购买过苹果的用户可能喜欢橙子)
- 实时兴趣召回:利用用户近期行为(如过去1小时浏览的商品)
- 热点召回:结合地域/时间趋势(如夏季推荐西瓜)
- 库存感知召回:优先推荐库存充足、保质期长的商品
- 冷启动方案:
- 新用户:基于地理位置推荐本地热销商品,或通过问卷收集偏好
- 新商品:利用商品标签匹配相似老品(如“有机蔬菜”类比已有有机商品)
2. 排序层(Ranking)
- 多目标优化模型:
- 核心目标:点击率(CTR)、转化率(CVR)、客单价
- 约束条件:库存余量、配送时效、毛利率
- 模型:采用Wide & Deep、MMoE等结构,平衡记忆(历史偏好)与泛化(新兴趣)
- 特征工程:
- 用户侧:历史购买频次、价格敏感度(通过优惠券使用行为推断)
- 商品侧:实时库存占比、损耗率预测(基于历史销售速度)
- 上下文侧:当前时段配送压力、天气对需求的影响(如雨天推荐预制菜)
3. 重排层(Re-ranking)
- 业务规则干预:
- 库存保护:避免推荐库存低于安全阈值的商品
- 多样性控制:防止推荐结果过度集中(如避免全页推荐叶菜)
- 促销倾斜:对参与满减/折扣的商品加权
- 实时反馈机制:
- 根据用户即时行为(如快速滑动跳过某类商品)动态调整推荐
四、生鲜行业特殊优化
1. 时效性推荐
- 优先展示“今日达”商品,隐藏需跨日配送的品类
- 对临近保质期的商品进行限时折扣推荐
2. 损耗率控制
- 对易损耗商品(如叶菜)降低推荐权重,或通过“买一送一”促销快速清仓
- 结合历史损耗数据,动态调整安全库存阈值
3. 季节性与地域性适配
- 冬季推荐根茎类蔬菜,夏季推荐瓜果类
- 南方地区推荐热带水果,北方地区推荐耐储存品类
五、评估与迭代
1. 离线评估
- 指标:AUC、NDCG、GMV提升率、损耗率下降率
- A/B测试:对比不同模型版本在关键指标上的表现
2. 在线优化
- 实时监控推荐结果的点击/购买分布,调整召回策略权重
- 对高退货率商品(如品质问题)进行降权处理
3. 用户反馈闭环
- 通过“不感兴趣”按钮收集负反馈,优化模型
- 结合用户评价(如“不新鲜”)反向调整商品推荐优先级
六、技术架构支持
1. 实时计算
- 使用Flink处理用户实时行为,更新特征库
- 库存数据通过Kafka实时同步至推荐系统
2. 模型服务
- 部署TensorFlow Serving或TorchServe,支持毫秒级响应
- 多模型并行推理(如召回模型与排序模型解耦)
3. 数据治理
- 构建生鲜专属的数据仓库,标注商品保质期、损耗率等字段
- 定期清洗异常数据(如用户频繁退货记录)
七、案例参考
- 美团买菜“智能补货+推荐”联动:通过预测模型预估各区域需求,动态调整推荐商品结构,使热门商品库存周转率提升20%。
- “晚市特惠”场景:下午6点后推荐当日未售完的鲜肉/水产,结合折扣券提升清仓效率。
通过上述策略,美团买菜可构建一个兼顾用户体验与商业效率的智能推荐系统,在生鲜电商的红海市场中形成差异化竞争力。