1. 项目概述
在联盟营销生态中,准确预测商品传播规模对于营销预算分配和佣金激励机制至关重要。传统基于"直接贡献"的评估范式仅关注推广者直接带来的销量(Self-sales),而忽视了推广者通过社交网络传播产生的间接价值。这种评估方式导致两个核心问题:一是无法准确识别具有传播价值的关键节点(如"播种者"),二是造成资源分配失衡,长期损害生态健康。
阿里妈妈技术团队提出的DNTS(Dynamic Network-based Two-stage forecasting)框架创新性地将传播规模预测解耦为两个子任务:基础信号(自销量)预测和动态网络结构预测。这种方法突破了传统GNN模型在动态网络场景下的局限性,在阿里妈妈实际业务中实现了GMV提升2.52%、销量提升2.40%的显著效果。
2. 核心问题与技术挑战
2.1 传统评估范式的局限性
当前主流的"直接贡献"评估体系存在明显缺陷:
- 价值衡量偏差:无法识别通过转发激活下游推广链路的"播种者"
- 资源分配失准:过度倾斜资源给末端"收割者",忽视生态建设者
- 激励错位:长期导致生态多元性下降,影响平台可持续发展
2.2 传播规模预测的技术难点
定义传播规模为推广者直接或间接参与的所有订单销量总和后,预测面临两大核心挑战:
-
信号不平滑性:
- 自销量相对平稳,而传播规模受整个下游网络影响
- 表现出剧烈波动和非线性特征,难以直接建模
-
网络动态性:
- 每日推广网络结构都在变化(商品×天数维度)
- 传统GNN假设静态图结构,无法处理高度动态场景
实际业务中,单个商品可能涉及数万名推广者,形成超过600万条边的复杂网络,这对模型的计算效率和泛化能力提出极高要求。
3. DNTS框架设计
3.1 两阶段解耦预测范式
DNTS创新性地将复杂预测任务分解为:
-
基础信号预测:使用改进的时间卷积网络预测推广者自销量
- 采用多尺度Inception卷积捕捉不同周期模式
- 引入门控机制动态融合各尺度特征
-
结构预测通路:
- 局部动态编码:基于DFS的后代关系发现+注意力聚合
- 全局动态编码:超图卷积捕捉跨商品推广模式
- 双重GRU网络建模时序依赖
3.2 关键技术实现细节
3.2.1 基础信号预测模块
python复制class InceptionTCN(nn.Module):
def __init__(self, input_dim):
super().__init__()
# 多尺度卷积核(3,5,7天周期)
self.conv_branches = nn.ModuleList([
nn.Conv1d(input_dim, 32, kernel_size=k) for k in [3,5,7]
])
self.gate = nn.Linear(32*3, 32)
def forward(self, x):
# x: [batch, seq_len, input_dim]
branch_outputs = []
for conv in self.conv_branches:
out = F.relu(conv(x.transpose(1,2)))
out = F.adaptive_max_pool1d(out, 1).squeeze(-1)
branch_outputs.append(out)
fused = torch.cat(branch_outputs, dim=1)
gated = torch.sigmoid(self.gate(fused))
return gated * branch_outputs[0] # 门控加权输出
3.2.2 结构预测通路实现
局部动态编码流程:
- 基于DFS发现潜在后代集合D(m)
- 使用多头注意力聚合后代信息:
$$ \alpha_{ij} = \text{softmax}(\frac{QK^T}{\sqrt{d_k}}) $$ - 通过GRU网络建模时态演化:
$$ h_t = \text{GRU}([a_t;h_{t-1}]) $$
全局动态编码创新:
- 构建每日超图H=(V,E),其中:
- 节点V:所有活跃推广者
- 超边E:同一商品下的推广者集合
- 超图卷积公式:
$$ H^{(l+1)} = \sigma(D_v^{-1/2}HW_eD_e^{-1}H^TD_v^{-1/2}H^{(l)}W^{(l)}) $$
3.3 合成机制设计
通过可微分合成模块计算最终传播规模:
- 预测后代关系矩阵:$R = \text{Gumbel-Softmax}(f_r(Z))$
- 计算激活率矩阵:$A = \sigma(W_a[E_p;E_i])$
- 合成传播规模:$\hat{y} = (R \odot A) \times \hat{s}$
其中$\odot$表示Hadamard积,该设计确保:
- 自销量为零的后代被自动排除
- 只有同时具备激活率和销量的后代参与计算
- 整个过程保持端到端可微
4. 工业级部署方案
4.1 应对数据稀疏性
- 动态子图构建:为每个商品维护推广者子集
- 增量式更新:仅对过去7天活跃推广者进行全量计算
- 层次化采样:对长尾商品采用邻居采样策略
4.2 处理高波动性
- 推广者激活预测辅助任务:
$$ L_{aux} = \sum_{p\in V} BCE(\hat{a}_p, a_p) $$ - 动态温度系数调整:
$$ \tau_t = \tau_{min} + (\tau_{max}-\tau_{min}) \times e^{-kt} $$
4.3 线上服务架构
mermaid复制graph TD
A[实时特征流] --> B[Flink状态计算]
B --> C{商品热度判断}
C -->|高热度| D[全量图计算]
C -->|普通| E[子图采样计算]
D & E --> F[模型预测服务]
F --> G[Redis缓存结果]
G --> H[推荐引擎]
实际部署时采用分级计算策略:
- 热点商品:全量计算,5分钟更新一次
- 普通商品:采样计算,每小时更新
- 长尾商品:天级批量计算
5. 实验验证与业务影响
5.1 离线实验设置
数据集划分:
| 数据集 | 时间跨度 | 推广者数 | 商品数 | 边数量 |
|---|---|---|---|---|
| AM-15d | 15天 | 52,341 | 1.2M | 3.4M |
| AM-30d | 30天 | 108,762 | 2.7M | 6.1M |
| AM-60d | 60天 | 98,445 | 3.5M | 5.8M |
基线模型对比:
- 时序模型:DeepAR, N-BEATS
- 时空图模型:DCRNN, STGCN
- 最新方案:MTGNN, TPGNN
5.2 关键实验结果
整体性能对比(AM-30d数据集):
| 模型 | MSLE(↓) | MAPE(↓) | 训练时间 |
|---|---|---|---|
| DeepAR | 0.412 | 28.7% | 2.1h |
| STGCN | 0.387 | 26.3% | 3.8h |
| TPGNN | 0.351 | 24.1% | 4.5h |
| DNTS | 0.311 | 23.1% | 3.2h |
组件消融分析:
| 变体 | MSLE | 相对变化 |
|---|---|---|
| 完整DNTS | 0.311 | - |
| w/o 超图卷积 | 0.334 | +7.4% |
| w/o 门控TCN | 0.325 | +4.5% |
| 端到端模式 | 0.368 | +18.3% |
5.3 在线业务影响
3个月AB测试结果:
| 指标 | 对照组 | DNTS组 | 提升幅度 |
|---|---|---|---|
| GMV | 100 | 102.52 | +2.52% |
| 销量 | 100 | 102.40 | +2.40% |
| 推广者留存 | 100 | 103.18 | +3.18% |
关键发现:
- 中腰部推广者收益提升更明显(+4.2%)
- 商品曝光多样性提升17.6%
- 长尾商品转化率提升3.8%
6. 实践建议与扩展方向
6.1 实施注意事项
-
冷启动处理:
- 新商品使用品类平均传播模式初始化
- 新推广者采用相似者embedding插值
-
数据质量保障:
- 建立推广链路真实性校验机制
- 对异常传播路径进行人工审核
-
计算资源优化:
- 对超图卷积采用分区并行计算
- 使用FP16混合精度训练
6.2 潜在扩展方向
-
跨平台迁移学习:
- 通过领域适应技术将模型迁移到其他电商平台
- 设计平台无关的推广者表征方法
-
多模态融合:
- 结合商品图像和文案内容特征
- 引入推广者生成内容的质量评估
-
实时化演进:
- 开发流式图学习架构
- 实现分钟级模型更新
在实际业务场景中,我们发现在推广者激励方面,DNTS预测结果可以帮助设计更合理的佣金阶梯制度。例如,对传播价值高但直接销量低的"播种者",给予额外传播奖励;而对那些主要依赖他人传播流量的"收割者",则适当降低基础佣金比例。这种精细化的激励策略使得推广者生态更加健康,最终带来平台整体GMV的提升。