大规模PageRank实现中的关键问题剖析
1. PageRank敏感性定理
PageRank向量在搜索引擎的网页排序中起着至关重要的作用,其敏感性定理更是理解PageRank稳定性的关键。
1.1 PageRank向量的表达式
PageRank向量 $\pi^T(\alpha)$ 可以表示为:
$\pi^T(\alpha) = \frac{1}{\sum_{i=1}^{n} D_i(\alpha)} [D_1(\alpha), D_2(\alpha), \ldots, D_n(\alpha)]$
其中,$D_i(\alpha)$ 是 $I - G(\alpha)$ 中 $n - 1$ 阶的第 $i$ 个主子式行列式。由于每个主子式 $D_i(\alpha) > 0$ 是 $I - G(\alpha)$ 中元素乘积的和,所以 $\pi^T(\alpha)$ 的每个分量在区间 $(0, 1)$ 上是关于 $\alpha$ 的可微函数。
证明过程如下:
为了方便,设 $G = G(\alpha)$,$\pi^T(\alpha) = \pi^T$,$D_i = D_i(\alpha)$,并令 $A = I - G$。若 $adj(A)$ 表示余子式矩阵的转置(通常称为伴随矩阵),则有 $A[adj(A)] = 0 = [adj(A)]A$。根据Perron - Frobenius定理,$rank(A) = n - 1$,进而 $rank(adj(A)) = 1$。而且,Perron - Frobenius定理保证了 $[adj(A)]$ 的每一列都是 $e$ 的倍数,所以 $[adj(A)] = ew^T$ ,其中 $w$ 是