# 写在前面

前面综述里遇到了一个Cadzow迭代法,是用来解决低秩Hankel矩阵近似问题的著名算法,原文是1988年的[1],现在衍生出了一些变体。下面借助文献[2]介绍Cadzow迭代,当然还是在奇异谱分析领域下的。

# 线性递推关系

源信号S=(s1,,sN)\mathbb S~=~(s_1, \ldots, s_N)由线性递推关系(linear recurrence relation, LRR)产生

sn=i=1raisni,n=r+1,,N;ar0.s_n = \sum_{i = 1}^{r} a_i s_{n-i}, \quad n = r + 1, \ldots, N;\ a_r\neq 0.

上式也可表示成参数形式

sn=iPi(n)exp(αin)cos(2πωin+ψi),s_n = \sum_i P_i(n) \exp(\alpha_i n) \cos(2 \pi \omega_i n + \psi_i),

其中Pi(n)P_i(n)nn阶多项式。

去噪问题,即从观察信号X=S+N\mathbb X = \mathbb S + \mathbb N恢复出源信号S\mathbb S,可使用基于子空间的方法解决。设定嵌入长度LL,可得到轨迹矩阵

S=(s1s2sKs2s3sK+1sLsL+1sN)H\mathbf S = \begin{pmatrix} s_1 & s_2 & \ldots & s_K \\ s_2 & s_3 & \ldots & s_{K + 1} \\ \vdots & \vdots & \vdots & \vdots \\ s_L & s_{L + 1} & \ldots & s_N \end{pmatrix}\in \mathcal H

若信号S\mathbb Srr阶LRR产生,则rank(S)=r\text{rank} (\mathbf S) = r。根据ESPRIT方法,S\mathbf S的列空间,即信号的子空间,可提供参数αi\alpha_iωi\omega_i的估计。

# 近似问题

X\mathbf XX\mathbb X的轨道矩阵,则去噪问题可转化为如下秩不超过rr的Hankel矩阵近似问题

minrank(YrYHXYF2\min_{\substack{\text{rank}(\mathbf Y) \le r \\ \mathbf Y \in \mathcal H}}\|\mathbf X - \mathbf Y\|^2_\mathrm F

该问题是一类结构化低秩近似问题。Cadzow迭代法由Hankel矩阵空间和秩不大于rr的矩阵空间交替投影组成。此类问题的目标函数并不是单模态的(unimodal),而且向全局最小值的收敛性也不能保证,但是具有很广泛的研究背景。更进一步,上述近似问题可等价转化为如下加权近似问题。

minY:rank(Y)rYHi=1Nwi(xiyi)2\min_{\substack{\mathbb Y: \text{rank}(\mathbf Y) \le r \\ \mathbf Y \in \mathcal H}}\sum_{i = 1}^N w_i(x_i - y_i)^2

其中Y\mathbf Y是序列Y\mathbb Y的轨道矩阵,加权系数表示如下

wi={ifor i=1,,L1,Lfor i=L,,K,Ni+1for i=K+1,,N,w_i = \begin{cases} i & \text{for $i = 1, \ldots, L-1,$}\\ L & \text{for $i = L, \ldots, K,$}\\ N - i + 1 & \text{for $i = K + 1, \ldots, N$} \end{cases},

# 迭代的常规步骤

Hilbert空间X\mathsf X具有内积,\langle \cdot, \cdot \rangle,矩阵空间H\mathcal HX\mathsf X的线性子空间,子集M\mathcal M关于数乘是闭的(即α,zMαzM\forall\alpha,\exists\mathbf z \in \mathcal M\Rightarrow\alpha \mathbf z\in \mathcal M)。注意M\mathcal M不一定是线性空间或凸集。点x\mathbf x到集合HM\mathcal H~ \cap~\mathcal M的投影问题表示如下

minyHMxy\min_{\mathbf y \in \mathcal H \cap \mathcal M}\|\mathbf x - \mathbf y\|

设到H\mathcal H和到M\mathcal M的投影分别是ΠH\Pi_{\mathcal H}ΠM\Pi_{\mathcal M}。注意ΠM\Pi_{\mathcal M}不是唯一定义的(not uniquely defined),在这种模棱两可的情况下,选择任何最接近的点作为投影点。这两个投影显然都是正交的,对于后者,Pythagorean等式成立,即xX\forall\mathbf x \in \mathsf X,有x2=xΠMx2+ΠMx2\|\mathbf x\|^2~=~\|\mathbf x~-~\Pi_\mathcal M \mathbf x\|^2~+~\|\Pi_\mathcal M \mathbf x\|^2

下面回到用于求解投影问题的交替投影迭代法

yk+1=ΠHΠMyk,wherey0=x.\mathbf y_{k+1}=\Pi_\mathcal H \Pi_{\mathcal M} \mathbf y_{k}, \quad\text{where}\quad \mathbf y_{0}=\mathbf x.

收敛结论

  • k+k \to +\inftyykΠMyk0,ΠMykyk+10\|\mathbf y_k - \Pi_{\mathcal M}\mathbf y_k\| \to 0, \|\Pi_{\mathcal M}\mathbf y_k - \mathbf y_{k+1}\| \to 0

  • 记闭球B1={z:z1}B_1=\{\mathbf z: \|\mathbf z\|~\le~1\},若MB1\mathcal M \cap B_1是紧集,则存在收敛的子序列yi1,yi2,\mathbf y_{i_1}, \mathbf y_{i_2}, \ldots,使得其极限yMH\mathbf y^*\in\mathcal M \cap \mathcal H

  • ykΠMykΠMykyk+1yk+1ΠMyk+1.\|\mathbf y_k - \Pi_{\mathcal M} \mathbf y_k\| \ge \|\Pi_{\mathcal M} \mathbf y_k - \mathbf y_{k + 1}\|\ge \|\mathbf y_{k+1} - \Pi_{\mathcal M} \mathbf y_{k + 1}\|.

下面用这一步骤应用至降秩Hankel矩阵的近似问题。令X=RL×K\mathsf X = \mathbb R^{L\times K},Hankel矩阵空间HRL×K\mathcal H \subset \mathbb R^{L\times K},秩不超过rr的集合M=MrRL×K\mathcal M = \mathcal M_r\subset \mathbb R^{L\times K},则交替投影的迭代如下

Yk+1=ΠHΠMrYk,whereY0=XRL×K.\mathbf Y_{k+1}=\Pi_\mathcal H \Pi_{\mathcal M_r} \mathbf Y_{k},\quad\text{where}\quad\mathbf Y_{0}=\mathbf X \in \mathbb R^{L\times K}.

# 投影的表达形式

首先引入加权范数,用非负权矩阵定义加权F范数

Y,ZM=l=1Lk=1Kml,kyl,kzl,k.\langle\mathbf Y, \mathbf Z\rangle_\mathbf M = \sum_{l = 1}^L \sum_{k = 1}^K m_{l, k} y_{l, k} z_{l, k}.

加权范数记为X2=XM2=l=1Lk=1Kml,kxl,k2\|\mathbf X\|^2 = \|\mathbf X\|^2_\mathbf M = \sum_{l = 1}^L \sum_{k = 1}^K m_{l, k} x^2_{l, k}

  • 投影ΠH\Pi_\mathcal H

Hankel矩阵可通过加权对角平均求得。令Y^=ΠHY\widehat{\mathbf Y}=\Pi_\mathcal H \mathbf Y,则

y^ij=l,k:l+k=i+jml,kyl,kl,k:l+k=i+jml,k. \hat{y}_{ij} = \frac{\sum_{l,k:\, l+k=i+j} m_{l,k} y_{l,k}}{\sum_{l,k:\, l+k=i+j} m_{l,k}}.

  • 投影ΠMr\Pi_{\mathcal M_r}

从简单的等权值(mij=1m_{ij}=1)情况出发,令Πr=ΠMr\Pi_r=\Pi_{\mathcal M_r},则投影ΠrY\Pi_{r} \mathbf Y通过SVD来计算。设Y=UΣVT\mathbf Y = \mathbf U \mathbf{\Sigma} \mathbf V^\mathrm T,对奇异值矩阵进行截断Σr=(σlkr)\mathbf{\Sigma}_r = (\sigma^r_{l k}),当i=j,iri = j, i \le rσijr=σi\sigma^r_{i j}=\sigma_i,否则σijr=0\sigma^r_{i j}=0。投影可表示为ΠrY=UΣrVT\Pi_{r} \mathbf Y = \mathbf U \mathbf{\Sigma}_r \mathbf V^\mathrm T

下面考虑一般的权重矩阵M\mathbf M。固定M\mathbf M

ZRL×K,CS+K×K,s.t.ZM2=tr(ZCZT)\forall \mathbf Z\in \mathbb R^{L\times K},\exists \mathbf C\in\mathcal S^{K\times K}_+,\text{s.t.}\|\mathbf Z\|_\mathbf M^2 = \text{tr}(\mathbf Z \mathbf C \mathbf Z^\mathrm T)

注意,此处仅说明了矩阵C\mathbf C的存在性,并未说明其怎么构造。假设矩阵C\mathbf C的列空间包含矩阵的Y\mathbf Y列空间,则

ΠMrY=(ΠrB)(OCT),\Pi_{\mathcal M_r} \mathbf Y = (\Pi_r \mathbf B) (\mathbf O_\mathbf C^{\mathrm T})^\dagger,

其中C=OCTOC,B=YOCT\mathbf C = \mathbf O_\mathbf C^{\mathrm T}\mathbf O_\mathbf C, \mathbf B = \mathbf Y \mathbf O_\mathbf C^{\mathrm T}。实际上满足条件ZM2=tr(ZCZT)\|\mathbf Z\|_\mathbf M^2 = \text{tr}(\mathbf Z \mathbf C \mathbf Z^\mathrm T)的矩阵C\mathbf C和矩阵M\mathbf M具有特殊的结构形式。下面用一种迭代的方式构造矩阵序列Yk\mathbf Y _k来逼近ΠMrY\Pi_{\mathcal M_r} \mathbf Y

Yk+1=Πr(YM+Yk(QM))\mathbf Y_{k+1} = \Pi_r(\mathbf Y \odot \mathbf M + \mathbf Y_{k} \odot (\mathbf Q - \mathbf M))

其中QRL×K\mathbf Q \in \mathsf R^{L \times K}是元素全为11的矩阵,初始化矩阵Y0=Y\mathbf Y_0 = \mathbf Y。当权值M\mathbf M的元素为二值矩阵时,即mijm_{ij}等于0或1,该迭代本质上是EM算法。从形式上看,在权重为零的位置上,Y\mathbf Y中的数值并不重要。但是,这些值会影响算法的收敛速度和极限值。

# 向量内积与矩阵内积

向量形式的加权最小二乘目标为

minYXNrfq(Y)=i=1Nqi(xiyi)2\min _{\mathbb Y \in \mathsf X_N^r}f_q(\mathbb Y) = \sum \limits_{i=1}^N q_i(x_i - y_i)^2

序列X=(x1,,xN)XN\mathbb X = (x_1, \ldots, x_N) \in \mathsf X_N与轨道矩阵X=(x^l,k)H\mathbf X = (\hat x_{l,k}) \in \mathcal H之间存在一一映射关系T(X)=X\mathcal T(\mathbb X) = \mathbf X,其中x^l,k=xl+k1\hat x_{l, k} = x_{l + k - 1}。首先引入一种向量的半内积Y,Zq=i=1Nqiyizi\langle\mathbb Y,\mathbb Z\rangle_q = \sum_{i = 1}^N q_i y_i z_i,对应向量形式的半范数版本最小二乘为

minYXNrfq(Y)=YXq2\min _{\mathbb Y \in \mathsf X_N^r}f_q(\mathbb Y) = \|\mathbb Y-\mathbb X\|_q^2

下面将向量形式的加权最小二乘问题向矩阵形式推广。同样给出两个矩阵形式的半内积

Y,Z1,M=Y,ZM=l=1Lk=1Kml,kyl,kzl,kY,Z2,C=tr(YCZT)\begin{aligned} \langle\mathbf Y,\mathbf Z\rangle_{1,\mathbf M} &= \langle\mathbf Y,\mathbf Z\rangle_{\mathbf M} = \sum_{l = 1}^L \sum_{k=1}^K m_{l,k} y_{l,k} z_{l,k}\\ \langle\mathbf Y,\mathbf Z\rangle_{2,\mathbf C} &= \text{tr}(\mathbf Y \mathbf C \mathbf Z^\mathrm T) \end{aligned}

注意,当矩阵M\mathbf M为全11阵,矩阵C\mathbf C为单位阵时,这两个半内积退化到标准矩阵内积。下面给出半内积的性质。

  • Y=T(Y),Z=T(Z)\mathbf Y = \mathcal T(\mathbb Y),\mathbf Z = \mathcal T(\mathbb Z),则Y,Zq=Y,Z1,M\langle\mathbb Y,\mathbb Z\rangle_q= \langle \mathbf Y,\mathbf Z \rangle_{1,\mathbf M}的充要条件是

    qi=1lL1kKl+k1=iml,k.q_i = \sum_{\substack{1 \le l \le L \\ 1 \le k \le K \\ l+k-1=i}} m_{l,k}.

  • Y,Z1,M=Y,Z2,C\langle\mathbf Y,\mathbf Z\rangle_{1,\mathbf M}= \langle\mathbf Y,\mathbf Z\rangle_{2,\mathbf C}的充要条件是C=diag(c1,,cK)\mathbf C=\text{diag}(c_1,\ldots,c_K)为对角阵,且ml,k=ckm_{l,k}=c_k

有了这些性质,矩阵形式的加权最小二乘问题表示如下

minYMrHfM(Y)=XY1,M2=l=1Lk=1Kml,k(xl,kyl,k)2\min_{\mathbf Y \in \mathcal M_r \cap \mathcal H}f_\mathbf M(\mathbf Y) = \|\mathbf X-\mathbf Y\|^2_{1,\mathbf M} = \sum_{l = 1}^L \sum_{k=1}^K m_{l,k} (x_{l,k} - y_{l,k})^2

# Cadzow迭代

前面已经提过投影ΠMr\Pi_{\mathcal M_r}的表达式,对于等权情况可用截断SVD来求解,而对于更一般的情况需要如下迭代式来逼近。

# 原始的Cadzow迭代

最初的Cadzow迭代是针对等权重矩阵的最小二乘问题设计的,即mij=1m_{ij}=1,或者向量形式权值wiw_i为分段线性函数。因此两个投影ΠH\Pi_\mathcal HΠMr=Πr\Pi_{\mathcal M_r}=\Pi_{\mathcal r}都可显式表达。

# 加权的Cadzow迭代

令向量权重qi=1,iq_{i}=1,\forall i,根据qi=1lL1kKl+k1=iml,kq_i = \sum_{\substack{1 \le l \le L \\ 1 \le k \le K \\ l+k-1=i}} m_{l,k},则矩阵权重ml,k=wl+k11m_{l, k} = w_{l + k - 1}^{-1}

# 扩展的Cadzow迭代

将长度为NN的信号X\mathbb X进行扩展,在两侧同时添加L1L-1个采样点,得到的修改信号X~\widetilde{\mathbb X}长度为N+2L2N+2L-2,轨道矩阵从XRL×(NL+1)\mathbf X\in\mathbb R^{L\times (N-L+1)}变成X~RL×(N+L1)\widetilde{\mathbf X}\in\mathbb R^{L\times (N+L-1)}。原始部分权值为1,拓展部分权值为0,即

mi,j={1,if 1i+jLN,0,otherwise.m_{i,j} = \begin{cases} 1, & \text{if}\ 1 \le i+j-L \le N, \\ 0, & \text{otherwise.} \end{cases}

# 斜Cadzow迭代

由于两种范数的等式关系ZM2=tr(ZCZT)\|\mathbf Z\|_\mathbf M^2 = \text{tr}(\mathbf Z \mathbf C \mathbf Z^\mathrm T),可以考虑用矩阵C\mathbf C来刻画的加权最小二乘问题。

这需要选择合适的权值,主要包括以下三种。当然这个需要深入的推敲,就不在此展开了。

  • Cadzow(α\alpha) iterations
  • Cadzow-C^\widehat{\mathbf C} iterations
  • Weights qiq_i produced by the algorithms

# References


  1. Cadzow J A . Signal enhancement-a composite property mapping algorithm[J]. Acoustics Speech & Signal Processing IEEE Transactions on, 1988, 36(1):49-62. ↩︎

  2. Zvonarev N , Golyandina N . Iterative algorithms for weighted and unweighted finite-rank time-series approximations[J]. Stats and its interface, 2016, 10(1):5-18. ↩︎