这是用户在 2025-2-19 21:04 为 https://www.blog-e.top/2024/07/20/Improved-Decoding-of-Expander-Codes-%E5%AD%A6%E4%B9%A0%E7%AC%94%E8... 保存的双语快照页面,由 沉浸式翻译 提供双语支持。了解如何保存?

Improved Decoding of Expander Codes 学习笔记

原论文:

Xue Chen, Kuan Cheng, Xin Li, and Minghui Ouyang. 2023. Improved Decoding of Expander Codes. IEEE Trans. Inf. Theor. 69, 6 (June 2023), 3574–3589. https://doi.org/10.1109/TIT.2023.3239163

The size-expansion tradeoff

Thm. Any (αN,(1ε)D)(\alpha N,(1-\varepsilon) D) expander is also roughly a (kαN,(1kε)D)(k \alpha N,(1-k \varepsilon )D) expander.

Note:

只要一个点集的 expansion rate >12> \frac{1}{2} 就说明依然存在 unique neighbors

通过这里的 tradeoff 可以把多余的 ε\varepsilon 转化较大的 S|S|

k=12εk=\frac{1}{2 \varepsilon} 依然可以满足要求,从而证明本文的主要结果:expander code dis αD2ε\ge \frac{\alpha D}{2\varepsilon} 何时 tight?存在一个子图,左侧 α2εN\frac{\alpha}{2 \varepsilon } N 个点,右侧 α2εND2\frac{\alpha}{2 \varepsilon } N \frac{D}{2} 个点都与左侧两个点相连。

Proof Sketch.

  • TLT\subset L, N(T)N(T) 很小 \rightarrow S(TαN)S\sim {T\choose \alpha N}, E[N(S)]E[N(S)] 也很小

通过两种不同的放缩,得到:

  • N(T)(1kε)D×kαNO(εD×k2)|N(T)|\ge (1-k \varepsilon )D\times k \alpha N-O(\varepsilon D\times k^2)
  • N(T)(12kε132k)D×kαNO()|N(T)|\ge (1-\frac{2k \varepsilon-1}{3-\frac{2}{k}} )D\times k \alpha N-O(\cdots)

第二个 bound 对 k>12εk>\frac{1}{2\varepsilon} 时候更紧。

第二个界的证明想法及其完整结果

假设右侧有 βiαN\beta_i \cdot \alpha N 个点与 SS 中恰好 i 个点相连,则有约束(约束的答案是 expansion 的下界):

minβis.t.iβi=k(1(11k)j)βj1εβj0. \begin{aligned} \min& \sum \beta_i\cr \text{s.t.}& \sum i\cdot \beta_i=k\cr &\sum (1-(1-\frac{1}{k})^j)\cdot \beta _j\ge 1-\varepsilon \cr &\beta _j\ge 0. \end{aligned}

其中第二条来自于 N(T)N(T) 中每个点与 SS 相连的概率,(实际上这里的概率是 (ST)!/(STj)!S!/(Sj)!=1(STS)j+O(jS)\frac{(|S|-|T|)!/(|S|-|T|-j)!}{|S|!/(|S|-j)!}=1-\left( \frac{|S|-|T|}{|S|} \right)^j+O(\frac{j}{S})

(对这个 O 里面的东西我不太确定,试着放缩了几次没有得到一样的结果,但是 k 大一点的时候应该不会很大)

写出这个 LP(1) 的对偶形式 LP(2):

max x1k+(1ε)x2s.t. jx1+(1(11k)j)x21x1,x20. \begin{aligned} \max\ &x_{1}\cdot k+(1-\varepsilon )\cdot x_{2}\cr \text{s.t. }&j\cdot x_{1}+(1-(1-\frac{1}{k})^j)\cdot x_{2}\le 1\cr &x_{1},x_{2}\ge 0. \end{aligned}

Lem LP(1) 的最优解中,仅仅有两个相邻的 βi,βi+1\beta _i,\beta _{i+1} 非零.

Proof Sketch.βj0\beta _j\neq 0,根据线性规划的相关定理,一定有对偶形式中的对应约束取等,即: jx1+(1(11k)j)x2=1j\cdot x_{1}+(1-(1-\frac{1}{k})^j)\cdot x_{2}= 1. 然而因为 (1(11k)j)(1-(1-\frac{1}{k})^j) 严格上凸,所以如果存在两个非相邻的 βl,βr\beta_l,\beta _r 都大于零,则可以推断在他们之间的 j[l,r],jx1+(1(11k)j)>1\forall j\in [l,r],j\cdot x_{1}+(1-(1-\frac{1}{k})^j)>1,都无法满足 LP(2) 中的限制。

直观上讲,右边的点与左边 SS 相连的边数越平均,越接近这个bound。

接下来,我们考虑最优解中哪两个 βi,βi+1\beta_i,\beta _{i+1} 非零,就可以解出相应的 x1,x2x_{1},x_{2},使得对应约束等号取等。然后就可以得到对偶形式答案的一个下界。

  • 假如取 i=2i=2,可以得到 x1=21kk32k,x2=k232kx_{1}=\frac{2-\frac{1}{k}-k}{3-\frac{2}{k}},x_{2}=\frac{k^2}{3-\frac{2}{k}}, 带入 x1k+(1ε)x2x_{1}\cdot k+(1-\varepsilon )\cdot x_{2} 就得到第二个 bound
  • 假如取 i=1i=1 就可以得到上一个结果。

文章里还提到,当 1ε[kj+1(1(11k)j+1),kj(1(11k)j)]1-\varepsilon \in [\frac{k}{j+1}(1-(1-\frac{1}{k})^{j+1}),\frac{k}{j}(1-(1-\frac{1}{k})^j)] 的时候,LP(2) 会在 βj,βj+10\beta_j,\beta _{j+1}\neq 0 处极值,也即:k12εk\le \frac{1}{2\varepsilon} 时,j=1j=1 最优。

对于一般的 jj:

x2=11(1+jk)(11k)j,x1=x2(11k)jk=1k(11k)j1(1+jk)(11k)j. \begin{aligned} x_{2}&=\frac{1}{1-(1+\frac{j}{k})(1-\frac{1}{k})^j},\cr x_{1}&=-x_{2}\cdot \frac{(1-\frac{1}{k})^j}{k}=\frac{-\frac{1}{k}\cdot (1-\frac{1}{k})^j}{1-(1+\frac{j}{k})(1-\frac{1}{k})^j}. \end{aligned}

对应 expansion 下界:

N(T)αND(x1k+(1ε)x2)αND(1ε(11k)j)x2αND1ε(11k)j1(1+jk)(11k)j. \begin{aligned} |N(T)|&\ge \alpha ND\cdot (x_{1}\cdot k+(1-\varepsilon )\cdot x_{2})\cr &\ge \alpha ND\cdot (1-\varepsilon -(1-\frac{1}{k})^j)x_{2}\cr &\ge \alpha ND\cdot \frac{1-\varepsilon -(1-\frac{1}{k})^j}{1-(1+\frac{j}{k})(1-\frac{1}{k})^j}. \end{aligned}

如果我认为 jj 是连续的,那么 j 的最优取值应该满足 1εkj(1(11k)j)1-\varepsilon \approx \frac{k}{j}(1-(1-\frac{1}{k})^j),带入上式,也许能对于较大的 k 得到一般的结果? 但是因为 k=12εk=\frac{1}{2 \varepsilon} 时已经 tight,无法改进 dis. N(T)αNDk2εk+1|N(T)|\ge \alpha ND \frac{k}{2 \varepsilon k+1} (展开了 (11k)j(1-\frac{1}{k})^j 前两项)

Expander Code Dis Upperbound

Thm. 对于任何一个 ε,η\varepsilon,\eta 都能找到一个 α,D\alpha,D (α\alpha 可能比较小,DD 可能要比较大),使得一个 (αN,(1εη))(\alpha N,(1-\varepsilon -\eta )) expander code dis αN2ε\le \frac{\alpha N}{2 \varepsilon}

Idea: 通过 Ramanujan Graph 的 vertex-edge graph 构造出来一个左侧 D,右侧 2 regular 的二分图,其中左侧 α2εN\frac{\alpha }{2\varepsilon }N 个点。其余的点数用随机二分图补齐。

因为 expander mixing lemma 可以得到原图 edge expansion 的下界,对应到这个图上就是 vertex expansion.

这样,这个子图中的 bits 全取 1 就构成一个 codeword,这样的图在右侧不是 regular 的,后面提到一个 open question 是能不能构造一个左右都 regular 的图。

Note: 为什么 Ram-Graph 的点数不能更小一点?

expander mixing lemma: E(S,S)D2V(H)S2εSDE(S,S)\approx \frac{D}{2|V(H)|}\cdot |S|^2\le \varepsilon |S|D,其中 SSαN\alpha N,从而 V(H)V(H) 必须大于 α2εN\frac{\alpha}{2\varepsilon}N

Question:

这里一定要用 ram-graph 对应的二分图吗?用随机的正则二分图会有什么问题?

根据后面的定理,随机的 (D,DR)(D,D_R) regular graph 高概率是 (αN,1α(DDR(1(1α)DR)2αDloge/α)(\alpha N,\frac{1}{\alpha }(\frac{D}{D_R}(1-(1-\alpha)^{D_R})-2 \alpha \sqrt{D \log e/\alpha}) expander. (大约就是邻居数量的期望减去一个小量)

假如希望类似上面构造一个小 expander graph,使得左边点数小于 αN2ε\frac{\alpha N}{2 \varepsilon }。则对于这个小图来说 α2ε\alpha'\ge 2 \varepsilon,带入上式,需要 DRD_R 很小(常数级别)。

Q: 假如 D,DRD,D_R 固定,可以能得到多小的上界? α2εDr1\alpha' \le \frac{2\varepsilon}{D_r-1} ,则 NαNα=αN(DR1)2εN'\ge \alpha \frac{N}{\alpha '} =\frac{\alpha N (D_R-1)}{2 \varepsilon} (展开前两项)

Finding a superset of flipped bits

Lem. 若对 FF (被翻转的 bits) 的任意子集 SS,都有 U(S)(12Δ)DSU(S)\ge (1-2\Delta)D|S|,则上述算法找到的 LFL\supseteq F

Proof Sketch. 若否,在FLF-L 中可以找到一个贡献超过 (12Δ)D(1-2 \Delta)D 个 unique neighbors 的点 vv,其贡献的 UN 中至少有一个点没有被加入 RR 中,从而该点与 LL 也不相连,也是 FF 的 UN,因此这个 parity check 一定不满足,与其不在 RR 中矛盾。

性质:

  • 上述过程按照任意顺序加点得到的 LL 总是一致的
  • 若满足上面引理的条件,则总存在一种加点顺序,把 FF 中的点恰好全加到 LL

有时候,还可以通过某些条件证明最终 LkαN|L|\le k \alpha N,后面很多地方用到了类似的 argument:

Proof Sketch. 假设已知 FF 的 expansion 为 (1γ)D(1-\gamma )D

若否,我们考虑算法过程进行到一半,已经加入 kαNk \alpha N 的情形。我们总能假定先加入了所有 FF 中的点,从而有:

(1kε)kDαNO()N(L)(1γ)DF+2ΔD(kαNF). (1-k \varepsilon ) k D \alpha N-O(\ldots ) \le |N(L)| \le (1-\gamma )D|F|+2 \Delta D (k \alpha N -|F|) .

其中不等式第一部分来自 size-expansion tradeoff, 第二部分来自将 FF 加入 LL 后,每个新加的节点最多贡献 2ΔD2\Delta D 个新点到 RR 中。

化简得到:

FkαN1kε2Δ1γ2Δ+O(). |F|\ge k \alpha N \frac{1-k \varepsilon -2 \Delta }{1-\gamma -2 \Delta} +O(\ldots ) .

如果此时通过某些条件可以得到 FF 的实际大小比这小,则可以推出矛盾。

换用 Flip 算法的直觉是:使用更小的阈值,从而允许更大的 F|F|(上式)

Analysis of Flip Algorithm

假设阈值为: 1t1-t

FLkαN|F\cup L|\le k\alpha N 的前提下,文中 k=1k=1FkαN1kεt1γt|F|\le k\alpha N\frac{1-k\varepsilon -t}{1-\gamma -t} 即可满足):

FL2γtF,LFkεγ1kεtF |F - L|\le \frac{2 \gamma}{t} |F|, |L-F|\le \frac{k \varepsilon - \gamma }{1-k \varepsilon - t} |F|

前者通过对 N1(F)N^1(F) 用类似 Markov Bound 的方式估计,后者对 FL|F\cup L| 用前文类似的 Argument 估计。

我们希望 FL+LFF(1Ω(1))|F-L|+|L-F|\le |F|\cdot (1-\Omega(1)),计算可得,当 ε<14,t=3γ\varepsilon < \frac{1}{4}, t =3 \gamma 的时候,刚好达到。

Guessing expansion

这一算法对于 ε=14β\forall \varepsilon = \frac{1}{4}-\beta 的 expansion,都可以纠正 (1ε)αN(1-\varepsilon)\alpha N 个错。假定我们知道 FF 的 expansion (1γ)DF(1-\gamma )D|F|,我们会有如下高效的做法:

  • γ>23ε\gamma > \frac{2}{3}\varepsilon 则直接用上一个 section 算法找出 FF 的超集,并且这一集合大小小于 αn\alpha n (用之前提到的 argument),直接用 Viderman 的 erasure 的算法可以求解。

  • γ23ε\gamma \le \frac{2}{3}\varepsilon 则找到 S={vvL,N(V)C(13γ)}S=\{v\mid v\in L, |N(V)\cap C|\ge (1-3 \gamma)\},可以证明翻转 SS 中 bits 时,FF 会减小 β\beta 的比例。

    Proof Sketch. 先用类似之前的 argument 说明 FiL0(1+3η)Fi(1ε)|F_i\cup L_{0}|\le \frac{(1+3 \eta )|F_i|}{(1-\varepsilon )}。随后可以求出 Fi|F_i|L0Fi|L_{0}-F_i| 之间的比例,再根据 FiF_i 的 UN 数给出 FiL0|F_i-L_{0}| 的一个上界。

然而我们不知道,所以只能每次猜测一个 γ\gamma,把 (0,1)(0,1) 分为 1/η=(100/β)1/\eta=(100/\beta) 段 (而非是 n×mn\times m 个分数),然后要猜对 l=log1β1/3l=\log_{1-\beta}1/3 次,所以额外复杂度 ηl\eta^{-l},对 β\beta 是指数级的,只是这里当作 β\beta 是常数,所以算是 O(1)O(1)

为什么 γ>23ε\gamma >\frac{2}{3}\varepsilon 的时候不可以用FLIP?

Improved decoding for ε18\varepsilon \le \frac{1}{8}

这部分对于较小的 ε\varepsilon 给出了解码半径 212εαN>316αN\frac{\sqrt{2}-1 }{2\varepsilon}\alpha N>\frac{3}{16}\alpha N 的算法。

下面是这部分一个比较有意思的结论。

Clm. 假设已知 F=xαN,N(F)=F(1γ)D|F|=x \alpha N, |N(F)|= |F|(1-\gamma)D,则 FF,FαN\forall F'\subset F,|F'|\ge \alpha N 都有 N(F)FD(1εγx)|N(F')|\ge |F'|D(1-\sqrt{\varepsilon \gamma x})

Proof Sketch. 假设 N(F)FD(1β)|N(F')|\ge |F'|D(1-\beta ),则根据 tradeoff 可以得到 F|F'| 大小的下界,随后再因为 FF' 中的 collision 比 FF 中的总数要少,可以得到 β\beta 的上界。

根据前面 Find 的性质,这一 Δ\Delta 的选取意味着 Find 总能包含所有出错的bits.

后面就是又用相似的 argument 证明了 Find 找到的集合大小一定小于 12ε2εαN\frac{1-2 \varepsilon }{2\varepsilon}\alpha N

另一个理解:

当阈值取 tt 时,我知道第一轮过后就有 FLF2γt|F-L|\le |F| \frac{2 \gamma }{t} 对于这么大的集合,由于 trade-off,容易说明其中至少有 (1x2γt)(1- x\frac{2 \gamma }{t}) 比例的边,连到了第一轮之后的 UUN(L)U'\coloneqq U\cup N(L) 中。 从而通过平衡 tt 的大小,可以说明当 tO(xεγ)t\coloneqq O(\sqrt{x \varepsilon \gamma } ) 的时候找到的 erasure 依然可以包含整个 FF

你认为这篇文章怎么样?
  • 0
  • 0
  • 0
  • 0
  • 0
  • 0
评论
  • 按正序
  • 按倒序
  • 按热度
来发评论吧~
Powered by Waline v3.5.2