原论文:
Xue Chen, Kuan Cheng, Xin Li, and Minghui Ouyang. 2023. Improved Decoding of Expander Codes. IEEE Trans. Inf. Theor. 69, 6 (June 2023), 3574–3589. https://doi.org/10.1109/TIT.2023.3239163
The size-expansion tradeoff
Thm. Any (αN,(1−ε)D) expander is also roughly a (kαN,(1−kε)D) expander.
Note:
只要一个点集的 expansion rate >21 就说明依然存在 unique neighbors
通过这里的 tradeoff 可以把多余的 ε 转化较大的 ∣S∣
取 k=2ε1 依然可以满足要求,从而证明本文的主要结果:expander code dis ≥2εαD
何时 tight?存在一个子图,左侧 2εαN 个点,右侧 2εαN2D 个点都与左侧两个点相连。
Proof Sketch.
- T⊂L, N(T) 很小 → S∼(αNT), E[N(S)] 也很小
通过两种不同的放缩,得到:
- ∣N(T)∣≥(1−kε)D×kαN−O(εD×k2)
- ∣N(T)∣≥(1−3−k22kε−1)D×kαN−O(⋯)
第二个 bound 对 k>2ε1 时候更紧。
第二个界的证明想法及其完整结果
假设右侧有 βi⋅αN 个点与 S 中恰好 i 个点相连,则有约束(约束的答案是 expansion 的下界):
mins.t.∑βi∑i⋅βi=k∑(1−(1−k1)j)⋅βj≥1−εβj≥0.其中第二条来自于 N(T) 中每个点与 S 相连的概率,(实际上这里的概率是 ∣S∣!/(∣S∣−j)!(∣S∣−∣T∣)!/(∣S∣−∣T∣−j)!=1−(∣S∣∣S∣−∣T∣)j+O(Sj))
(对这个 O 里面的东西我不太确定,试着放缩了几次没有得到一样的结果,但是 k 大一点的时候应该不会很大)
写出这个 LP(1) 的对偶形式 LP(2):
max s.t. x1⋅k+(1−ε)⋅x2j⋅x1+(1−(1−k1)j)⋅x2≤1x1,x2≥0.Lem LP(1) 的最优解中,仅仅有两个相邻的 βi,βi+1 非零.
Proof Sketch. 若 βj=0,根据线性规划的相关定理,一定有对偶形式中的对应约束取等,即: j⋅x1+(1−(1−k1)j)⋅x2=1. 然而因为 (1−(1−k1)j) 严格上凸,所以如果存在两个非相邻的 βl,βr 都大于零,则可以推断在他们之间的 ∀j∈[l,r],j⋅x1+(1−(1−k1)j)>1,都无法满足 LP(2) 中的限制。
直观上讲,右边的点与左边 S 相连的边数越平均,越接近这个bound。
接下来,我们考虑最优解中哪两个 βi,βi+1 非零,就可以解出相应的 x1,x2,使得对应约束等号取等。然后就可以得到对偶形式答案的一个下界。
- 假如取 i=2,可以得到 x1=3−k22−k1−k,x2=3−k2k2, 带入 x1⋅k+(1−ε)⋅x2 就得到第二个 bound
- 假如取 i=1 就可以得到上一个结果。
文章里还提到,当 1−ε∈[j+1k(1−(1−k1)j+1),jk(1−(1−k1)j)] 的时候,LP(2) 会在 βj,βj+1=0 处极值,也即:k≤2ε1 时,j=1 最优。
对于一般的 j:
x2x1=1−(1+kj)(1−k1)j1,=−x2⋅k(1−k1)j=1−(1+kj)(1−k1)j−k1⋅(1−k1)j.对应 expansion 下界:
∣N(T)∣≥αND⋅(x1⋅k+(1−ε)⋅x2)≥αND⋅(1−ε−(1−k1)j)x2≥αND⋅1−(1+kj)(1−k1)j1−ε−(1−k1)j.
如果我认为 j 是连续的,那么 j 的最优取值应该满足 1−ε≈jk(1−(1−k1)j),带入上式,也许能对于较大的 k 得到一般的结果? 但是因为 k=2ε1 时已经 tight,无法改进 dis.
∣N(T)∣≥αND2εk+1k (展开了 (1−k1)j 前两项)
Expander Code Dis Upperbound
Thm. 对于任何一个 ε,η 都能找到一个 α,D (α 可能比较小,D 可能要比较大),使得一个 (αN,(1−ε−η)) expander code dis ≤2εαN
Idea: 通过 Ramanujan Graph 的 vertex-edge graph 构造出来一个左侧 D,右侧 2 regular 的二分图,其中左侧 2εαN 个点。其余的点数用随机二分图补齐。
因为 expander mixing lemma 可以得到原图 edge expansion 的下界,对应到这个图上就是 vertex expansion.
这样,这个子图中的 bits 全取 1 就构成一个 codeword,这样的图在右侧不是 regular 的,后面提到一个 open question 是能不能构造一个左右都 regular 的图。
Note: 为什么 Ram-Graph 的点数不能更小一点?
expander mixing lemma: E(S,S)≈2∣V(H)∣D⋅∣S∣2≤ε∣S∣D,其中 S 是 αN,从而 V(H) 必须大于 2εαN。
Question:
这里一定要用 ram-graph 对应的二分图吗?用随机的正则二分图会有什么问题?
根据后面的定理,随机的 (D,DR) regular graph 高概率是 (αN,α1(DRD(1−(1−α)DR)−2αDloge/α) expander. (大约就是邻居数量的期望减去一个小量)
假如希望类似上面构造一个小 expander graph,使得左边点数小于 2εαN。则对于这个小图来说 α′≥2ε,带入上式,需要 DR 很小(常数级别)。
Q: 假如 D,DR 固定,可以能得到多小的上界?
α′≤Dr−12ε ,则 N′≥αα′N=2εαN(DR−1) (展开前两项)
Finding a superset of flipped bits

Lem. 若对 F (被翻转的 bits) 的任意子集 S,都有 U(S)≥(1−2Δ)D∣S∣,则上述算法找到的 L⊇F。
Proof Sketch. 若否,在F−L 中可以找到一个贡献超过 (1−2Δ)D 个 unique neighbors 的点 v,其贡献的 UN 中至少有一个点没有被加入 R 中,从而该点与 L 也不相连,也是 F 的 UN,因此这个 parity check 一定不满足,与其不在 R 中矛盾。
性质:
- 上述过程按照任意顺序加点得到的 L 总是一致的
- 若满足上面引理的条件,则总存在一种加点顺序,把 F 中的点恰好全加到 L。
有时候,还可以通过某些条件证明最终 ∣L∣≤kαN,后面很多地方用到了类似的 argument:
Proof Sketch.
假设已知 F 的 expansion 为 (1−γ)D
若否,我们考虑算法过程进行到一半,已经加入 kαN 的情形。我们总能假定先加入了所有 F 中的点,从而有:
(1−kε)kDαN−O(…)≤∣N(L)∣≤(1−γ)D∣F∣+2ΔD(kαN−∣F∣).其中不等式第一部分来自 size-expansion tradeoff, 第二部分来自将 F 加入 L 后,每个新加的节点最多贡献 2ΔD 个新点到 R 中。
化简得到:
∣F∣≥kαN1−γ−2Δ1−kε−2Δ+O(…).如果此时通过某些条件可以得到 F 的实际大小比这小,则可以推出矛盾。
换用 Flip
算法的直觉是:使用更小的阈值,从而允许更大的 ∣F∣(上式)
Analysis of Flip
Algorithm
假设阈值为: 1−t。
在 ∣F∪L∣≤kαN 的前提下,文中 k=1(∣F∣≤kαN1−γ−t1−kε−t 即可满足):
∣F−L∣≤t2γ∣F∣,∣L−F∣≤1−kε−tkε−γ∣F∣前者通过对 N1(F) 用类似 Markov Bound 的方式估计,后者对 ∣F∪L∣ 用前文类似的 Argument 估计。
我们希望 ∣F−L∣+∣L−F∣≤∣F∣⋅(1−Ω(1)),计算可得,当 ε<41,t=3γ 的时候,刚好达到。
Guessing expansion

这一算法对于 ∀ε=41−β 的 expansion,都可以纠正 (1−ε)αN 个错。假定我们知道 F 的 expansion (1−γ)D∣F∣,我们会有如下高效的做法:
-
若 γ>32ε 则直接用上一个 section 算法找出 F 的超集,并且这一集合大小小于 αn (用之前提到的 argument),直接用 Viderman 的 erasure 的算法可以求解。
-
若 γ≤32ε 则找到 S={v∣v∈L,∣N(V)∩C∣≥(1−3γ)},可以证明翻转 S 中 bits 时,F 会减小 β 的比例。
Proof Sketch. 先用类似之前的 argument 说明 ∣Fi∪L0∣≤(1−ε)(1+3η)∣Fi∣。随后可以求出 ∣Fi∣ 和 ∣L0−Fi∣ 之间的比例,再根据 Fi 的 UN 数给出 ∣Fi−L0∣ 的一个上界。
然而我们不知道,所以只能每次猜测一个 γ,把 (0,1) 分为 1/η=(100/β) 段 (而非是 n×m 个分数),然后要猜对 l=log1−β1/3 次,所以额外复杂度 η−l,对 β 是指数级的,只是这里当作 β 是常数,所以算是 O(1)。
为什么 γ>32ε 的时候不可以用FLIP?
Improved decoding for ε≤81
这部分对于较小的 ε 给出了解码半径 2ε2−1αN>163αN 的算法。

下面是这部分一个比较有意思的结论。
Clm. 假设已知 ∣F∣=xαN,∣N(F)∣=∣F∣(1−γ)D,则 ∀F′⊂F,∣F′∣≥αN 都有 ∣N(F′)∣≥∣F′∣D(1−εγx)
Proof Sketch. 假设 ∣N(F′)∣≥∣F′∣D(1−β),则根据 tradeoff 可以得到 ∣F′∣ 大小的下界,随后再因为 F′ 中的 collision 比 F 中的总数要少,可以得到 β 的上界。
根据前面 Find
的性质,这一 Δ 的选取意味着 Find
总能包含所有出错的bits.
后面就是又用相似的 argument 证明了 Find
找到的集合大小一定小于 2ε1−2εαN。
另一个理解:
当阈值取 t 时,我知道第一轮过后就有 ∣F−L∣≤∣F∣t2γ
对于这么大的集合,由于 trade-off,容易说明其中至少有 (1−xt2γ) 比例的边,连到了第一轮之后的 U′:=U∪N(L) 中。 从而通过平衡 t 的大小,可以说明当 t:=O(xεγ) 的时候找到的 erasure 依然可以包含整个 F。
预览: