信息处理超级物体的物理学:木星大脑中的日常生活
1999 年 12 月 22 日
摘要
物理学限制了信息处理,因此智能生物及其文明的可能形式。在这篇综述中,我讨论了密度、速度、尺寸、能量耗散和通信方面的物理限制,概述了非常强大的信息处理对象的约束。
1 引言
物理定律无论智能生物的动机、文化或技术如何,都对他们的活动施加限制。随着智能生命开始扩展其潜力,信息存储、处理和管理将变得极其重要。有人认为,文明通常都是信息有限的[64],而且智能生物所做的一切,不仅仅是思考,还包括经济、艺术和情感,都可以被视为信息处理[4,第 660 页]。这意味着信息处理的物理学对任何文明能够实现的事情都施加了限制。在以下内容中,我将探讨超大型计算系统的问题。它们代表了个体或文化可能达到的极限。
一个日益发展的文明将需要更多的信息处理。如果任何资源存在内部竞争,那么为了增加供应,就会产生强烈的扩张动机,无论是计划性的行动、市场竞争还是基本的趋同。由于所有类型的增长和存在都消耗资源(无论是金属、硅、能源、内存空间还是注意力),并且倾向于继续扩张,直到一个利基市场被填满,当文明的一部分为了争夺有限的资源而竞争、扩大其范围、增长直到填满可用的利基市场,并通过其扩张产生的新需求(包括由稀缺性引起的寻找新资源或利基市场的努力)而产生新的增长时,就会形成一个正反馈循环。这导致信息处理呈指数增长,直到达到物理定律和技术设定的限制,或者进入另一个制度[73]。 更具体地说,对于个体来说,以软件而非(生物)硬件的形式存在在灵活性和效率方面似乎更有优势[59, 58,]
60]:维持存在所需的资源更少,自动进化
1
1
^(1) { }^{1} 变得更加可行,其存在的限制由其存在的计算系统决定,而不是一个恒定的身体;随着技术的进步,存在也将被扩展。很可能将构建出比任何基因进化生物都要快、密度大、体积大的计算系统。一个信息实体(信息形态
2
2
^(2) { }^{2} )可以在其实现的计算系统所限制的时间尺度内进化并发挥作用,而一个物理存在有一个由其大小和组成(这由生物进化的可用材料和存在的进化过去决定,而不是其自身目标)决定的特征时间尺度。 因此,我们看到存在许多原因导致非常强大的信息处理系统的出现。但是,根据已知的物理学,它们的极限是什么? 本文将回顾大规模信息处理的物理极限。第 2 节概述了将要研究的限制。第 3 节讨论了内存存储密度和在一定程度上处理元素的界限,这取决于可用的建筑材料和基本物理极限。第 4 节考虑了计算速度,系统元素状态变化的速度有多快,主要基于可用的能量密度。第 5 节考虑了非常大的系统以及对抗重力的维持方法。第 6 节讨论了计算系统中熵耗散的需求,这为运行计算和必要的散热所需的能量设定了下限。第 7 节讨论了通信的限制,如延迟、带宽和噪声。第 8 节考虑了诸如量子计算、黑洞计算、虫洞和物理末日学等奇异物理学,这些理论或推测性质但如果有可能将使非常强大的计算系统成为可能。附录中概述了三个大型计算系统作为例子。
2 非常大规模信息处理的主要因素
信息处理包括在物理系统中体现的有意义的信息模式的存储、修改和传输。 构成有意义的模式当然取决于观察者或用户,因此以下我将考虑处理一般信息模式而不考虑这些模式意义的系统。然而,处理受到限制,使得将一个有意义的模式映射到另一个模式成为可能,从一般模式的角度来看,这意味着一般计算是可行的:系统可以以高可靠性将一个任意存储的模式映射到另一个模式。 重要的物理因素,限制信息处理的有:
1. 处理和内存密度
个体计算元素和存储单元将具有有限的大小,这受到物理定律的限制。这为系统的处理能力和存储密度设定了上限。
2. 处理速度
信息处理或从内存中检索的速度。正如我们将看到的,计算元素可以达到多快的速度有很多限制,这些限制大多基于物理过程的自然时间尺度。
3. 通信延迟
由于没有东西能比光传播得更快,因此在扩展系统的不同部分之间会有延迟。系统的处理速度越快,从内部主观观点看,延迟就会越长。为了最小化延迟,系统必须尽可能小,或者避免需要长距离通信的需求。
4. 能源供应
计算(除可逆计算外)在理论上和实践中都需要能量并散发热量。即使是可逆计算,也受到错误纠正和感知需求的限制[35]。
这四个因素影响可能计算系统的形状和结构。因素 1 和 2 表明,从长远来看,不可能创造出越来越强大的单个处理器;相反,智能必须转向由许多元素共同工作的并行系统(人类大脑巧妙地表明,即使是相当缓慢和低效的元素也能产生一个非常强大的计算系统)。
3
3
^(3) { }^{3} 因子 3 意味着,随着我们向更快更快的系统发展,它们必须变得更小以避免过度的延迟,直到由因子 1 和 2 设定的限制。之后,系统的扩展将增加延迟,这需要通过硬件以外的其他方式来处理。保持系统集中以及模块化将有所帮助。一个有趣的结构是“智能超级对象”(“木星大脑”
4
4
^(4) { }^{4} ,一个在行星尺度或更上的计算系统)。 因子 4 表明,即使是高度发达的文明也必须以某种方式产生能量并散发热量(这可能会使其可检测)。集中式结构更容易提供能量,但移除废热变得非同小可,而更分散的结构更容易冷却,但也会引起信号延迟和分配问题。检测热量排放已被建议为检测外星文明活动的一种方法[28, 29]。 应注意的是,除了物理限制外,还存在“软件限制”,例如图灵机的根本限制、由于问题复杂性导致的限制、创建高效和正确软件的能力以及信息获取能力的限制。此外,还存在交互能力的限制。
与周围物理世界的关系。这些限制在这里不予处理,但显然很重要,值得考虑。
3 密度
信息处理密度(单位体积内的处理器、门、寄存器或比特数)受多种因素限制,从可用材料的范围到物理的基本属性。
通常信息编码在固体物质中,因为它具有可取的稳定性,尽管整个系统不一定是固体来处理或存储信息;化学网络[13]和 DNA 链[63]能够进行通用计算。液体系统在一定程度上有限,因为除非包括高速通信的结构,否则信号速度由扩散决定,在这种情况下,相关部分仍然是固体。在以下讨论中,主要考虑固体系统。
3.1 分子物质
分子物质具有大约
1
gm
/
cm
3
1
gm
/
cm
3
1gm//cm^(3) 1 \mathrm{gm} / \mathrm{cm}^{3} 的密度,由分子通过分子间力分离组成。信息可以编码为分子的模式,或者编码在分子的状态中,例如通过其构象或通过亚基的序列,如 DNA(在纯 DNA 中,信息密度为每比特 32 个原子)。[2]中描述的双稳态分子开关仅用 29 个原子来编码一个比特。
根据[9],基于视紫红质的光学生物存储理论上可能接近
10
12
bit
/
cm
3
10
12
bit
/
cm
3
10^(12)bit//cm^(3) 10^{12} \mathrm{bit} / \mathrm{cm}^{3} ,在不久的将来实践中可能达到
10
10
−
10
11
bit
/
cm
3
10
10
−
10
11
bit
/
cm
3
10^(10)-10^(11)bit//cm^(3) 10^{10}-10^{11} \mathrm{bit} / \mathrm{cm}^{3} 。在这些存储器中,大量视紫红质分子被用来存储单个比特;理论上每个分子可以存储一个比特,但访问会变得繁琐,热噪声会降低信息。 纳米技术[27]的估计表明,分子计算机可能在氟化聚乙烯分子中编码信息,其中每个比特由某个碳原子上氢或氟的存在来标记。考虑到读取设备和包装的需求,Drexler 估计每个比特大约需要 10 个原子,如果达到钻石密度,则大约相当于
5
⋅
10
21
5
⋅
10
21
5*10^(21) 5 \cdot 10^{21} 比特
/
cm
3
/
cm
3
//cm^(3) / \mathrm{cm}^{3} 。
3.2 稀释和核物质
纳米技术的信息密度受分子物质特性的限制。人们认为存在更密集的物质形式,例如白矮星中的奇异物质(密度高达
10
6
gm
/
cm
3
10
6
gm
/
cm
3
10^(6)gm//cm^(3) 10^{6} \mathrm{gm} / \mathrm{cm}^{3} )和中子星中的核物质,其密度约为
10
17
gm
/
cm
3
10
17
gm
/
cm
3
10^(17)gm//cm^(3) 10^{17} \mathrm{gm} / \mathrm{cm}^{3} [1]。
退化的物质由一个被退化的电子气体包围的核晶格组成;即使在高达 100,000 K 的高温下,它也被认为是不稳定的。在自然形成的白矮星中,主要成分将是碳和/或氧核,形成一个体心立方晶格[16,第 596 页]。信息可以存储 在冷退变物质中,通过使用不同的核,例如稳定的碳同位素
C
12
C
12
C^(12) \mathrm{C}^{12} 和
C
13
C
13
C^(13) \mathrm{C}^{13} ,允许信息密度达到
10
29
bits
/
cm
3
10
29
bits
/
cm
3
10^(29)bits//cm^(3) 10^{29} \mathrm{bits} / \mathrm{cm}^{3} ,比分子物质高出大约六个数量级。信息处理是否可行不太明显;一种可能性可能是将核排列成量子点细胞自动机(类似于[44]),其中使用核自旋代替电子极化。 核物质由紧密挤压的强子组成,可能形成气体、超流体或晶体基质。中子星的大部分被认为处于超流体状态[16],因此不适合作为信息存储介质。超流体中的涡旋和通量管可能足够稳定,以维持信息存储并通过各种波模式和相互之间的相互作用进行处理,但密度似乎相当低。有人提出,夸克物质,即由夸克组成的物质,可以在中子星核心的混合相中与核物质共存。这将导致一个复杂的内部结构,由几个不同的相组成,包括夸克和核物质的液滴、棒和薄片[37]。另一种可能性是纯夸克物质即使在真空中也是稳定的[77]。自然要问这种非常致密的物质是否可以用来维持信息处理。 关键问题是稳定结构是否可能。目前尚不确定,因为这取决于系统的温度和夸克-强子混合物的详细性质,而这些性质是未知的。丰富的结构看起来很有希望,但这并不证明稳定结构可以存在(可能是夸克物质只是夸克的同质团块,尽管激发态可能提供新的复杂层次)。大多数关于核物质的研究都假设高温,但低温核物质可能具有非常不同的性质。如果稳定的核密度结构可以存在,那么信息存储的理论极限将是每个比特几个夸克或强子,从而导致信息密度的上限为
10
40
bits
/
cm
3
10
40
bits
/
cm
3
10^(40)bits//cm^(3) 10^{40} \mathrm{bits} / \mathrm{cm}^{3} 。
3.3 理论极限
热力学意味着在平均能量为
E
E
E E 的系统中最多的可存储比特数为[51]
I
=
E
k
b
T
ln
2
+
log
2
(
∑
i
e
−
E
i
/
k
B
T
)
I
=
E
k
b
T
ln
2
+
log
2
∑
i
e
−
E
i
/
k
B
T
I=(E)/(k_(b)T ln 2)+log_(2)(sum_(i)e^(-E_(i)//k_(B)T)) I=\frac{E}{k_{b} T \ln 2}+\log _{2}\left(\sum_{i} e^{-E_{i} / k_{B} T}\right)
T
T
T T 表示温度,
k
b
k
b
k_(b) k_{b} 表示玻尔兹曼常数,
E
i
E
i
E_(i) E_{i} 表示不同的能量状态。 如果将计算系统视为具有总能量
E
E
E E 的若干基本粒子的模式,在体积
V
,
[
51
]
V
,
[
51
]
V,[51] V,[51] 中,能量作为函数的最大信息为
I
=
4
3
ln
2
(
π
2
r
V
30
ℏ
3
c
3
)
1
/
4
E
3
/
4
I
=
4
3
ln
2
π
2
r
V
30
ℏ
3
c
3
1
/
4
E
3
/
4
I=(4)/(3ln 2)((pi^(2)rV)/(30ℏ^(3)c^(3)))^(1//4)E^(3//4) I=\frac{4}{3 \ln 2}\left(\frac{\pi^{2} r V}{30 \hbar^{3} c^{3}}\right)^{1 / 4} E^{3 / 4}
r
=
∑
l
r
l
r
=
∑
l
r
l
r=sum_(l)r_(l) r=\sum_{l} r_{l} 和
r
l
r
l
r_(l) r_{l} 是粒子种类
l
l
l l 中粒子/反粒子的数量,乘以极化数,
ℏ
=
h
/
2
π
ℏ
=
h
/
2
π
ℏ=h//2pi \hbar=h / 2 \pi 是普朗克-狄拉克常数,
c
c
c c 光速。对于一个由一公斤光子组成(
9
⋅
10
16
9
⋅
10
16
9*10^(16) 9 \cdot 10^{16} J 的质量能量)并限制在一升内的系统,最大容量是
2.13
⋅
10
31
2.13
⋅
10
31
2.13*10^(31) 2.13 \cdot 10^{31} 位。 量子力学对可以存储在具有有限能量内容的孤立有限空间区域中的信息量施加了限制,即所谓的贝肯斯坦界限[5]。由于区域及其能量内容是有限的,该区域内系统的相空间也是有限的。但由于量子不确定性,相空间不能被分割成任意小的部分(如果分割得太细,将无法区分,因此无法编码任何信息),从而可以推导出信息内容的上限。根据[72,附录 C],我们得到:
I
≤
2
π
E
R
ℏ
c
ln
2
I
≤
2
π
E
R
ℏ
c
ln
2
I <= (2pi ER)/(ℏc ln 2) I \leq \frac{2 \pi E R}{\hbar c \ln 2}
I
I
I I 是信息量,
E
E
E E 是体积的能量,
R
R
R R 是半径。这也可以写成
I
≤
k
M
R
I
≤
k
M
R
I <= kMR I \leq k M R
该区域的质量为
M
M
M M ,
k
k
k k 是
2
π
c
/
ℏ
ln
2
=
2.57686
⋅
10
43
2
π
c
/
ℏ
ln
2
=
2.57686
⋅
10
43
2pi c//ℏln 2=2.57686*10^(43) 2 \pi c / \hbar \ln 2=2.57686 \cdot 10^{43} 位
/
(
m
/
(
m
//(m /(\mathrm{m} 千克。对于整个太阳系,我们得到大约(
M
=
2
⋅
10
30
kg
,
R
=
M
=
2
⋅
10
30
kg
,
R
=
M=2*10^(30)kg,R= M=2 \cdot 10^{30} \mathrm{~kg}, R=
7.375
⋅
10
9
m
7.375
⋅
10
9
m
7.375*10^(9)m 7.375 \cdot 10^{9} \mathrm{~m} )
3.8
⋅
10
83
3.8
⋅
10
83
3.8*10^(83) 3.8 \cdot 10^{83} 位。在另一极端,一个氢原子理论上可以编码
4
⋅
10
6
4
⋅
10
6
4*10^(6) 4 \cdot 10^{6} 位,而一个质子只有 44 位!在密度恒定的介质中,将信息打包到球体中的信息量的上限与
R
4
R
4
R^(4) R^{4} 成正比。 另一个对(有用)信息密度的限制是黑洞的形成。如果该区域小于
2
G
M
/
c
2
2
G
M
/
c
2
2GM//c^(2) 2 G M / c^{2} (其中
G
G
G G 是万有引力常数),则形成黑洞,这意味着事件视界关闭了该区域的双向通信。我们从这一点和方程 4 得到以下关于信息密度
ρ
=
I
/
V
ρ
=
I
/
V
rho=I//V \rho=I / V 的界限:
ρ
≤
3
k
c
4
16
π
G
2
1
M
ρ
≤
3
k
c
4
16
π
G
2
1
M
rho <= (3kc^(4))/(16 piG^(2))(1)/(M) \rho \leq \frac{3 k c^{4}}{16 \pi G^{2}} \frac{1}{M}
从这个我们可以看出,虽然非常密集系统的存储容量随着系统的扩展而增长,但信息密度最终必须降低,因为包装不能过于紧密,否则会崩溃;一个恒定密度系统的尺寸总是有一个上限,超过这个上限就会崩溃。当然,贝肯斯坦界限可能不是信息内容的最小上界,计算系统的物理性质也会限制信息密度。在实践中,方程 2 比贝肯斯坦界限是一个更强的界限。
4
4
4quad 4 \quad 速度
任何人都可以在餐巾纸上写下
E
=
h
/
t
E
=
h
/
t
E=h//t E=h / t ,并在午餐时说服你,这限制了功率-延迟积。麻烦从人们发布他们的餐巾纸开始。 - 罗尔夫·兰道尔
计算速度受限于系统在崩溃前每单位时间内可以执行的状态转换的数量。这通常取决于执行转换所用的能量以及系统能量势垒的强度。 当前(1999 年)的半导体电路显示开关时间降至纳秒级别,MOSFET 器件已展示出 7.8 皮秒的开关时间[56]。 机械杆逻辑,如[27]所述,具有纳秒级的切换时间,而[34]模拟的齿轮可以以高达 100 GHz 的速率旋转。然而,这是一个机械系统,受建筑材料中声速的限制(在 Drexler 的设计中为钻石,
≈
17
km
/
s
≈
17
km
/
s
~~17km//s \approx 17 \mathrm{~km} / \mathrm{s} )。利用电磁相互作用,计算单元可以更快地改变状态,就像[44]中预测的量子细胞自动机,它们预计在皮秒级稳定。
分子计算受键能限制,当每秒超过
10
15
10
15
10^(15) 10^{15} 个跃迁时,涉及的能量变得大于键能,系统开始分解[59]。因此,分子计算机必须在飞秒范围内或更慢的速度下工作。 一个使用核反应的系统将具有与强相互作用反应相当的特征时间尺度,大约为
4
⋅
10
−
24
4
⋅
10
−
24
4*10^(-24) 4 \cdot 10^{-24} 秒
(
=
h
/
m
p
c
2
)
=
h
/
m
p
c
2
(=h//m_(p)c^(2)) \left(=h / m_{p} c^{2}\right) 。 这里量子效应变得相关,为了将切换时间内的错误降至最低,由于海森堡不确定性原理
Δ
E
Δ
t
≥
ℏ
Δ
E
Δ
t
≥
ℏ
Delta E Delta t >= ℏ \Delta E \Delta t \geq \hbar (如果能量小于
ℏ
/
Δ
t
ℏ
/
Δ
t
ℏ//Delta t \hbar / \Delta t ,量子涨落将大于输入信号),切换所需的能量必须更高。在核物质的情况下,所需的切换能量必须大于
3.75
⋅
10
−
20
J
3.75
⋅
10
−
20
J
3.75*10^(-20)J 3.75 \cdot 10^{-20} \mathrm{~J} 每操作一次。请注意,这种能量不必耗散,只需防止量子噪声干扰计算即可。 量子力学对系统状态变化的速度也有限制。可以证明,具有平均能量
E
E
E E 高于基态的系统,决定了系统每单位时间内可以经过的最大正交状态数
2
E
/
h
2
E
/
h
2E//h 2 E / h [53]。即使在完全无噪声的情况下,这种能量也是必要的。
一个类似的开关时间限制可以基于贝肯斯坦界限:如果一个开关将 n 个输入位转换为 n 个输出位,那么这个开关必须大于
R
≥
[
n
ℏ
c
ln
2
2
π
]
1
E
R
≥
n
ℏ
c
ln
2
2
π
1
E
R >= [(nℏc ln 2)/(2pi)](1)/(E) R \geq\left[\frac{n \hbar c \ln 2}{2 \pi}\right] \frac{1}{E}
E 是开关内的能量,仅为了包含信息。由于信息只能以光速传输,因此结果比特移动到下一个开关的距离 R 所需的时间(这是忽略开关时间后的循环时间的下限)是
t
≥
[
n
ℏ
ln
2
2
π
]
1
E
t
≥
n
ℏ
ln
2
2
π
1
E
t >= [(nℏln 2)/(2pi)](1)/(E) t \geq\left[\frac{n \hbar \ln 2}{2 \pi}\right] \frac{1}{E}
如果我们假设每次切换操作有
n
=
2
n
=
2
n=2 \mathrm{n}=2 位,那么对于每个开关小于
4.44
⋅
10
8
J
4.44
⋅
10
8
J
4.44*10^(8)J 4.44 \cdot 10^{8} \mathrm{~J} 的能量,这个界限限制了计算,而不是量子引力。
[53]中的界比方程 7 中两比特系统的界大一个因子
π
2
/
ln
2
≈
14.23
π
2
/
ln
2
≈
14.23
pi^(2)//ln 2~~14.23 \pi^{2} / \ln 2 \approx 14.23 。 或许切换的极限将是普朗克时间,
5
⋅
10
−
44
s
5
⋅
10
−
44
s
5*10^(-44)s 5 \cdot 10^{-44} \mathrm{~s}
(
G
ℏ
/
c
5
)
G
ℏ
/
c
5
(sqrt(Gℏ//c^(5))) \left(\sqrt{G \hbar / c^{5}}\right) ,因为在这个尺度上,时空似乎失去了其平滑性质,时间变得难以定义。在这个切换速度下,不确定性关系要求操作能量达到普朗克能量(
c
5
ℏ
/
G
c
5
ℏ
/
G
sqrt(c^(5)ℏ//G) \sqrt{c^{5} \hbar / G} )的数量级,每次操作 3 焦耳。
图 1:双位制半径的约束
5 尺寸
我理解她操纵了整个科学和思想体系,就像我可能把单词串成句子一样。但她的“句子”就像宇宙本身的言论一样宏大而深刻。 - 大卫·辛德尔,《永恒之境》
到目前为止,我们只关注了信息处理系统各部分的极限,而没有考虑整个系统作为一个整体。只要系统规模较小,其大小并不重要,但较大的系统显然需要特殊考虑,因为信号延迟、质量和热耗散。 如果可以接受更长的信号延迟,系统就不必集中在一个单一的结构上,设计可以更加自由。如果延迟成本高昂,例如在非常快速的系统(在信号在空间中缓慢移动时会发生很多事情)中,那么系统就必须尽可能密集地构建。对于非常大的系统,这将会因为重力而施加限制。 由钻石或其他材料构成的球形结构,如果内部压力超过键的绑定强度(
(
6
⋅
10
−
19
J
/
6
⋅
10
−
19
J
/
(6*10^(-19)(J)//:} \left(6 \cdot 10^{-19} \mathrm{~J} /\right. 键),将会变得不稳定。最大压力的粗略估计:当两个原子移动时所做的功等于键能时,晶体结构将崩溃。假设为立方晶格,我们得到
1
/
l
2
≈
N
1
/
l
2
≈
N
1//l^(2)~~N 1 / l^{2} \approx N 原子
/
m
2
/
m
2
//m^(2) / \mathrm{m}^{2} ,其中
l
l
l l 是 154 pm 的键长。
分解将在
l
⋅
(
P
crit
/
N
)
≈
E
l
⋅
P
crit
/
N
≈
E
l*(P_("crit ")//N)~~E l \cdot\left(P_{\text {crit }} / N\right) \approx E 发生,这给出
P
crit
≈
E
/
l
3
,
P
c
r
i
t
≈
P
crit
≈
E
/
l
3
,
P
c
r
i
t
≈
P_("crit ")~~E//l^(3),P_(crit)~~ P_{\text {crit }} \approx E / l^{3}, P_{c r i t} \approx
1.64
⋅
10
11
N
/
m
2
1.64
⋅
10
11
N
/
m
2
1.64*10^(11)N//m^(2) 1.64 \cdot 10^{11} \mathrm{~N} / \mathrm{m}^{2} 。 球体内恒定密度下的压力
P
=
2
π
G
ρ
2
R
2
3
=
3
G
M
2
8
π
R
4
P
=
2
π
G
ρ
2
R
2
3
=
3
G
M
2
8
π
R
4
P=(2pi Grho^(2)R^(2))/(3)=(3GM^(2))/(8piR^(4)) P=\frac{2 \pi G \rho^{2} R^{2}}{3}=\frac{3 G M^{2}}{8 \pi R^{4}}
因此,一个紧凑的钻石结构将具有大约 9760 公里的最大半径,略大于地球。将密度减半可以使可能的半径加倍,质量增加四倍,这表明了内部延迟和总计算能力之间的权衡。 尽管可能存在更硬的材料,但分子键的强度是这个数量级,因此更大的结构除非通过其他力量稳定,否则将无法工作。 在相同的方式下,已知[16]电子简并物质在钱德拉塞卡极限(1.44 太阳质量)时变得不稳定,而核物质在朗道-奥本海默-福克极限(在 2 或 3 太阳质量之间,取决于核物质的方程状态[76])时变得不稳定。中子星和类似物体的最大尺寸很小(大约 10 公里);而小尺寸和高密度对信息处理有利,质量限制使得总信息容量大约为
10
60
10
60
10^(60) 10^{60} 比特。对于简并物质和类中子物质,
R
M
=
R
M
=
RM= R M= 常数成立,随着系统变得更加密集,延迟时间缩短。 尺寸的终极极限当然是相对论性的塌缩成黑洞;足够大的质量会扭曲时空到如此程度,以至于没有任何东西可以向外移动,结构在事件视界之后消失。对于一个质量为
M
M
M M 的非旋转结构,这对应于史瓦西半径:
r
s
=
2
G
M
c
2
r
s
=
2
G
M
c
2
r_(s)=(2GM)/(c^(2)) r_{s}=\frac{2 G M}{c^{2}}
当具有角动量
L
L
L L 和电荷
Q
Q
Q Q 的结构具有临界半径(在新曼度规中):
r
k
=
m
+
m
2
−
a
2
−
e
2
r
k
=
m
+
m
2
−
a
2
−
e
2
r_(k)=m+sqrt(m^(2)-a^(2)-e^(2)) r_{k}=m+\sqrt{m^{2}-a^{2}-e^{2}}
这些公式表明了两种在保持物体稳定的同时增加其质量的方法:旋转和电荷。
旋转结构确实可以比静态结构更大,因为压力部分由离心力平衡(从经典角度观察);具有足够大的角动量或电荷的物体也可以避免成为黑洞[57]。虽然明显的解决方案是将整个结构作为一个刚体旋转,但一个更微妙的可能性是使用更复杂的角动量分布。 已提出建议,可以使用磁丸或条带流来构建用于太空进入的动态结构。该想法是从地面电磁加速磁丸流,将其发送到接收器 在太空站底部,水流通过电磁场向下引导(因此,根据动量守恒,对太空站产生一个净力,使其相对于地面保持静止的同时保持在空中),最后由地面上的另一座太空站接收,并将它们送回加速器。
图 2:一个太空喷泉系统。磁性颗粒从地面站射向太空站,在那里它们被向下偏转回地面站。结果是形成一个由动量传递支撑的“柱子”。
该系统对站点施加的净力与弹丸流体的动能成正比,并且可以以修改后的形式用于大型结构中的“柱子”、“梁”和“弧”。例如,两个在赤道附近以相反方向移动的圆形流体(以保持净角动量为零)可以作为“弧”,在电磁场的作用下,其他结构可以附着在其上。随着负载的增加,可以添加更多动量以跟上应力。这种动态结构的实际限制似乎在于能量耗散以及场力在结构总体积中的分布效果。弹丸的加速度会产生电磁辐射,导致能量损失与加速度的平方成正比。 旋转和电磁学在稳定超重结构方面配合良好。在中子星的情况下,强磁场可能[10]将最大质量增加至
13
−
29
%
13
−
29
%
13-29% 13-29 \% ,与非磁性系统相比。在这种情况下,场以复杂的方式与时空相互作用以稳定系统,这可能被智能生命所利用。
更基本的设计可能是给结构的每个部分施加足够的电荷,以抵消重力带来的吸引力;由于这两个场都按
r
−
2
r
−
2
r^(-2) r^{-2} 的比例增长,这可以基本上中和带相同电荷的物体之间的重力。这种设计的主要问题之一是,结构将倾向于吸引来自宇宙辐射或太阳风的相反电荷粒子;需要某种形式的屏蔽或中和屏蔽。另一个问题是,如果场变得足够强大,单元组成部分之间的电排斥力将开始分解它们(更不用说 这些电荷倾向于在粒子表面累积),这迫使使用更小的单位。真正极端的场,例如防止黑洞引力塌缩所必需的场,在
E
≥
m
e
2
c
3
/
ℏ
e
E
≥
m
e
2
c
3
/
ℏ
e
E >= m_(e)^(2)c^(3)//ℏe E \geq m_{e}^{2} c^{3} / \hbar e 时也会遭受配对产生,并可能以类似于[65]中描述的黑洞周围的电场的方式崩溃。 这些鲁布·戈尔巴乔夫解决方案只是暗示了通过仔细平衡不同力量可以做到什么程度。似乎没有物理限制来决定平衡良好的系统的尺寸,尽管缺乏原材料、安全问题和能源将不可避免地限制其尺寸。而且,正如我们将看到的,热力学对大型计算系统的大小和结构设置了其他限制。
6 能量
现代物理学中最令人着迷的发展之一是计算与热力学之间的联系。 热力学中,熵是混乱度的度量,或者说,是系统可能处于的与观察到的宏观状态一致的可能状态的数量的对数,根据热力学第三定律,熵总是增加的。如果我们看一个消除信息的过程,比如将寄存器设置为 0,我们将可能的状态(寄存器的先前值)的数量减少到一个状态(0)。这将减少系统的熵,这是不允许的——除非同时增加系统其他方面的熵。热力学导致需要能量耗散来消除信息位:能量耗散成热量以消除熵的增加。
信息擦除一个比特的成本由 Brillouin 不等式给出:
Δ
E
≥
k
B
ln
2
T
Δ
E
≥
k
B
ln
2
T
Delta E >= k_(B)ln 2T \Delta E \geq k_{B} \ln 2 T
where
Δ
E
Δ
E
Delta E \Delta E is the amount of energy expended,
k
B
k
B
k_(B) k_{B} is the Boltzmann constant,
T
T
T T is the absolute temperature. At room temperature this cost is
2.9
⋅
10
−
21
J
2.9
⋅
10
−
21
J
2.9*10^(-21)J 2.9 \cdot 10^{-21} \mathrm{~J} , while at 3 K (the cosmic background temperature) it has decreased to
2.87
⋅
10
−
23
2.87
⋅
10
−
23
2.87*10^(-23) 2.87 \cdot 10^{-23} J. Obviously, to be able to process information cheaply the system should be very cold, but that may require extensive cooling. Thus there will be extensive demands for energy in large information processing systems. Very dense and fast systems will dissipate huge amounts of energy; assuming a molecular computing system with
10
12
bits
/
cm
3
10
12
bits
/
cm
3
10^(12)bits//cm^(3) 10^{12} \mathrm{bits} / \mathrm{cm}^{3} and a switching speed of
10
15
Hz
10
15
Hz
10^(15)Hz 10^{15} \mathrm{~Hz} would lead to an energy dissipation of
2.8
⋅
10
6
W
/
cm
3
2.8
⋅
10
6
W
/
cm
3
2.8*10^(6)W//cm^(3) 2.8 \cdot 10^{6} \mathrm{~W} / \mathrm{cm}^{3} , which would obviously vaporise the material.
能量消耗量为
Δ
E
Δ
E
Delta E \Delta E ,玻尔兹曼常数为
k
B
k
B
k_(B) k_{B} ,绝对温度为
T
T
T T 。在室温下,这种成本为
2.9
⋅
10
−
21
J
2.9
⋅
10
−
21
J
2.9*10^(-21)J 2.9 \cdot 10^{-21} \mathrm{~J} ,而在 3 K(宇宙背景温度)时,它已降至
2.87
⋅
10
−
23
2.87
⋅
10
−
23
2.87*10^(-23) 2.87 \cdot 10^{-23} 焦耳。显然,为了以低成本处理信息,系统应该非常冷,但这可能需要大量的冷却。因此,在大规模信息处理系统中将会有大量的能源需求。非常密集和快速的系统将消耗巨大的能量;假设一个具有
10
12
bits
/
cm
3
10
12
bits
/
cm
3
10^(12)bits//cm^(3) 10^{12} \mathrm{bits} / \mathrm{cm}^{3} 和切换速度为
10
15
Hz
10
15
Hz
10^(15)Hz 10^{15} \mathrm{~Hz} 的分子计算系统会导致
2.8
⋅
10
6
W
/
cm
3
2.8
⋅
10
6
W
/
cm
3
2.8*10^(6)W//cm^(3) 2.8 \cdot 10^{6} \mathrm{~W} / \mathrm{cm}^{3} 的能量耗散,这显然会蒸发材料。
6.1 可逆计算
It may be possible to do computations without having to expend energy at all if no bits are erased, so called reversible computation. In a logically reversible process the input and output can be logically retrieved from each other. A physically reversible process is not just logically reversible, but it can be run可能在不删除任何比特的情况下进行计算,从而无需消耗能量,这就是所谓的可逆计算。在逻辑上可逆的过程中,输入和输出可以从彼此中逻辑地检索出来。一个物理上可逆的过程不仅仅是逻辑上可逆的,它还可以运行 向后,产生输入从输出和反之亦然。根据热力学第二定律,它不能散发热量。 可逆操作的例子包括复制一条记录及其逆操作,如果已知它们是相同的,则使用相同记录“取消”一条记录。只要保留其中一个项的记录,加法就是可逆的。
Logically reversible computers could be built from reversible circuits [32] or the reversible Turing machine [6]. Physical reversibility can be achieved using reversible logical circuits [54], mechanical logic [55] or by using quantum computation which by its nature is reversible (see section 8.1).
逻辑可逆计算机可以由可逆电路[32]或可逆图灵机[6]构建。物理可逆性可以通过使用可逆逻辑电路[54]、机械逻辑[55]或使用量子计算来实现,量子计算的本质是可逆的(参见第 8.1 节)。
It has been shown that any irreversible computation can be turned into a reversible computation with a slight increase in memory and time complexity [7]: if the time needed is
T
T
T T and the memory demand
S
S
S S , then the output can be calculated reversibly in time linear in
T
T
T T and space of the order
O
(
S
T
a
)
O
S
T
a
O(ST^(a)) O\left(S T^{a}\right) , where
a
a
a a can be made arbitrarily small. It is also possible to communicate reversibly [35] between two reversible minds.
已被证明,任何不可逆计算都可以通过略微增加内存和时间复杂度转变为可逆计算[7]:如果所需时间是
T
T
T T ,内存需求是
S
S
S S ,那么输出可以在时间线性于
T
T
T T 和空间阶数为
O
(
S
T
a
)
O
S
T
a
O(ST^(a)) O\left(S T^{a}\right) 的情况下可逆计算,其中
a
a
a a 可以任意小。在两个可逆心智之间进行可逆通信也是可能的[35]。
Unfortunately there are limits to the usefulness of reversible computation. Error correction is by necessity irreversible (several erroneous states are mapped to a single correct state), and hence needs irreversible operations. There is a tradeoff between dissipation and decreasing the risk of undetected bit errors; by using error-correcting codes the number of bits in the system is increased (and hence the net number of bit errors) but more can be corrected.
不幸的是,可逆计算的实用性存在限制。纠错本质上是不可逆的(多个错误状态映射到单个正确状态),因此需要不可逆操作。在耗散和降低未检测到比特错误的风险之间存在着权衡;通过使用纠错码,系统中的比特数增加(因此净比特错误数增加),但可以纠正的比特数更多。
Another way to decrease the problem of bit errors is to make the potential wells of the registers deeper; this makes it less likely that thermal noise or outside interference (such as cosmic rays) will throw the register from one state to the other. If the register is similar to a harmonic oscillator, then the probability that thermal noise kicks it out of the current potential well of height
E
E
E E is proportional to
e
−
E
/
k
B
T
e
−
E
/
k
B
T
e^(-E//k_(B)T) e^{-E / k_{B} T} , and can be made arbitrarily small by increasing
E
E
E E . Fortunately, the depth of the potential well does not matter for reversible computation, so during error-free operation no energy has to be dissipated even when
E
E
E E is large, and correcting the error only requires
k
B
T
ln
2
k
B
T
ln
2
k_(B)T ln 2 k_{B} T \ln 2 Joules per bit. If there are
n
n
n n bits in the system, then the total energy that has to be dissipated for error correction is proportional to
另一种减少比特错误的方法是使寄存器的势阱更深;这使得热噪声或外部干扰(如宇宙射线)将寄存器从一个状态抛到另一个状态的可能性降低。如果寄存器类似于一个谐波振荡器,那么热噪声将其踢出高度为
E
E
E E 的当前势阱的概率与
e
−
E
/
k
B
T
e
−
E
/
k
B
T
e^(-E//k_(B)T) e^{-E / k_{B} T} 成正比,可以通过增加
E
E
E E 使其任意小。幸运的是,势阱的深度对于可逆计算并不重要,因此在无错误操作期间,即使
E
E
E E 很大,也不需要耗散能量,纠正错误只需要
k
B
T
ln
2
k
B
T
ln
2
k_(B)T ln 2 k_{B} T \ln 2 焦耳每比特。如果系统中存在
n
n
n n 比特,那么用于纠错的能量耗散总量与
E
diss
∝
n
ln
2
k
B
T
e
−
E
/
k
B
T
E
diss
∝
n
ln
2
k
B
T
e
−
E
/
k
B
T
E_("diss ")prop n ln 2k_(B)Te^(-E//k_(B)T) E_{\text {diss }} \propto n \ln 2 k_{B} T e^{-E / k_{B} T}
当 E 增长时迅速减小。我们注意到,为了获得可靠的存储和深度计算,任何系统都需要深度稳定的势阱。分子键提供了一种势阱的来源,其深度约为
10
−
19
J
10
−
19
J
10^(-19)J 10^{-19} \mathrm{~J} ,这使得它们在几千度开尔文左右的温度下保持稳定。核键的量级约为
10
−
12
10
−
12
10^(-12) 10^{-12} J,这使得它们在
10
10
K
10
10
K
10^(10)K 10^{10} \mathrm{~K} 左右保持稳定。 也存在可逆系统在处理与宇宙其他部分的关系时的问题,因为宇宙其他部分高度不可逆且无序。无法保证从环境中获得的信息可以被撤销以确保可逆性,因为外部世界的变化不可预测[35]。当然,一个非常大的计算系统,如行星大小的“固态文明”可能会选择完全忽略外部世界,但如果必须与之互动,能量就必须被耗散。
因此,大型计算系统可能需要使用能量来进行错误纠正、与环境交互以及进行物理工作(如修复损坏),但能源需求相对适度。
6.2 降温
如果系统散失能量,它必须辐射掉产生的热量。如果系统是一个具有
P
P
P P 瓦特
/
m
3
/
m
3
//m^(3) / \mathrm{m}^{3} 耗散的球形黑体,根据斯特藩-玻尔兹曼定律,我们可以得到一个温度为
T
=
(
r
P
3
σ
)
1
/
4
T
=
r
P
3
σ
1
/
4
T=((rP)/(3sigma))^(1//4) T=\left(\frac{r P}{3 \sigma}\right)^{1 / 4}
由于体积随半径的立方增长,而冷却面积仅随半径的平方增长,因此随着系统的增长,温度也会增加
5
5
^(5) { }^{5} 。如果最大允许温度为
T
max
T
max
T_("max ") T_{\text {max }} ,则最大尺寸变为
r
max
r
max
r_("max ") r_{\text {max }} :
r
max
=
3
σ
T
max
4
P
r
max
=
3
σ
T
max
4
P
r_(max)=(3sigmaT_(max)^(4))/(P) r_{\max }=\frac{3 \sigma T_{\max }^{4}}{P}
对于分子物质,
T
max
T
max
T_("max ") T_{\text {max }} 可能是熔点的数量级(如果有脆弱子系统,可能是一个或多个数量级更低),大约 1000K 左右(这与[34]的观察结果相符,它表明纳米机械齿轮可能开始失效在
600
−
1000
K
600
−
1000
K
600-1000K 600-1000 \mathrm{~K} )。这给出了
170
/
P
km
170
/
P
km
170//Pkm 170 / P \mathrm{~km} 的最大半径(如果选择 600K 的限制,半径将是
22
/
P
km
22
/
P
km
22//Pkm 22 / P \mathrm{~km} )。
P
P
P P 的大小将取决于不可逆计算发生的程度,这很难估计,但很明显,即使相当低的耗散密度也会对小行星的大小范围或强制耗散的严格配给施加限制。 另一个有用的指标是信息生产,可以通过推导方程 11[4]来找到:
(
d
I
/
d
t
)
(
d
E
/
d
t
)
≤
1.05
⋅
10
23
T
bit
/
sW
(
d
I
/
d
t
)
(
d
E
/
d
t
)
≤
1.05
⋅
10
23
T
bit
/
sW
((dI//dt))/((dE//dt)) <= (1.05*10^(23))/(T)bit//sW \frac{(d I / d t)}{(d E / d t)} \leq \frac{1.05 \cdot 10^{23}}{T} \mathrm{bit} / \mathrm{sW}
如果我们将其代入斯蒂芬定律,我们得到
(
d
I
/
d
t
)
(
d
E
/
d
t
)
≤
(
4
π
σ
k
B
ln
2
)
T
3
r
2
(
d
I
/
d
t
)
(
d
E
/
d
t
)
≤
4
π
σ
k
B
ln
2
T
3
r
2
((dI//dt))/((dE//dt)) <= ((4pi sigma)/(k_(B)ln 2))T^(3)r^(2) \frac{(d I / d t)}{(d E / d t)} \leq\left(\frac{4 \pi \sigma}{k_{B} \ln 2}\right) T^{3} r^{2}
这表明系统的信息生产随着
T
max
3
T
max
3
T_("max ")^(3) T_{\text {max }}^{3} 和
r
2
r
2
r^(2) r^{2} 增长。 如果我们假设系统只需要能量来纠正错误,并且所有错误都是热性质的,那么通过平衡方程 13 和方程 12(比特密度为
ρ
ρ
rho \rho ),我们得到以下大小和温度之间的关系:
r
<
[
3
σ
ρ
k
B
ln
2
]
T
3
e
E
/
k
B
T
r
<
3
σ
ρ
k
B
ln
2
T
3
e
E
/
k
B
T
r < [(3sigma)/(rhok_(B)ln 2)]T^(3)e^(E//k_(B)T) r<\left[\frac{3 \sigma}{\rho k_{B} \ln 2}\right] T^{3} e^{E / k_{B} T}
这代表了“冷”脑可能的尺寸,它们充分利用了可逆性。最大半径随着
T
T
T T 的增加而减小,直到
T
crit
=
E
/
3
k
B
T
crit
=
E
/
3
k
B
T_("crit ")=E//3k_(B) T_{\text {crit }}=E / 3 k_{B} (对于大约 2400 K 的分子物质,对应于与
e
−
3
≈
0.05
e
−
3
≈
0.05
e^(-3)~~0.05 e^{-3} \approx 0.05 成比例的错误率),然后随着
T
3
T
3
T^(3) T^{3} 的增长而增长。在冷区域,由于错误率极低,可以存在大型系统,从而避免了通过错误纠正进行自加热的需求。在
T
crit
T
crit
T_("crit ") T_{\text {crit }} 以上的热区域,错误如此普遍,以至于错误纠正引起的自加热成为尺寸的限制因素。超过
T
max
∝
E
/
k
B
T
max
∝
E
/
k
B
T_(max)prop E//k_(B) T_{\max } \propto E / k_{B} ,系统稳定性的可能性不大,因为热噪声淹没了所有存储。显然,在这种情况下,最佳方案是尽可能保持冷却。 如果我们假设每个比特有一个额外的错误率,与
T
T
T T 无关,例如宇宙射线或系统中的错误,公式 17 变为
r
<
[
3
σ
ρ
k
B
ln
2
]
T
3
ϵ
+
e
−
E
/
k
B
T
r
<
3
σ
ρ
k
B
ln
2
T
3
ϵ
+
e
−
E
/
k
B
T
r < [(3sigma)/(rhok_(B)ln 2)](T^(3))/(epsilon+e^(-E//k_(B)T)) r<\left[\frac{3 \sigma}{\rho k_{B} \ln 2}\right] \frac{T^{3}}{\epsilon+e^{-E / k_{B} T}}
与纯粹的热系统不同,该系统在
T
∗
T
∗
T^(**) T^{*} 处有一个局部最大值,在
T
crit
T
crit
T_("crit ") T_{\text {crit }} 处有一个最小值,如果每秒有
ϵ
<
0.001
ϵ
<
0.001
epsilon < 0.001 \epsilon<0.001 个错误。在低于
T
∗
T
∗
T^(**) T^{*} 的温度下,系统受从非热错误中移除热量的需求主导,半径按
T
3
T
3
T^(3) T^{3} 增长。在
T
∗
T
∗
T^(**) T^{*} 以上,热错误变得更加显著,半径必须减小以保持系统足够冷却,直到
T
crit
T
crit
T_("crit ") T_{\text {crit }} 。这表明,对于不完美但几乎可逆的系统,保持
T
∗
T
∗
T^(**) T^{*} 的温度可以最大化计算元件的可能体积。
图 3:信息处理系统最大半径作为工作温度的函数(根据公式 18,其中
ρ
=
10
18
bits
/
m
3
,
E
=
10
−
19
J
ρ
=
10
18
bits
/
m
3
,
E
=
10
−
19
J
rho=10^(18)bits//m^(3),E=10^(-19)J \rho=10^{18} \mathrm{bits} / \mathrm{m}^{3}, E=10^{-19} \mathrm{~J} 和
ϵ
=
10
−
6
ϵ
=
10
−
6
epsilon=10^(-6) \epsilon=10^{-6} )。
在图 3 曲线以上的区域,系统将倾向于升温(即向右移动),在曲线以下的区域,系统将降温(即向左移动)。对于给定的半径,可能存在一个或两个稳定状态,对应于一个冷系统,其中热量散失速度快于产生速度(
T
<
T
∗
T
<
T
∗
T < T^(**) T<T^{*} 的分支),或者一个热系统,其中大量能量用于错误纠正(
T
>
T
crit
T
>
T
crit
T > T_("crit ") T>T_{\text {crit }} 的分支)。 上述计算未考虑宇宙背景辐射;这使得曲线在小的
T
T
T T 处变得平坦,并使得(在给定的情况下)成为不可能的 仅被动冷却的假设)降至 3 开尔文的工作温度以下。 应注意的是,上述限制都假设了一个球形的辐射表面,这是最差的。一个更合理的系统可能是扩展的散热器,将冷却物质循环到计算核心,并将热量辐射到宇宙背景中,或者如果能够管理延迟,一个分布式系统,其中总表面积会变得更大。一个行星大小的结构可以被一个在地球同步(或脑同步?)轨道上的大型散热帆圈所环绕,管道向下延伸到“地面”。
通过消耗足够的能量,系统原则上可以将其温度降至任何有限值,包括低于宇宙背景温度。由魏达提出的一个有趣的被动冷却装置是使用大黑洞;由于霍金辐射随质量的增加而减小,
T
=
ℏ
c
3
8
π
G
k
B
M
T
=
ℏ
c
3
8
π
G
k
B
M
T=(ℏc^(3))/(8pi Gk_(B)M) T=\frac{\hbar c^{3}}{8 \pi G k_{B} M}
它们如果被阻止积累下落物质,会变得极其寒冷(一个太阳质量黑洞的温度会是
10
−
8
K
10
−
8
K
10^(-8)K 10^{-8} \mathrm{~K} )。一种可能性是围绕黑洞的“逆戴森壳”。
6.3 能源
另一个主要问题是首先从哪里获取能量。对于小规模操作,能源是充足的:在近地空间,总是有大约
1000
W
/
m
2
1000
W
/
m
2
1000W//m^(2) 1000 \mathrm{~W} / \mathrm{m}^{2} 的太阳能,这对卫星来说非常方便,也使生物圈得以运行。麻烦开始于能源需求变得更大时。 一个解决这个问题的经典方案是弗里曼·戴森的提议[28, 29],即用太阳能收集器包围太阳。这样,
4
⋅
10
26
W
4
⋅
10
26
W
4*10^(26)W 4 \cdot 10^{26} \mathrm{~W} 的总能量输出的大部分就可以用来做功,例如信息处理。太阳系中有足够的材料来建造一个完整的壳体[66],这可以形成一个非常大的分布式处理系统的基础,其中废热会排放到宇宙背景的外部,而信号则通过壳体的内部发送。 能量撞击壳体的总功率与其半径无关,但随着壳体变小,能量通量变大,热力学效率变得更好。假设壳体为黑体,宇宙背景辐射为
T
u
=
3
T
u
=
3
T_(u)=3 T_{u}=3