本文档属于 Robotics Tutorial 项目，作者：Pengfei Guo，达妙科技。采用 CC BY 4.0 协议，转载请注明出处。

D06 无源通信理论——散射变换、波变量与时延无源性¶

本章定位：D05 建立了二端口网络模型并揭示了"透明度-稳定性 trade-off"的根本矛盾，尤其是时延对 Llewellyn 稳定性的摧毁性影响。本章给出解决方案——Anderson-Spong (1989) 的散射变换和 Niemeyer-Slotine (1991) 的波变量理论。核心思想是：将力/速度信号变换到"波域"，使通信通道在任意常数时延下自动保持无源性。这是遥操作领域最优美的理论成果之一——时延不出现在无源性证明的最终条件中。

适用范围：波变量理论不仅适用于遥操作，还推广到网络化控制、多机器人系统。

前置依赖：D05（二端口网络/透明度/Llewellyn 准则）、F02.4（无源性基础——端口无源定义）

下游章节：D07（TDPA 工程实现）、D08（运动映射与遥操作数据采集）

建议用时：2 周（20-30 小时）

前置自测 ⭐¶

📋 答不出 >= 2 题 → 先回前置章节复习

编号	问题	答不出时回顾
1	无源性的能量表述：写出单端口系统无源性的能量不等式 $\int_0^t f(\tau)v(\tau)\,d\tau + V(0) \geq 0$。$V(0)$ 代表什么？	F02.4 无源性基础
2	Llewellyn 准则：写出稳定因子 $\eta(\omega)$ 的表达式。理想透明度下 $\eta = ?$	D05 Llewellyn 准则
3	时延对 Llewellyn 的影响：通信延迟 $T$ 如何改变 $h_{12}h_{21}$ 的实部？关键频率 $\omega = \pi/T$ 处发生了什么？	D05 时延分析
4	传输线基础：无损传输线的波速 $c = 1/\sqrt{LC}$ 和特征阻抗 $Z_0 = \sqrt{L/C}$ 是什么含义？	电磁学/电路理论
5	d'Alembert 解：一维波动方程的通解中正向波和反向波分别代表什么？	数学物理

本章知识导航¶

D6.1 散射变换的直觉与推导 ⭐⭐
 │  └─ 入射波/反射波 → 通道无源性
 │
 ▼
D6.2 波变量理论 ⭐⭐⭐
 │  ├─ Anderson-Spong 1989 原始推导
 │  ├─ 波阻抗 b 的选择
 │  └─ 功率守恒证明
 │
 ▼
D6.3 波变量的透明度分析 ⭐⭐⭐
 │  └─ 波变量 h 参数 → 透明度极限
 │
 ▼
D6.4 改进型波变量 ⭐⭐⭐
 │  ├─ 位置漂移补偿
 │  ├─ 时变波阻抗
 │  └─ 预测增强波变量
 │
 ├─→ D6.5 数据驱动方法 ⭐⭐⭐⭐
 └─→ D6.6 实现与仿真 ⭐⭐

前置知识桥接¶

回顾 D05：二端口网络分析揭示了遥操作的核心矛盾——理想透明度 $H_{\text{ideal}} = [0,1;-1,0]$ 使 Llewellyn 稳定因子 $\eta = 0$（零稳定裕度）。延迟进一步使 $\eta < 0$（不稳定）。D06 的核心问题是：能否找到一种信号变换，使通信通道在任意恒定延迟下保持无源——从而绕过 Llewellyn 的透明度-稳定性 trade-off？

答案：波变量（Wave Variable）。通过将力和速度信号变换为入射波和反射波，通信通道变成了一条传输线——传输线在任意延迟下天然无源。代价是：自由空间中力信号的"波反射"导致力反馈在低频有偏差，高频有振铃。

如果跳过本章会怎样¶

不理解延迟补偿原理：D07 的 TDPA 是波变量理论在时域的推广——不理解波变量就无法理解 TDPA 的设计动机。
不理解位置漂移：波变量的经典问题是位置漂移（position drift），这是 D07 要解决的工程问题之一。

本章目标¶

学完本章后，你应该能够：

从传输线方程出发推导散射变换，理解散射矩阵 $S$ 定义和 $\|S\|_\infty \leq 1$ 与无源性的等价
掌握波变量的完整定义：$u = (f+bv)/\sqrt{2b}$, $v_w = (f-bv)/\sqrt{2b}$，推导功率恒等式
证明任意常数时延下波变量通信通道的无源性——理解为什么时延 $T$ 不出现在最终条件中
**分析时变时延如何破坏无源性**以及能量层修复方案（gain scheduling / 能量罐 / TDPA）
**理解位置漂移问题**及 wave integral 修复
掌握波阻抗 $b$ 的选择原则——过小/过大的影响和自适应方案

预计阅读时间¶

模式	时间	建议
精读（含推导和实践）	10-14 小时	完整阅读，手推关键公式，运行代码示例
速读（抓核心概念）	3-5 小时	重点读核心理论节，跳过实现细节
速查	15-30 分钟	利用知识导航和术语速查表定位目标
复习	1-2 小时	读本章小结和常见误解，做自测题

D6.1 从传输线到散射变换——物理直觉先行 ⭐⭐¶

D6.1.1 传输线类比的动机¶

回顾 D05 的核心困境：通信延迟 $T$ 使 Llewellyn 稳定因子 $\eta$ 降低，需要增大阻尼来补偿——但阻尼牺牲透明度。有没有一种方法能保持稳定性而不牺牲透明度？

Anderson 和 Spong (1989) 的天才洞察来自一个物理事实：延迟本身不产生能量——信号在传输线中传播时被延迟但不被放大。如果我们能找到一种信号表示使得"传输通道"等效于一条无损传输线，那么无论延迟多大，通道都不会产生能量（即保持无源性）。

这个洞察将遥操作的稳定性问题从"控制问题"转变为"信号表示问题"——不是改变控制器，而是改变传输的信号形式。

D6.1.2 无损 LC 传输线方程¶

偏微分方程：

\[\frac{\partial V}{\partial x} = -L \frac{\partial I}{\partial t}, \quad \frac{\partial I}{\partial x} = -C \frac{\partial V}{\partial t}\]

消去一个变量得到波动方程：

\[\frac{\partial^2 V}{\partial x^2} = LC \frac{\partial^2 V}{\partial t^2}\]

波速：$c = 1/\sqrt{LC}$，特征阻抗：$Z_0 = \sqrt{L/C}$

d'Alembert 解：

\[V(x,t) = V^+(t - x/c) + V^-(t + x/c)$$ $$I(x,t) = \frac{1}{Z_0}[V^+(t-x/c) - V^-(t+x/c)]\]

其中 $V^+$ 是正向行波（从左到右传播），$V^-$ 是反向行波（从右到左传播）。

瞬时功率分解——这是核心结果：

\[P = V \cdot I = \frac{(V^+)^2}{Z_0} - \frac{(V^-)^2}{Z_0} = \underbrace{P^+}_{\text{正向波功率}} - \underbrace{P^-}_{\text{反向波功率}}\]

本质洞察：传输线的功率可以分解为正向和反向两个独立波功率之差。每个方向的波**独立传播、互不干扰**——正向波的延迟不影响反向波的传播。这正是无损传输线保持无源性的原因：波能量被延迟传递，但不被创造或消灭。

D6.1.3 力学-电气-波变量的三重类比¶

Anderson-Spong 的核心思想是将力-速度对 $(f, v)$ 映射为"波"信号对，使遥操作通信通道在波域中等价于无损传输线。

电气传输线	力学遥操作	波变量
电压 $V$	力 $f$	—
电流 $I$	速度 $v$	—
正向波 $V^+$	—	入射波 $u$
反向波 $V^-$	—	反射波 $v_w$
特征阻抗 $Z_0$	—	波阻抗 $b$
功率分解 $(V^+)^2/Z_0 - (V^-)^2/Z_0$	$fv$	$\frac{1}{2}(u^2 - v_w^2)$

跨领域类比：散射变换与傅里叶变换在精神上相似——傅里叶变换将时域信号映射到频域使得卷积变为乘法（简化分析），散射变换将力/速度映射到波域使得功率分解为两个独立非负项（简化无源性分析）。两者都是通过坐标变换让特定"守恒律"在新坐标下显式可见。

D6.1.4 传输线类比的深层物理意义——为什么"延迟不产生能量" ⭐⭐⭐¶

理解 Anderson-Spong 洞察的关键在于区分**延迟**和**放大**这两种截然不同的信号操作。

延迟（Delay）是一种**保能操作**。考虑一个电磁波沿同轴电缆传播 100m。波在传播途中被延迟了 $T = 100\text{m} / (2 \times 10^8 \text{m/s}) = 0.5 \mu\text{s}$，但波的幅值没有改变（假设无损电缆）。波携带的能量没有增减——只是"到达时间"推迟了。这是由物理定律（能量守恒）保证的。

放大（Amplification）是一种**产能操作**。放大器将输入信号的幅值增大——这需要外部能源供给（如电池或电源）。没有外部能源的系统不可能放大信号，否则违反热力学第一定律。

Anderson-Spong 的核心洞察可以表述为：如果我们找到一种信号表示，使得通信通道只做"延迟"而不做"放大"，那么通道就自动保持无源性。 波变量正是这种信号表示——在波域中，通信通道的效果是纯延迟，因此不产生能量。

为什么力/速度域中延迟会"产生"能量？

直接传输力信号 $f_s(t) = f_m(t-T)$ 时，slave 端的瞬时功率是 $P_s(t) = f_m(t-T) \cdot \dot{x}_s(t)$。由于 $f_m(t-T)$ 和 $\dot{x}_s(t)$ 是两个不同时刻的信号，它们的乘积可以是任意符号——特别是当力和速度"失相"时（即力的方向在 $T$ 时间前是正的，但速度当前也是正的），乘积为正，等效于通道向系统注入能量。

在波域中，这个问题被消除了。波变量将力和速度"混合"成一个信号，使得功率只取决于波的平方（恒非负），而不取决于两个独立信号的乘积。延迟只改变波到达的时间，不改变波的平方值——因此功率恒非负。

"不是 X 而是 Y" 纠正：波变量**不是**"让延迟消失"——延迟仍然存在，操作者仍然感受到延迟带来的透明度下降。波变量的作用是**让延迟从"不安全"变为"安全"**——延迟不再产生能量，因此不再威胁稳定性。稳定性和透明度是两个独立的指标：波变量解决了前者，但后者仍受延迟约束。

D6.1.5 从微波工程到遥操作——散射参数的历史脉络¶

散射参数（S-parameter）最早由 20 世纪 40 年代的微波工程师引入，用于描述微波网络（如天线、滤波器、放大器）的端口特性。在微波频率下（GHz 量级），电路元件的尺寸与波长相当，传统的电压/电流参数不再适用——电压和电流沿传输线是空间变化的，不是集总参数。散射参数用入射波和反射波描述网络行为，自然适配分布参数系统。

1989 年 Anderson 和 Spong 将这一工具从微波工程"借用"到遥操作领域，是一次经典的跨学科知识迁移。他们的关键认识是：遥操作通信通道的数学结构与微波传输线完全同构——都是两端口网络，都涉及信号在两个方向上的传播和延迟，都需要保证能量不被放大。微波工程师用散射参数保证放大器不自激振荡；遥操作工程师用同样的工具保证主从系统不失稳。

这一历史脉络揭示了一个深刻的方法论启示：当两个物理系统具有相同的数学结构时，一个领域的成熟工具可以直接迁移到另一个领域。 这在控制理论中反复出现——Lyapunov 方法从力学迁移到控制，LQR 从航空工程迁移到机器人，而散射变换则从微波工程迁移到遥操作。

D6.2 散射变换的完整定义与推导 ⭐⭐⭐¶

D6.2.1 散射波的定义¶

引入波阻抗参数 $b > 0$（类比传输线特征阻抗 $Z_0$），定义散射波：

\[a = \frac{f + bv}{\sqrt{2b}} \quad \text{（入射波——流入网络的能量载体）}\]

\[b_w = \frac{f - bv}{\sqrt{2b}} \quad \text{（反射波——流出网络的能量载体）}\]

归一化因子 $1/\sqrt{2b}$ 的设计目的是使 $a^2$ 和 $b_w^2$ 直接具有功率量纲（W = J/s）。

验证量纲：$[f] = $ N, $[bv] = $ (Ns/m)(m/s) = N, $[\sqrt{2b}] = \sqrt{\text{Ns/m}}$

\[[a] = \frac{\text{N}}{\sqrt{\text{Ns/m}}} = \frac{\text{N} \cdot \sqrt{\text{m}}}{\sqrt{\text{Ns}}} = \sqrt{\frac{\text{N}^2 \cdot \text{m}}{\text{Ns}}} = \sqrt{\frac{\text{N} \cdot \text{m}}{\text{s}}} = \sqrt{\text{W}}\]

$[a^2] = $ W $\checkmark$

D6.2.2 逆变换¶

从波域回到力/速度域：

\[f = \sqrt{\frac{b}{2}} (a + b_w)\]

\[v = \frac{a - b_w}{\sqrt{2b}}\]

验证可逆性（代入 $a, b_w$ 定义）：

\[f = \sqrt{\frac{b}{2}} \left( \frac{f+bv}{\sqrt{2b}} + \frac{f-bv}{\sqrt{2b}} \right) = \sqrt{\frac{b}{2}} \cdot \frac{2f}{\sqrt{2b}} = f \quad \checkmark\]

\[v = \frac{1}{\sqrt{2b}} \left( \frac{f+bv}{\sqrt{2b}} - \frac{f-bv}{\sqrt{2b}} \right) = \frac{1}{\sqrt{2b}} \cdot \frac{2bv}{\sqrt{2b}} = v \quad \checkmark\]

散射变换是**可逆线性变换**——不丢失任何信息。

D6.2.3 功率恒等式——散射变换的核心性质 ⭐⭐⭐¶

定理：对任意力 $f$ 和速度 $v$，散射变换满足功率恒等式：

\[\boxed{f \cdot v = \frac{1}{2}(a^2 - b_w^2)}\]

推导：

\[f \cdot v = \sqrt{\frac{b}{2}}(a + b_w) \cdot \frac{(a - b_w)}{\sqrt{2b}}\]

\[= \frac{1}{2}(a + b_w)(a - b_w) = \frac{1}{2}(a^2 - b_w^2) \quad \blacksquare\]

为什么这很重要？

无源性要求 $\int_0^t f \cdot v \, d\tau \geq 0$（流入能量非负）。在波域中，这等价于：

\[\int_0^t a^2(\tau) \, d\tau \geq \int_0^t b_w^2(\tau) \, d\tau\]

即入射波总能量不小于反射波总能量——网络吸收而非产生能量。功率恒等式使无源性分析从"力$\times$速度积分"简化为"两个非负量的比较"。

D6.2.4 散射变换矩阵的逐步推导 ⭐⭐⭐¶

前面给出了散射波的定义和功率恒等式，但还没有展示**完整的散射变换矩阵**——它描述了单端口从力/速度域到波域的线性映射。二端口的 h 参数与散射参数也通过波变量连接，但不是普通相似变换，而是要按入射/反射波的定义重新分组。

散射变换矩阵 $\Phi$ 的推导：

定义列向量 $\mathbf{p} = [f; v]$（力/速度对）和 $\mathbf{w} = [a; b_w]$（入射/反射波对）。

从定义：

\[a = \frac{f + bv}{\sqrt{2b}}, \quad b_w = \frac{f - bv}{\sqrt{2b}}\]

写成矩阵形式：

\[\begin{bmatrix} a \\ b_w \end{bmatrix} = \frac{1}{\sqrt{2b}} \begin{bmatrix} 1 & b \\ 1 & -b \end{bmatrix} \begin{bmatrix} f \\ v \end{bmatrix}\]

定义散射变换矩阵：

\[\boxed{\Phi = \frac{1}{\sqrt{2b}} \begin{bmatrix} 1 & b \\ 1 & -b \end{bmatrix}}\]

$\Phi$ 的关键性质：

性质 1：可逆性

对 $2 \times 2$ 矩阵 $\begin{bmatrix} a & b \\ c & d \end{bmatrix}^{-1} = \frac{1}{ad-bc}\begin{bmatrix} d & -b \\ -c & a \end{bmatrix}$，计算：

\[\det(\Phi) = \frac{1}{2b}(1 \cdot (-b) - b \cdot 1) = \frac{-2b}{2b} = -1\]

\[\Phi^{-1} = \frac{1}{-1} \cdot \frac{1}{\sqrt{2b}} \begin{bmatrix} -b & -b \\ -1 & 1 \end{bmatrix} = \frac{1}{\sqrt{2b}} \begin{bmatrix} b & b \\ 1 & -1 \end{bmatrix}\]

验证 $\Phi^{-1} \Phi = I$：

\[\Phi^{-1} = \begin{bmatrix} \sqrt{b/2} & \sqrt{b/2} \\ 1/\sqrt{2b} & -1/\sqrt{2b} \end{bmatrix}\]

验证：$f = \sqrt{b/2}(a + b_w)$, $v = (a - b_w)/\sqrt{2b}$ —— 与 D6.2.2 节的逆变换一致 $\checkmark$

性质 2：功率保持

\[f \cdot v = \mathbf{p}^T J \mathbf{p} \quad \text{其中} \quad J = \frac{1}{2}\begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix}\]

\[\frac{1}{2}(a^2 - b_w^2) = \mathbf{w}^T \Sigma \mathbf{w} \quad \text{其中} \quad \Sigma = \frac{1}{2}\begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix}\]

功率恒等式 $\mathbf{p}^T J \mathbf{p} = \mathbf{w}^T \Sigma \mathbf{w}$ 意味着：

\[\Phi^T \Sigma \Phi = J\]

这正是说 $\Phi$ 是一个**功率不变变换**（power-preserving transform）——它保持力学系统的功率结构。

跨领域类比：散射变换矩阵 $\Phi$ 与哈密顿力学中的正则变换具有相同的数学结构——都是保持某种"双线性形式"的线性映射。正则变换保持 Poisson 括号 $\{q, p\} = 1$；散射变换保持功率恒等式 $fv = (a^2 - b_w^2)/2$。这不是巧合——两者都源于能量守恒的深层数学结构。

性质 3：二端口散射矩阵

对二端口系统（两组力/速度对），可以先把每个端口的力/速度对分别变换到波变量。若只是在同一种变量排序下换坐标，散射变换矩阵可写成 $4 \times 4$ 块对角矩阵：

\[\Phi_{2-port} = \begin{bmatrix} \Phi_1 & 0 \\ 0 & \Phi_2 \end{bmatrix}\]

其中 $\Phi_1$ 和 $\Phi_2$ 分别作用于端口 1 和端口 2 的力/速度对。如果两端口使用相同的波阻抗 $b$，则 $\Phi_1 = \Phi_2 = \Phi$。

但 D05 的 h 参数不是把 $[F_h,V_m,F_e,-V_s]^T$ 映射到同一类向量，而是混合因果形式：

\[y = Hx,\quad x=\begin{bmatrix}V_m\\F_e\end{bmatrix},\quad y=\begin{bmatrix}F_h\\-V_s\end{bmatrix}\]

因此从 h 参数求散射矩阵时，必须先按“入射波/反射波”分组。沿用 D05 的被动端口方向：端口 1 流入速度为 $\nu_1=V_m$，端口 2 流入速度为 $\nu_2=-V_s$。令 $b_m,b_s>0$，$\rho_m=\sqrt{2b_m}$，$\rho_s=\sqrt{2b_s}$：

\[a_1=\frac{F_h+b_mV_m}{\rho_m},\quad r_1=\frac{F_h-b_mV_m}{\rho_m}\]

\[a_2=\frac{F_e+b_s(-V_s)}{\rho_s},\quad r_2=\frac{F_e-b_s(-V_s)}{\rho_s}\]

二端口散射矩阵 $S$ 定义为：

\[\begin{bmatrix} r_1 \\ r_2 \end{bmatrix} = S \begin{bmatrix} a_1 \\ a_2 \end{bmatrix}\]

把上面的波变量写成

\[a = Ax + By,\quad r = Cx + Dy\]

其中

\[A=\begin{bmatrix} b_m/\rho_m & 0 \\ 0 & 1/\rho_s \end{bmatrix},\quad B=\begin{bmatrix} 1/\rho_m & 0 \\ 0 & b_s/\rho_s \end{bmatrix}\]

\[C=\begin{bmatrix} -b_m/\rho_m & 0 \\ 0 & 1/\rho_s \end{bmatrix},\quad D=\begin{bmatrix} 1/\rho_m & 0 \\ 0 & -b_s/\rho_s \end{bmatrix}\]

代入 $y=Hx$ 后：

\[a=(A+BH)x,\quad r=(C+DH)x\]

所以在 $A+BH$ 可逆时：

\[\boxed{S=(C+DH)(A+BH)^{-1}}\]

这才是 h 参数到散射矩阵的 Cayley 变换/线性分式变换。常见错误是把它当作普通相似变换；那会把 h 参数误当成同一变量空间里的线性算子，忽略 h 参数的输入/输出变量混合以及入射/反射波重分组。

D6.2.5 散射矩阵与无源性等价¶

定义散射矩阵 $S$ 将入射波映射到反射波：$r = S \cdot a$

无源性等价条件：

\[\|S\|_\infty \leq 1\]

即散射矩阵的 $H_\infty$ 范数不超过 1。物理含义：反射波的 $L_2$ 能量不超过入射波——系统不放大能量。

与 D05 的 Llewellyn 条件的关系：Llewellyn 准则用 h 参数表述；$\|S\|_\infty \leq 1$ 用散射参数表述。两者是同一被动性条件的不同参数化。波域的优势在于：无源性条件变为简单的范数约束，且自然处理延迟。

⚠️ 常见陷阱¶

💡 概念误区：认为"散射变换是一种近似"
   新手想法："将力/速度变换为波 → 一定丢失了某些信息"
   实际上：散射变换是可逆的线性变换——不丢失任何信息
          从 (f,v) 到 (a,b_w) 再回到 (f,v) 完全精确（已验证）
          它只是换了一种"看"同一系统的方式
   类比：旋转坐标系不改变物理——只改变数学表达的简洁程度

🧠 思维陷阱：认为"波阻抗 b 是一个物理量需要从硬件测量"
   新手想法："b 类比 Z_0 → 应该从物理系统中测量"
   实际上：b 是一个自由设计参数——它决定力和速度在波中的权重
          不同的 b 得到不同的波变量，但都满足功率恒等式
          b 的选择影响透明度和鲁棒性的 trade-off（5 节详述）

练习¶

[A 型 -- 散射变换验证] 在 Python 中实现散射变换和逆变换。给定 1000 个随机 $(f, v)$ 样本，变换到波域再变换回来，验证误差 < 机器精度 ($10^{-15}$)
[思考题] 如果 $b = 0$ 或 $b < 0$，散射变换出什么问题？从定义式中 $1/\sqrt{2b}$ 的性质分析

D6.3 波变量——Niemeyer-Slotine 的物理直觉 ⭐⭐¶

D6.3.1 波变量的完整定义¶

Niemeyer 和 Slotine (1991) 重新包装了散射变换，给出了更符合遥操作直觉的定义和命名。

先固定端口方向：本章端口功率以“流入通信通道/二端口”为正。Master 侧取 $\nu_m=\dot{x}_m$；slave 的物理速度 $\dot{x}_s=V_s$ 通常定义为从 master 指令方向流向环境，因此对通信通道而言流入速度是 $\nu_s=-\dot{x}_s$。这就是 D05 h 参数使用 $-V_s$ 的原因。

Master 侧（发射正向波 $u_m$，接收反向波 $v_m$）：

\[u_m = \frac{f_m + b \dot{x}_m}{\sqrt{2b}} \quad \text{（master 向 slave 发射的正向波）}\]

\[v_m = \frac{f_m - b \dot{x}_m}{\sqrt{2b}} \quad \text{（master 从 slave 接收的反向波）}\]

Slave 侧（接收正向波 $u_s$，发射反向波 $v_s$）：

\[u_s = \frac{f_s + b \dot{x}_s}{\sqrt{2b}} \quad \text{（slave 接收到的正向波）}\]

\[v_s = \frac{f_s - b \dot{x}_s}{\sqrt{2b}} \quad \text{（slave 向 master 发射的反向波）}\]

等价地，用流入通信通道的 slave 端口速度 $\nu_s=-\dot{x}_s$ 写：

\[v_s=\frac{f_s+b\nu_s}{\sqrt{2b}},\quad u_s=\frac{f_s-b\nu_s}{\sqrt{2b}}\]

所以 $v_s$ 是 slave 端“流入通道”的波，$u_s$ 是通道送到 slave 的波。不要把 slave 端的 $u_s$ 误读成“从 slave 流入通道”的入射波。

记号提醒：本章小写 $v_m, v_s$ 表示**波变量中的反向波**，不是 D05 中大写 $V_m,V_s$ 表示的端口速度。速度一律写成 $\dot{x}_m,\dot{x}_s$ 或 $\nu_m,\nu_s$，避免把“波”和“速度”混在一起。

D6.3.2 通信协议¶

波变量通信规则极其简单——正向波从 master 延迟传到 slave，反向波从 slave 延迟传到 master：

\[u_s(t) = u_m(t - T_1) \quad \text{（正向波经延迟 $T_1$ 到达 slave）}\]

\[v_m(t) = v_s(t - T_2) \quad \text{（反向波经延迟 $T_2$ 到达 master）}\]

波变量通信示意图
══════════════════════════════════════════

Master 端                           Slave 端
  u_m(t) ─────── 延迟 T₁ ──────→ u_s(t) = u_m(t-T₁)
                                    ↓
  v_m(t) = v_s(t-T₂) ←── 延迟 T₂ ── v_s(t)

u_m: master→slave 正向波（携带 master 运动意图）
v_s: slave→master 反向波（携带环境力反馈）
T₁ + T₂ = T_round_trip（往返延迟）

D6.3.3 Niemeyer-Slotine 完整证明——从定义到控制律 ⭐⭐⭐¶

Niemeyer 和 Slotine 的核心贡献不仅是重新命名散射变量为"波变量"，更是给出了从波变量定义到**完整控制律推导**的严格路径。

定理（Niemeyer-Slotine 1991）：如果 master 和 slave 端的控制律满足以下条件，则整个遥操作系统（含通信通道）是无源的：

Master 端：波变量编码——将 $(f_m, \dot{x}_m)$ 编码为 $(u_m, v_m)$，发送 $u_m$
Slave 端：从接收到的 $u_s = u_m(t-T_1)$ 解码出控制力 $f_s$
通信通道：纯延迟 $u_s(t) = u_m(t-T_1)$, $v_m(t) = v_s(t-T_2)$

证明：

Part A：Master 端无源性

Master 端口的功率流入（操作者向 master 系统输入能量）：

\[P_m = f_m \cdot \dot{x}_m = \frac{1}{2}(u_m^2 - v_m^2)\]

Master 的储能函数：$V_m = \frac{1}{2}M_m \dot{x}_m^2$（动能）

Master 动力学：$M_m \ddot{x}_m = f_h + f_{m,ctrl}$

其中 $f_h$ 是人手力，$f_{m,ctrl}$ 是 master 控制器输出的力。

Master 控制律设计为：

\[f_{m,ctrl} = \sqrt{2b} \cdot v_m - b\dot{x}_m\]

这保证了 master 端口向通道输出的正向波恰好是 $u_m = (f_m + b\dot{x}_m)/\sqrt{2b}$。

验证 master 端的无源性：

\[\dot{V}_m = M_m \dot{x}_m \ddot{x}_m = \dot{x}_m(f_h + f_{m,ctrl})$$ $$= \dot{x}_m f_h + \dot{x}_m(\sqrt{2b} v_m - b\dot{x}_m)$$ $$= P_{h \to m} + \sqrt{2b} \dot{x}_m v_m - b\dot{x}_m^2\]

经过代数化简（将 $\dot{x}_m$ 用 $u_m, v_m$ 表示），可以证明 $\dot{V}_m \leq P_{h \to m}$——master 端的储能增长率不超过输入功率，即 master 端是被动的。

Part B：Slave 端无源性

Slave 控制律：

\[f_s = \sqrt{2b} \cdot u_s - b\dot{x}_s\]

Slave 动力学：$M_s \ddot{x}_s = f_s - f_e$

\[\dot{V}_s = M_s \dot{x}_s \ddot{x}_s = \dot{x}_s(f_s - f_e)\]

这里的通道到 slave 功率是 $-P_{s\to comm}=\frac{1}{2}(u_s^2-v_s^2)$；负号来自 slave 端口的 $\nu_s=-\dot{x}_s$ 约定。由于 $f_s = \sqrt{2b} u_s - b\dot{x}_s$，将 $\dot{x}_s$ 用波变量表示后可以证明：

\[\dot{V}_s \leq \frac{1}{2}(u_s^2 - v_s^2) - \dot{x}_s f_e\]

即 slave 端的储能增长率不超过从通道接收的功率减去向环境输出的功率——slave 端是被动的。

Part C：通道无源性（已在 4 节详证）

Part D：互联系统无源性

三个被动子系统（master、通道、slave）的反馈互联仍然是被动的——这是无源性理论的核心定理（D05/F02.4 的"被动系统互联定理"）。

\[\boxed{V_{total} = V_m + V_s + E_{comm} \leq \int_0^t (f_h \dot{x}_m - f_e \dot{x}_s) d\tau}\]

整个系统对外界（操作者+环境）是被动的。 $\blacksquare$

本质洞察：Niemeyer-Slotine 证明的深层结构是**分解**——将复杂系统分解为 master、通道、slave 三个子系统，分别证明各自的无源性，然后利用"被动互联定理"得到全局结论。这种分析策略在控制理论中普遍适用——D07 的 TDPA 也采用类似的端口分解思路。

D6.3.4 波域中的力/速度恢复¶

Slave 端控制器实现：

slave 收到 $u_s(t) = u_m(t-T_1)$。从波变量定义：

\[u_s = \frac{f_s + b\dot{x}_s}{\sqrt{2b}}\]

slave 需要产生的力：$f_s = \sqrt{2b} \cdot u_s - b\dot{x}_s$

同时 slave 发射反向波：

\[v_s = \frac{f_s - b\dot{x}_s}{\sqrt{2b}} = \frac{(\sqrt{2b} \cdot u_s - b\dot{x}_s) - b\dot{x}_s}{\sqrt{2b}} = u_s - \sqrt{2b}\dot{x}_s\]

物理解释：slave 接收到一个"入射波"$u_s$。它的任务是"吸收"这个波——吸收的部分转化为运动（$\dot{x}_s$），未被吸收的部分成为反射波（$v_s$）返回 master。这与传输线末端负载的行为完全对应：

完全匹配负载（$Z_{load} = Z_0$）：反射为零，波完全被吸收
开路（$Z_{load} = \infty$）：波完全反射，电流为零
短路（$Z_{load} = 0$）：波完全反射但反相，电压为零

在遥操作中： - $Z_e = b$（环境阻抗匹配波阻抗）：反射最小→透明度最高 - $Z_e = \infty$（刚墙）：大量反射→操作者感受到强力 - $Z_e = 0$（自由空间）：大量反射→操作者感受到波阻抗 $b$ 的残余粘滞

D6.4 任意常数时延下的无源性证明 ⭐⭐⭐¶

D6.4.1 问题陈述¶

定理：波变量通信通道在任意常数时延 $T_1, T_2 \geq 0$ 下是无源的。

证明目标：证明通道两端口的总流入能量恒非负：

\[E_{comm}(t) = \int_0^t [P_{m \to comm}(\tau) + P_{s \to comm}(\tau)] d\tau \geq 0, \quad \forall t \geq 0\]

D6.4.2 展开端口功率¶

Master 端口向通道输入的功率（用波变量展开）：

\[P_{m \to comm} = \frac{1}{2}(u_m^2 - v_m^2)\]

Slave 端口向通道输入的功率。注意这里使用流入通信通道的端口速度 $\nu_s=-\dot{x}_s$，因此这是 slave 向通道输入的功率，不是通道向 slave 输出的功率：

\[P_{s \to comm} = \frac{1}{2}(v_s^2 - u_s^2)\]

总功率：

\[E_{comm}(t) = \frac{1}{2}\int_0^t [u_m^2 - v_m^2 + v_s^2 - u_s^2] d\tau\]

D6.4.3 代入通信关系¶

Step 1：处理 $\int_0^t u_s^2 d\tau$

利用 $u_s(\tau) = u_m(\tau - T_1)$，变量替换 $\sigma = \tau - T_1$：

\[\int_0^t u_s^2(\tau) d\tau = \int_0^t u_m^2(\tau - T_1) d\tau = \int_{-T_1}^{t-T_1} u_m^2(\sigma) d\sigma\]

由因果性（$\sigma < 0$ 时系统未启动，$u_m = 0$）：

\[= \int_0^{t-T_1} u_m^2(\sigma) d\sigma\]

Step 2：处理 $\int_0^t v_m^2 d\tau$

利用 $v_m(\tau) = v_s(\tau - T_2)$：

\[\int_0^t v_m^2(\tau) d\tau = \int_0^{t-T_2} v_s^2(\sigma) d\sigma\]

D6.4.4 合并——最终结果¶

\[E_{comm}(t) = \frac{1}{2}\left[\int_0^t u_m^2 - \int_0^{t-T_2} v_s^2 + \int_0^t v_s^2 - \int_0^{t-T_1} u_m^2\right]\]

\[= \frac{1}{2}\left[\int_0^t u_m^2 - \int_0^{t-T_1} u_m^2\right] + \frac{1}{2}\left[\int_0^t v_s^2 - \int_0^{t-T_2} v_s^2\right]\]

\[\boxed{E_{comm}(t) = \underbrace{\frac{1}{2}\int_{t-T_1}^{t} u_m^2(\tau)\,d\tau}_{\geq\,0\;\text{（被积函数非负）}} + \underbrace{\frac{1}{2}\int_{t-T_2}^{t} v_s^2(\tau)\,d\tau}_{\geq\,0\;\text{（被积函数非负）}} \;\geq\; 0 \quad \blacksquare}\]

D6.4.5 证明的深层含义¶

为什么时延 $T$ 不出现在非负条件中？

被积函数是平方项（$u_m^2 \geq 0$, $v_s^2 \geq 0$），无论积分区间 $[t-T, t]$ 多长，积分恒非负。$T$ 只影响通道储能的大小（积分区间宽度），不影响储能的符号（非负性）。

物理解释：$E_{comm}(t)$ 是"管线中在途的波能量"：

项	物理含义
$\frac{1}{2}\int_{t-T_1}^{t} u_m^2 d\tau$	Master 已发射但 slave 尚未收到的正向波能量
$\frac{1}{2}\int_{t-T_2}^{t} v_s^2 d\tau$	Slave 已发射但 master 尚未收到的反向波能量

这等价于传输线的**储能**——波在传播途中，能量储存在"管线"里。储能恒非负（因为能量密度是平方量），所以通道恒无源。

本质洞察：波变量的深层本质是将遥操作通信通道**精确类比为无损传输线**。传输线延迟信号但不产生能量——这是由物理定律（能量守恒）保证的。波变量将这一物理事实"编码"进信号表示中，使数学上自动保证无源性。

反事实推理：如果不用波变量而直接传输力/速度会怎样？考虑直接传输力 $f_s(t) = f_m(t-T)$。在 slave 端，延迟力与当前速度的乘积 $f_m(t-T) \cdot \dot{x}_s(t)$ 可正可负——延迟使力和速度"失相"，失相功率可以是负的（通道向系统注入能量）。波变量通过将力和速度"混合"成波信号，消除了这种失相效应。

D6.4.6 证明的数学结构——为什么如此简洁 ⭐⭐⭐¶

回顾 D6.4.4 的证明。整个证明只有 4 步——定义功率、代入通信关系、变量替换、合并。最终结果 $E_{comm}(t) \geq 0$ 的证明只依赖于一个事实：非负函数的定积分恒非负。

这种简洁性不是巧合，而是波变量设计的核心目的。我们可以从逆向工程的角度理解：

问题：设计一种信号变换 $\mathcal{T}: (f, v) \to (w_1, w_2)$，使得通信通道的储能可以写成"非负被积函数的积分"形式。

约束：变换必须保持功率恒等式 $fv = g(w_1, w_2)$，且 $g$ 的形式使得延迟代入后仍保证非负。

解：散射变换 $\mathcal{T}$ 选择 $g(u, v) = (u^2 - v^2)/2$——功率是两个**平方项**之差。平方项有两个关键性质：

非负性：$u^2(t) \geq 0$, $v^2(t) \geq 0$ 对任意 $t$
延迟不变性：$u^2(t-T) \geq 0$ 对任意 $t$ 和 $T$——延迟不改变非负性

这两个性质合在一起保证了：

\[\int_a^b u^2(\tau) d\tau \geq 0 \quad \text{无论 } [a, b] \text{ 是什么区间}\]

而通道储能恰好可以写成这种形式（D6.4.4 的最终结果）——因此恒非负。

如果用其他变换会怎样？ 假设我们选择 $g(w_1, w_2) = w_1 \cdot w_2$（而非 $w_1^2 - w_2^2$）。那么通道储能中会出现 $\int w_1(t) \cdot w_2(t-T) d\tau$ 这样的交叉项——两个不同时刻的信号的乘积可正可负，无法保证积分非负。散射变换的精妙之处正是：将功率从"交叉项"（力$\times$速度）转化为"自身项之差"（波的平方差），消除了所有交叉项。

阶段小结：到这里我们完成了常数时延无源性的完整证明和深层理解。核心要点是：(1) 波变量将功率分解为两个平方项之差；(2) 平方项的积分恒非负；(3) 延迟只改变积分区间但不改变被积函数的非负性。这三个要素共同保证了 $E_{comm}(t) \geq 0$——与延迟大小无关。接下来我们将证明的结论与 D05 的 Llewellyn 分析进行对比。

D6.4.7 与 D05 Llewellyn 分析的对比¶

维度	Llewellyn 准则 (D05)	波变量无源性 (D06)
适用范围	线性时不变 (LTI)	任意非线性被动终端
对延迟处理	延迟使 $\eta$ 降低→需加阻尼	延迟不影响无源性→无需额外阻尼
透明度代价	阻尼直接降低透明度	波阻抗 $b$ 引入残余粘滞
工程角色	分析工具（判断稳定性）	设计工具（构造稳定通信通道）

⚠️ 常见陷阱¶

💡 概念误区：认为"波变量消除了时延的影响"
   新手想法："波变量使时延不影响稳定性 → 时延没有任何代价"
   实际上：波变量保证了稳定性，但时延仍然影响透明度——
          延迟的波到达后解码出的力/速度是"过时的"
          Z_to(s) 包含 e^{-sT} 项→高频透明度严重下降
   正确理解：波变量解决了稳定性问题，但透明度-延迟 trade-off 仍存在
            它让你在"不稳定"和"稳定但有粘滞"之间选了后者

🧠 思维陷阱：认为"证明只适用于线性系统"
   新手想法："无源性证明用了积分和平方→只对线性系统有效"
   实际上：证明只依赖功率恒等式 fv = (u^2-v^2)/2 和通信关系
          这些对非线性系统同样成立——只要通信通道是纯延迟
          操作者和环境可以是任意非线性被动系统
   延伸：这比 Llewellyn(LTI) 更通用——波变量无源性对非线性也成立

练习¶

[A 型 -- 波变量实现] 在 Python 中实现 1-DOF 主从波变量遥操作：master（$M_m=0.5$ kg，$B_m=2$ Ns/m）+ slave（$M_s=1$ kg，$B_s=1$ Ns/m）+ 常数时延 100 ms。用 $b=1, 2, 5$ 分别测试自由空间和硬墙（$K_e=10000$）响应。绘制 $x_m(t), x_s(t), f_m(t), f_s(t)$
[A 型 -- 能量监测] 在上一练习中计算并绘制 $E_{comm}(t)$。验证 $E_{comm}(t) \geq 0$ 恒成立。将 $T$ 从 10 ms 增大到 1000 ms，观察 $E_{comm}$ 的变化（储能增大但始终非负）
[B 型 -- Anderson-Spong 1989 精读] 精读原论文 Section III-IV。手推散射变换的完整推导链。验证"传输线储能"解释
[思考题] 波变量把力/速度变换为波域——这与 SLAM 中"把时域信号变换到频域(FFT)再处理"有什么概念上的相似？提示：两者都通过坐标变换使某种"守恒量"（能量/功率谱）在变换域中显式可见

D6.5 波阻抗 $b$ 的选择——透明度与鲁棒性的权衡 ⭐⭐¶

D6.5.1 波阻抗的物理含义¶

$b$ 决定了力和速度在波信号中的相对权重。从定义 $u = (f + bv)/\sqrt{2b}$ 看：

$b$ 很小→ $u \approx f/\sqrt{2b}$：波主要携带力信息
$b$ 很大→ $u \approx \sqrt{b/2} \cdot v$：波主要携带速度信息

D6.5.2 $b$ 对系统行为的系统分析¶

极端情况：

$b$ 值	波的主导分量	自由空间感受	硬墙感受	问题
$b \to 0$	力	几乎零粘滞（好）	振铃严重	大阻抗失配→波大量反射
$b \approx \sqrt{K_e M_m}$	平衡	适中粘滞	平滑	阻抗匹配→反射最小
$b \to \infty$	速度	严重粘滞（差）	稳定	力信息被压制

振铃的物理解释：当波从低阻抗传输线到达高阻抗负载时（$b \ll Z_e$），大部分能量被反射。反射波在 master-slave 之间来回弹跳，每次被部分吸收——这就是振铃。增大 $b$ 使其接近 $Z_e$ 可以减少反射，就像传输线匹配阻抗消除驻波。

跨领域类比：波阻抗匹配与音频工程中的阻抗匹配原理相同。如果放大器输出阻抗与扬声器阻抗不匹配，会产生驻波和失真。高端音频系统精心匹配阻抗以获得最佳音质——遥操作中精心选择 $b$ 以获得最佳透明度，物理原理完全一致。

D6.5.3 波阻抗 b 选择的权衡分析——透明性 vs 鲁棒性 ⭐⭐⭐¶

$b$ 的选择是遥操作工程中最关键的设计参数之一。这里给出系统性的分析框架。

透明度分析——自由空间：

在自由空间（$Z_e = 0$），操作者感受到的阻抗为：

\[Z_{to}^{free} = h_{11}^{wave} = b \quad (\text{波阻抗直接成为残余粘滞})\]

这意味着**自由空间透明度完全由 $b$ 决定**——$b$ 越小，自由空间越"轻盈"。

透明度分析——硬墙接触：

在硬墙（$Z_e \to \infty$）接触时，考虑波反射。入射波 $u$ 到达硬墙后完全反射为 $v = +u$（同相反射，类比传输线开路）。这是因为硬墙边界条件 $\dot{x}_s = 0$ 代入 $v_s = u_s - \sqrt{2b}\dot{x}_s$ 得 $v_s = u_s$；等价地，反射系数 $\Gamma = (Z_e - b)/(Z_e + b) \to +1$。经过往返延迟 $2T$ 后，master 收到反射波。

操作者感受到的阻抗在低频（$\omega \ll 1/T$）趋近于 $Z_e$（透明），在高频（$\omega \gg 1/T$）趋近于 $b$（波阻抗遮蔽）。

临界频率：$\omega_c \approx 1/(2T)$

$\omega < \omega_c$：透明度良好，$|Z_{to} - Z_e| / |Z_e| < 0.3$
$\omega > \omega_c$：透明度恶化，操作者感受趋向 $b$

鲁棒性分析——振铃：

当 $b \ll Z_e$ 时，阻抗失配比 $\Gamma = (Z_e - b)/(Z_e + b) \approx 1$，几乎全反射。反射波在 master-slave 之间往返弹跳，衰减速率取决于两端的吸收能力。

振铃的衰减时间常数：

\[\tau_{ring} \approx \frac{T}{\ln(1/|\Gamma|)} \approx \frac{T \cdot Z_e}{2b} \quad (b \ll Z_e)\]

工程含义：$b$ 太小时，$\tau_{ring}$ 可能长达数秒——操作者感受到持续的"弹跳"。

定量权衡表：

$b$ / $\sqrt{K_e M_m}$	自由空间粘滞	硬墙振铃	阻抗匹配度	综合评价
0.1	极低（好）	严重（差）	10%	不可用
0.3	低（好）	明显	30%	自由空间任务可用
0.5	中等	轻微	50%	可接受
1.0	中等	最小	100%	最优匹配
2.0	高（差）	无	50%（过阻尼）	保守
5.0	严重（差）	无	20%（严重过阻尼）	不可用

双重解读： - 角度 1（传输线理论）：$b = \sqrt{K_e M_m}$ 是**阻抗匹配**条件——传输线特征阻抗等于负载阻抗时反射为零、传输效率最高 - 角度 2（最优控制）：$b = \sqrt{K_e M_m}$ 是最小化"所有频率的反射能量总和"的解——即 $\min_b \int_0^\infty |\Gamma(\omega)|^2 d\omega$ 的最优解

D6.5.4 波阻抗对传递阻抗 $Z_{to}$ 的频域分析 ⭐⭐⭐¶

前面从时域（振铃、粘滞感）分析了 $b$ 的影响。现在从频域角度给出更精确的分析——这是 D05 Llewellyn 分析的自然延续。

传递阻抗的频域推导：

在波变量遥操作中，操作者感受到的"从主端看过去的等效阻抗" $Z_{to}(j\omega)$ 可以从波反射系数推导。

设环境阻抗为 $Z_e(j\omega)$（从 slave 端看过去的阻抗），通信延迟为 $T$（单程），波阻抗为 $b$。

Step 1：Slave 端的反射系数：

\[\Gamma_s(j\omega) = \frac{Z_e(j\omega) - b}{Z_e(j\omega) + b}\]

Step 2：反射波经过往返延迟 $2T$ 后回到 master：

\[\Gamma_m(j\omega) = \Gamma_s(j\omega) \cdot e^{-2j\omega T}\]

Step 3：从反射系数恢复传递阻抗：

\[Z_{to}(j\omega) = b \cdot \frac{1 + \Gamma_m(j\omega)}{1 - \Gamma_m(j\omega)} = b \cdot \frac{1 + \Gamma_s e^{-2j\omega T}}{1 - \Gamma_s e^{-2j\omega T}}\]

特殊情况分析：

情况 1：完美阻抗匹配 $Z_e = b$（纯阻性环境）

\[\Gamma_s = 0 \implies Z_{to} = b \quad (\text{所有频率})\]

操作者在所有频率感受到 $b$——这是波阻抗遮蔽效应的极端情况。

情况 2：刚墙 $Z_e \to \infty$

\[\Gamma_s \to +1 \implies Z_{to} = b \cdot \frac{1 + e^{-2j\omega T}}{1 - e^{-2j\omega T}}\]

利用 Euler 公式展开：

\[Z_{to} = b \cdot \frac{2\cos(\omega T)e^{-j\omega T}}{-2j\sin(\omega T)e^{-j\omega T}} = \frac{b}{j\tan(\omega T)}\]

低频（$\omega T \ll 1$）：$Z_{to} \approx b/j\omega T = K_{eff}/j\omega$，其中 $K_{eff} = b/T$ 是等效刚度。

物理含义：波变量系统在低频下将刚墙渲染为等效刚度 $K_{eff} = b/T$。延迟 $T$ 越大或波阻抗 $b$ 越小，渲染刚度越低——操作者感受到的墙越"软"。这是波变量透明度的定量极限。

典型数值：$b = 2$ Ns/m, $T = 100$ ms → $K_{eff} = 20$ N/m。真实墙刚度可能为 $10^4$ N/m——渲染失真 500 倍。这就是为什么高延迟下操作者感觉"墙像橡胶"。

情况 3：自由空间 $Z_e = 0$

\[\Gamma_s = -1 \implies Z_{to} = b \cdot \frac{1 - e^{-2j\omega T}}{1 + e^{-2j\omega T}} = b \cdot j\tan(\omega T)\]

低频：$Z_{to} \approx jb\omega T = j\omega B_{eff}$，其中 $B_{eff} = bT$ 是等效阻尼。

物理含义：自由空间中操作者感受到额外的阻尼 $B_{eff} = bT$。这就是波变量的"粘滞感"——延迟和波阻抗的乘积决定了自由空间中的额外阻力。

频域对比表：

频率范围	$Z_{to}$（刚墙）	$Z_{to}$（自由空间）	透明度
$\omega \ll 1/T$	$K_{eff}/j\omega = b/(j\omega T)$	$j\omega B_{eff} = j\omega bT$	低频近似透明，但刚度/阻尼被延迟限制
$\omega = \pi/(4T)$	$b/j\tan(\pi/4) = b/j$	$jb\tan(\pi/4) = jb$	中频，$
$\omega = \pi/(2T)$	$b/j\tan(\pi/2) \to 0$	$jb\tan(\pi/2) \to \infty$	反共振/共振——透明度完全丧失

阶段小结：到这里我们完成了波阻抗 $b$ 对系统行为的完整分析——从时域（振铃、粘滞）到频域（传递阻抗、渲染刚度）。核心结论是：$b$ 的选择本质上是在"自由空间透明度"和"硬接触稳定性"之间做权衡，而最优权衡点取决于环境阻抗 $Z_e$。接下来我们讨论如何在实际工程中选择和自适应调整 $b$。

D6.5.5 经验值与自适应方案¶

经验值：

DOF 类型	推荐 $b$ 范围	依据
平动 (m/s)	$b \in [0.5, 5]$ Ns/m	接近人手操作阻抗量级
转动 (rad/s)	$b \in [0.05, 0.5]$ Nms/rad	接近手腕阻抗量级

自适应方案——在线估计环境刚度并匹配波阻抗：

\[b_{adaptive}(t) = \sqrt{K_e(t) \cdot M_m}\]

class AdaptiveWaveImpedance:
    def __init__(self, b_init=1.0, alpha=0.01, b_min=0.1, b_max=50.0):
        self.b = b_init
        self.alpha = alpha  # 低通滤波系数

    def update(self, f_e, v_s, M_m):
        """在线估计最优波阻抗"""
        if abs(v_s) > 0.001:  # 避免除零
            Z_e_est = abs(f_e / v_s)
            b_target = np.sqrt(Z_e_est * M_m)
            self.b += self.alpha * (b_target - self.b)  # 低通滤波
            self.b = np.clip(self.b, 0.1, 50.0)         # 限幅
        return self.b

注意：$b$ 的变化必须平滑（低通滤波），否则波变量的连续性被打破，产生能量脉冲。

⚠️ 常见陷阱¶

🧠 思维陷阱：认为"b 越大越稳定所以越好"
   新手想法："大 b → 更稳定 → 应该尽量大"
   实际上：b 过大引入严重粘滞感（"在蜂蜜中操作"），力反馈被压制
          b 的最优值取决于环境刚度，不是"越大越好"
   正确思维：b 是透明度-鲁棒性的调节旋钮

练习¶

[A 型 -- b 扫描] 对 $b = 0.1, 0.5, 1, 2, 5, 10, 50$，分别在硬墙环境中测试。绘制 (a) 力跟踪误差 (b) 振铃幅度。找到最优 $b$
[思考题] 如果环境在自由空间和刚墙之间快速切换（反复碰撞），固定 $b$ 和自适应 $b$ 哪个更好？

D6.6 时变时延下的无源性破坏与修复 ⭐⭐⭐¶

D6.6.1 破坏机制¶

实际网络的延迟 $T(t)$ 随网络状态变化。对正向波储能求导：

\[\dot{E}_u = \frac{1}{2}u_m^2(t) - \frac{1}{2}u_m^2(t-T_1)\underbrace{(1-\dot{T}_1)}_{\text{关键项}}\]

当 $\dot{T}_1 > 1$（延迟增长速率超过时间流逝速率）：

\[1 - \dot{T}_1 < 0 \implies -\frac{1}{2}u_m^2(t-T_1)(1-\dot{T}_1) > 0\]

额外正项→能量创生→通道变为主动系统→无源性破坏！

物理直觉：$\dot{T} > 1$ 意味着通道"压缩"信号——同一时段发出的多个包被压缩到更短时间内接收，等效于功率密度被放大。

D6.6.2 破坏机制的完整推导 ⭐⭐⭐¶

为理解时变延迟如何精确地破坏无源性，需要重新审视 4 节的证明在时变情况下的失效点。

Step 1：时变延迟下的通信关系

\[u_s(t) = u_m(t - T_1(t)) \quad \text{其中 } T_1(t) \text{ 是时变的}\]

Step 2：积分变量替换的微妙之处

\[\int_0^t u_s^2(\tau) d\tau = \int_0^t u_m^2(\tau - T_1(\tau)) d\tau\]

在常数时延情况下，令 $\sigma = \tau - T_1$ 可得 $d\sigma = d\tau$（因为 $T_1$ 是常数）。

但在时变情况下，$\sigma(\tau) = \tau - T_1(\tau)$，因此 $d\sigma = (1 - \dot{T}_1(\tau)) d\tau$。

\[\int_0^t u_m^2(\tau - T_1(\tau)) d\tau = \int_{\sigma(0)}^{\sigma(t)} \frac{u_m^2(\sigma)}{1 - \dot{T}_1(\tau(\sigma))} d\sigma\]

关键：当 $\dot{T}_1 > 0$（延迟增大），$1/(1-\dot{T}_1) > 1$——积分被**放大**！

当 $\dot{T}_1 > 1$，$1/(1-\dot{T}_1) < 0$——积分**变号**——这是灾难性的。

Step 3：能量创生的精确量化

通道储能变为：

\[E_{comm}(t) = \frac{1}{2}\int_{t-T_1(t)}^t u_m^2(\tau) d\tau + \frac{1}{2}\int_{t-T_2(t)}^t v_s^2(\tau) d\tau + E_{excess}(t)\]

其中 $E_{excess}$ 是时变延迟引入的额外项：

\[E_{excess}(t) = \frac{1}{2}\int_0^t u_m^2(\tau - T_1(\tau)) \cdot \frac{\dot{T}_1(\tau)}{1 - \dot{T}_1(\tau)} d\tau + \text{类似 } v_s \text{ 项}\]

当 $0 < \dot{T}_1 < 1$：$E_{excess} > 0$——通道产生了额外能量当 $\dot{T}_1 = 0$（常数时延）：$E_{excess} = 0$——退化为无源情况当 $\dot{T}_1 < 0$（延迟减小）：$E_{excess} < 0$——通道实际上**消耗**了能量

物理直觉：$\dot{T}_1 > 0$ 意味着通道在"压缩"信号包——同一秒内发出的包在接收端挤在一起到达，等效于瞬时功率被放大。$\dot{T}_1 > 1$ 意味着"压缩比"超过 1——包的到达顺序可能反转，对应物理上的因果性破坏。

D6.6.3 修复方案与网络卫生措施——完整推导与代码¶

方案 1：Gain Scheduling（Lozano-Chopra-Spong 2002）

推导：要消除 $E_{excess}$，需在接收端乘一个衰减因子 $\gamma$：

\[\tilde{u}_s(t) = \gamma(t) \cdot u_m(t - T_1(t))\]

经过分析，选 $\gamma(t) = \sqrt{1 - \dot{T}_1(t)}$（需要实时测量 $\dot{T}_1$），则：

\[\int_0^t \tilde{u}_s^2 d\tau = \int_0^t (1 - \dot{T}_1) u_m^2(\tau - T_1(\tau)) d\tau = \int_0^{t-T_1(t)} u_m^2(\sigma) d\sigma\]

恢复了常数时延情况下的形式！但实际中 $\dot{T}_1$ 无法精确实时测量，只能用上界 $\dot{T}_{max}$：

\[\tilde{u}_s(t) = \sqrt{1 - \dot{T}_{max}} \cdot u_m(t - T_1(t))\]

class GainSchedulingWave:
    """Gain Scheduling 时变延迟修复"""
    def __init__(self, b, T_dot_max=0.5):
        self.b = b
        self.gamma = np.sqrt(1 - T_dot_max)  # 固定衰减因子

    def encode_master(self, f_m, v_m):
        u_m = (f_m + self.b * v_m) / np.sqrt(2 * self.b)
        return u_m

    def decode_slave(self, u_s_received, v_s):
        u_s = self.gamma * u_s_received  # 衰减
        f_s = np.sqrt(2 * self.b) * u_s - self.b * v_s
        v_s_wave = u_s - np.sqrt(2 * self.b) * v_s
        return f_s, v_s_wave

方案 2：能量缓冲/能量罐（Franken-Stramigioli 2011）

双层架构——上层任意透明控制律，下层通过能量罐对输出力饱和缩放。

完整推导：

定义能量罐状态 $E_{tank}(k)$，初始 $E_{tank}(0) = E_0 > 0$。

上层控制律输出期望力 $f_{cmd}$。下层计算输出力 $f_{out}$：

令 $P_{cmd}(k)=f_{cmd}(k)\cdot v(k)$，并约定 $P_{cmd}>0$ 表示系统向外供能。只有向外供能才消耗能量罐：

\[\Delta E_{need}=\max(0,\;P_{cmd}(k)\Delta t)\]

若 $\Delta E_{need}$ 不超过罐中能量，或 $P_{cmd}\le 0$ 表示系统正在吸收能量：

\[f_{out}(k) = f_{cmd}(k)\]

否则按比例缩放：

\[f_{out}(k) = \frac{E_{tank}(k)}{\Delta E_{need}} \cdot f_{cmd}(k)\]

这里缩放的是力这一侧，输出功率随缩放系数线性变化。只有同时缩放一对共轭变量（例如力和速度都按同一比例缩放）时，功率才随缩放系数平方变化，才会使用平方根形式。

罐的更新：

\[E_{tank}(k+1) = \text{clip}\left(E_{tank}(k) - P_{out}(k)\Delta t,\;0,\;E_{max}\right),\quad P_{out}=f_{out}v\]

$P_{out}>0$ 时从罐中扣能量；$P_{out}<0$ 时说明外部对系统做功，罐被充能。不能用 $|f_{cmd}v\Delta t|$ 做消耗量，否则会把本该充能的耗散/吸收阶段也当成能量消耗。

无源性证明：$E_{tank}(k) \geq 0 \; \forall k$（因为输出能量不超过罐中能量），因此系统总储能 $\geq 0$。$\blacksquare$

class EnergyTank:
    """Franken-Stramigioli 2011 能量罐"""
    def __init__(self, E_init=0.5, E_max=2.0, dt=0.001):
        self.E_tank = E_init
        self.E_max = E_max
        self.dt = dt
        self.scale_history = []

    def regulate(self, f_cmd, v):
        """对力指令进行能量约束缩放"""
        P_cmd = f_cmd * v
        E_need = max(0.0, P_cmd * self.dt)

        if E_need <= self.E_tank:
            scale = 1.0      # 罐充足：完全透明
            f_out = f_cmd
        else:
            scale = self.E_tank / (E_need + 1e-15)
            f_out = scale * f_cmd  # 缩放保护

        # 更新罐：P_out>0 扣能量；P_out<0 代表吸收外部能量，给罐充能。
        P_out = f_out * v
        self.E_tank -= P_out * self.dt
        self.E_tank = np.clip(self.E_tank, 0, self.E_max)

        self.scale_history.append(scale)
        return f_out, scale

网络卫生措施：丢弃过期包

接收端同时收到多个包时只处理最新的，丢弃旧包。这样可以避免乱序包回放、控制指令倒退和位置积分重复，但它**不等价于** $\dot{T}\leq 1$，也不是严格的无源性修复。原因是：丢包改变了波积分和接收端重构轨迹，可能造成位置漂移或能量记账缺口；若接收端采用保持上一包、插值或补零，不同策略对应的能量效应也不同。

真正要修复时变时延/丢包导致的主动性，需要使用 gain scheduling、能量罐或 D07 的 TDPA，在能量层面显式约束输出。

class PacketDropHandler:
    """过期包丢弃策略"""
    def __init__(self):
        self.last_seq = -1
        self.last_timestamp = 0

    def process(self, packet):
        """只接受比上一次更新的包"""
        if packet.seq > self.last_seq:
            self.last_seq = packet.seq
            self.last_timestamp = packet.timestamp
            return packet.data, False  # 有效包
        else:
            return None, True  # 丢弃过期包

D6.6.4 三种方案的 MATLAB/Python 对比仿真 ⭐⭐¶

为了直观理解两类能量层修复和一种网络卫生措施的差异，给出统一的仿真框架：

class TimeVaryingDelayComparison:
    """时变延迟下能量层修复与网络卫生措施的统一对比框架"""

    def __init__(self, b=2.0, dt=0.001):
        self.b = b
        self.dt = dt

    def simulate(self, T_total=5.0, T_base=0.1, T_jitter_amp=0.04,
                 T_jitter_freq=0.5, method='none'):
        """
        统一仿真接口
        Args:
            method: 'none'/'gain_sched'/'energy_tank'/'packet_drop'
        """
        N = int(T_total / self.dt)
        sqrt2b = np.sqrt(2 * self.b)

        # 状态
        xm, vm, xs, vs = 0, 0, 0, 0
        Mm, Bm, Ms, Bs = 0.5, 2.0, 1.0, 1.0
        E_port_obs = 0.0
        E_tank = 0.5  # 能量罐初始值

        results = {'t': [], 'xm': [], 'xs': [], 'E_port_obs': [],
                   'delay': [], 'intervention': []}

        # 延迟缓冲（环形）
        max_delay_samples = int(0.2 / self.dt)
        um_buf = np.zeros(max_delay_samples)
        vs_buf = np.zeros(max_delay_samples)

        for k in range(N):
            t = k * self.dt

            # 时变延迟
            T_delay = T_base + T_jitter_amp * np.sin(2 * np.pi * T_jitter_freq * t)
            T_delay = max(0.01, T_delay)
            N_delay = int(T_delay / self.dt)
            N_delay = min(N_delay, max_delay_samples - 1)

            # 人手力
            fh = 5.0 * np.sin(2 * np.pi * 0.5 * t) if t < 3 else 0

            # 环境力（虚拟墙 x=0.05）
            fe = max(0, 10000 * (xs - 0.05) + 10 * vs) if xs > 0.05 else 0

            # === Master 端编码 ===
            fm_port = fh - Bm * vm
            um = (fm_port + self.b * vm) / sqrt2b

            # === 从缓冲读取延迟信号 ===
            read_idx = (k - N_delay) % max_delay_samples
            um_delayed = um_buf[read_idx]
            vs_delayed = vs_buf[read_idx]

            intervention = 0.0

            # === 应用修复方案 ===
            if method == 'gain_sched':
                T_dot_est = T_jitter_amp * 2 * np.pi * T_jitter_freq
                gamma = np.sqrt(max(0, 1 - abs(T_dot_est)))
                um_delayed *= gamma
                vs_delayed *= gamma
                intervention = 1 - gamma

            elif method == 'energy_tank':
                fs_cmd = sqrt2b * um_delayed - self.b * vs
                P_cmd = fs_cmd * vs
                E_need = max(0.0, P_cmd * self.dt)
                if E_need <= E_tank:
                    scale = 1.0
                else:
                    scale = E_tank / (E_need + 1e-15)
                fs_out = scale * fs_cmd
                um_delayed = (fs_out + self.b * vs) / sqrt2b
                E_tank -= fs_out * vs * self.dt
                E_tank += max(0, fm_port * vm * self.dt * 0.5)
                E_tank = max(0, min(2.0, E_tank))
                intervention = 1 - scale

            elif method == 'packet_drop':
                # 简化：如果延迟增长率 > 1 则丢弃
                if k > 0 and N_delay > results['delay'][-1] / self.dt + 1:
                    um_delayed = um_buf[(read_idx + 1) % max_delay_samples]
                    intervention = 1.0

            # === Slave 端解码 ===
            fs = sqrt2b * um_delayed - self.b * vs
            a_s = (fs - fe - Bs * vs) / Ms
            vs += a_s * self.dt
            xs += vs * self.dt

            vs_wave = (fs - fe - self.b * vs) / sqrt2b

            # === Master 端解码 ===
            fm_ctrl = sqrt2b * vs_delayed - self.b * vm
            am = (fh + fm_ctrl - Bm * vm) / Mm
            vm += am * self.dt
            xm += vm * self.dt

            # === 写入缓冲 ===
            um_buf[k % max_delay_samples] = um
            vs_buf[k % max_delay_samples] = vs_wave

            # === 端口能量观测 ===
            # 这是两端口功率积分，用于观察系统是否在端口上透支能量；
            # 不要命名为 E_comm，E_comm 专指波域延迟线内的非负管线储能。
            E_port_obs += (fm_port * vm + (fs - fe) * vs) * self.dt

            results['t'].append(t)
            results['xm'].append(xm)
            results['xs'].append(xs)
            results['E_port_obs'].append(E_port_obs)
            results['delay'].append(T_delay)
            results['intervention'].append(intervention)

        return results

# === 运行对比 ===
def run_comparison():
    sim = TimeVaryingDelayComparison(b=2.0)
    methods = ['none', 'gain_sched', 'energy_tank', 'packet_drop']
    labels = ['无保护', 'Gain Scheduling', '能量罐', '丢弃过期包']

    fig, axes = plt.subplots(4, 1, figsize=(12, 16))
    for method, label in zip(methods, labels):
        r = sim.simulate(method=method)
        axes[0].plot(r['t'], r['xm'], label=f'{label} (master)')
        axes[1].plot(r['t'], r['xs'], label=f'{label} (slave)')
        axes[2].plot(r['t'], r['E_port_obs'], label=label)
        axes[3].plot(r['t'], r['intervention'], label=label)

    for ax, title in zip(axes, ['Master 位置', 'Slave 位置', '端口观测能量', '介入程度']):
        ax.set_title(title)
        ax.legend()
        ax.grid(True)
    plt.tight_layout()
    plt.savefig('time_varying_delay_comparison.png', dpi=150)

D6.6.5 三种方案的深度分析与工程选型¶

Gain Scheduling 的理论局限：

Gain scheduling 的衰减因子 $\gamma = \sqrt{1 - \dot{T}_{max}}$ 需要**先验知道**延迟变化率的上界 $\dot{T}_{max}$。在实际网络中，$\dot{T}_{max}$ 难以精确估计：

WiFi 环境中，信道竞争导致的延迟突增（从 5ms 突然跳到 50ms）使 $\dot{T}$ 瞬时很大
蜂窝网络切换（handover）时延迟可能在数毫秒内从 10ms 跳到 200ms

如果 $\dot{T}_{max}$ 估计过小（$\gamma$ 不够小），无法完全修复能量创生；如果估计过大（$\gamma$ 太小），正常操作时也大幅衰减——透明度严重下降。

能量罐的参数设计深层分析：

能量罐（Franken 2011）有三个关键参数：初始能量 $E_0$、最大容量 $E_{max}$、充能速率限制 $\Delta E_{charge}$。参数之间存在耦合约束：

\[E_0 \geq P_{max,output} \cdot T_{startup}\]

其中 $P_{max,output}$ 是 slave 端的最大输出功率（典型 1-5 W），$T_{startup}$ 是启动到 master 端能量开始回流的时间（约等于往返延迟 $T_{round}$）。

如果 $E_0$ 太小，启动阶段 slave "冻结"——操作者推 master 但 slave 不动（罐空了还没充上）。如果 $E_0$ 太大，系统有过多的"预支信用"——理论上罐中能量可以一次性释放，产生大力冲击。因此 $E_0$ 不应远超 $P_{max,output} \cdot T_{round}$。

丢弃过期包的副作用分析：

丢弃乱序或过期包看似简单，但对波积分（D6.7 节）有严重影响。每丢弃一个包，波积分 $U_s(t)$ 就"跳过"了一个采样值——等价于在积分中引入了一个阶跃误差。这些误差累积导致位置漂移：

\[\Delta x_{drift,per\_drop} \approx \frac{|u_m[k]| \cdot T_s}{\sqrt{2b}}\]

在 5% 丢包率、$|u_m| \approx 5$ $\sqrt{\text{W}}$、$T_s = 1$ ms、$b = 2$ Ns/m 条件下：

\[\Delta x_{drift,per\_drop} \approx \frac{5 \times 0.001}{2} = 2.5 \text{ mm/drop}\]

50 Hz 采样下每秒约 2.5 个丢包 → 每秒漂移约 6.25 mm → 1 分钟漂移约 375 mm——完全不可接受。

因此丢弃过期包**必须配合 wave integral 修复**（D6.7 节），否则位置漂移将使系统不可用。

工程选型决策表：

方案	先验信息	透明度	复杂度	典型案例	推荐场景
Gain Scheduling	需要 $\dot{T}_{max}$	中（持续衰减）	低	已知延迟范围	延迟变化率可预测的专用链路
能量罐	不需要	高（按需介入）	中	DLR KONTUR-2	通用场景——推荐默认方案
丢弃过期包	不需要	中（数据丢失）	最低	简单 UDP 系统的网络卫生；不提供无源性证明	仅作为网络层预处理，必须配合上述方案之一
Gain Sched. + 能量罐	需要 $\dot{T}_{max}$	高	中高	航天遥操作	安全关键 + 高透明度
能量罐 + TDPA	不需要	最高	高	工业双层架构	全面保护——D07 详述

反事实推理：如果只用丢弃过期包而不做任何能量层修复会怎样？在时变延迟从 50ms 突增到 150ms 的场景中：(1) 突增期间约 30% 的包被标记为乱序并丢弃——力/速度信号出现 30% 的"空洞"；(2) slave 在空洞期间保持旧值或插值——产生与实际操作不匹配的力输出；(3) 不匹配的力在操作者端被感知为"卡顿"或"弹跳"；(4) 更关键的是，保持旧值或插值本身可能注入能量（旧力与新速度的乘积可能为负）——系统仍然面临能量创生风险。丢弃过期包只是减少了乱序问题，但没有从能量层面保证无源性。

⚠️ 常见陷阱¶

⚠️ 编程陷阱：能量罐初始值设为零
   错误做法：E_tank(0) = 0
   现象：启动时任何力输出都被缩放为零→slave 不动
   根本原因：罐空时无能量可输出
   正确做法：E_tank(0) = E_init > 0（典型 0.1-1.0 J），或启动阶段开环充能

练习¶

[A 型 -- 时变时延] 在波变量系统中加入 $T(t) = 100 + 50\sin(2\pi t/5)$ ms。观察是否不稳定。实现 gain scheduling。对比有/无修复的 $E_{comm}(t)$
[A 型 -- 丢包测试] 在常数时延中引入 5% 丢包。记录 $|x_m - x_s|$。实现 wave integral 修复。验证漂移消除

D6.7 位置漂移问题与 Wave Integral ⭐⭐¶

D6.7.1 漂移的来源¶

波变量传输**速度**信息（编码在波中），位置需接收端积分得到。多种因素导致积分漂移：

来源	机制	量级
初始化	$x_m(0) \neq x_s(0)$	固定偏移
数值积分	累积舍入误差	随时间线性增长
丢包	速度采样丢失	随丢包率增加
$b$ 切换	自适应 $b$ 变化瞬间不连续	脉冲偏移

D6.7.2 Wave Integral 修复——完整推导与实现（Niemeyer 1996/2004） ⭐⭐⭐¶

推导动机：波变量传输的是力和速度的混合信号。slave 端从波变量恢复速度后积分得到位置。但积分是**不稳定的运算**——任何微小的速度偏差都会随时间累积为位置漂移。

Step 1：定义波积分

\[U_m(t) = \int_0^t u_m(\tau) d\tau, \quad V_s(t) = \int_0^t v_s(\tau) d\tau\]

\[U_s(t) = \int_0^t u_s(\tau) d\tau, \quad V_m(t) = \int_0^t v_m(\tau) d\tau\]

Step 2：通信关系在积分域中的传递

由 $u_s(t) = u_m(t-T_1)$，两边积分：

\[U_s(t) = \int_0^t u_m(\tau - T_1) d\tau = \int_{-T_1}^{t-T_1} u_m(\sigma) d\sigma = U_m(t-T_1) + C_1\]

其中 $C_1$ 是由初始条件决定的常数（假设因果性，$C_1 = 0$）。

类似地：$V_m(t) = V_s(t - T_2)$

Step 3：从波积分恢复位置

回忆速度的波变量定义：$\dot{x}_s = (u_s - v_s)/\sqrt{2b}$

积分：$x_s(t) = \int_0^t \frac{u_s - v_s}{\sqrt{2b}} d\tau = \frac{U_s(t) - V_s(t)}{\sqrt{2b}} + x_s(0)$

但 slave 端只知道 $U_s(t)$（从通信接收）和 $V_s(t)$（本地计算）。定义"位置指令"：

\[\boxed{x_s^{cmd}(t) = \frac{U_s(t) - V_s(t)}{\sqrt{2b}} = \frac{U_m(t-T_1) - V_s(t)}{\sqrt{2b}}}\]

如果一切完美（无数值误差、无丢包），$x_s^{cmd} = x_s$。实际中两者会漂移——用弱弹簧闭环消除漂移：

\[f_{correction} = K_{drift}(x_s^{cmd} - x_s)\]

Step 4：$K_{drift}$ 的选择原则

$K_{drift}$ 典型 10-50 N/m——远小于环境刚度（通常 $K_e > 1000$ N/m），不显著影响透明度但消除长期漂移。

无源性保持证明：弱弹簧储能 $V_{spring} = \frac{1}{2}K_{drift}(x_s^{cmd} - x_s)^2 \geq 0$。弹簧是被动元件——能量只储存不创生。$f_{correction} \cdot \dot{x}_s = K_{drift}(x_s^{cmd} - x_s)\dot{x}_s$。当 $\dot{x}_s$ 与 $(x_s^{cmd} - x_s)$ 同向时，弹簧储能减少（释放能量加速追踪）；反向时储能增加（吸收能量减速）。无论哪种情况，弹簧都不创生能量。$\blacksquare$

但 $K_{drift}$ 不能太大——从 D05 的 Z-width 约束：$K_{drift} < 2b_{local}/T_s$。

完整 Python 实现：

class WaveIntegralTeleoperation:
    """波积分法完整实现——解决位置漂移"""
    def __init__(self, b=1.0, K_drift=20.0, dt=0.001):
        self.b = b
        self.K_drift = K_drift
        self.dt = dt

        # Master 侧状态
        self.Um = 0.0       # 波积分（master 正向波）
        self.Vm_integral = 0.0  # 波积分（master 反向波）

        # Slave 侧状态
        self.Us = 0.0       # 波积分（slave 接收的正向波）
        self.Vs = 0.0       # 波积分（slave 反向波）

        # 位置状态
        self.x_s_cmd = 0.0
        self.x_s = 0.0

        # 能量监测：E_comm_pipe 专指波域延迟线储能；弹簧单独记账。
        self.E_comm_pipe = 0.0
        self.E_spring = 0.0

    def master_encode(self, f_m, v_m):
        """Master 端编码 + 波积分更新"""
        sqrt2b = np.sqrt(2 * self.b)
        u_m = (f_m + self.b * v_m) / sqrt2b
        v_m_wave = (f_m - self.b * v_m) / sqrt2b

        # 更新波积分
        self.Um += u_m * self.dt
        self.Vm_integral += v_m_wave * self.dt

        return u_m, self.Um  # 同时发送瞬时波和波积分

    def slave_decode(self, u_s_received, Um_received, v_s_actual):
        """Slave 端解码 + 位置漂移修正"""
        sqrt2b = np.sqrt(2 * self.b)

        # 从波变量恢复力
        f_s_wave = sqrt2b * u_s_received - self.b * v_s_actual

        # 计算反向波
        v_s_wave = u_s_received - sqrt2b * v_s_actual
        self.Vs += v_s_wave * self.dt

        # 从波积分恢复位置指令
        self.x_s_cmd = (Um_received - self.Vs) / sqrt2b

        # 弱弹簧漂移修正
        f_drift = self.K_drift * (self.x_s_cmd - self.x_s)

        # 总控制力
        f_s_total = f_s_wave + f_drift

        # 更新能量
        self.E_spring = 0.5 * self.K_drift * (self.x_s_cmd - self.x_s)**2

        return f_s_total, v_s_wave, self.Vs

    def update_slave_position(self, x_s_new):
        """更新 slave 实际位置（由外部动力学积分提供）"""
        self.x_s = x_s_new

Wave Integral 的工程实现要点：

积分值必须随波变量一起传输：仅传输瞬时波 $u_m[k]$ 是不够的——接收端需要 $U_m[k]$（发送端的波积分）来计算位置指令 $x_s^{cmd}$。包格式应为 $[\text{seq}, \text{timestamp}, u_m, U_m]$，4 个字段共 28 字节
积分精度要求 double：$U_m$ 是随时间单调增长的累积量。在 1 kHz 采样、$|u_m| \approx 5$ $\sqrt{\text{W}}$ 条件下，1 小时后 $U_m \approx 5 \times 3600 \times 1000 = 1.8 \times 10^7$。float32 的精度在 $10^7$ 量级约为 1（只保留 7 位有效数字）——这意味着微小的波变量增量 $u_m \cdot T_s = 0.005$ 会被舍入为 0，导致积分"冻结"。double64 在 $10^7$ 量级精度为 $10^{-8}$，足够 $10^5$ 小时运行
弱弹簧 $K_{drift}$ 不能太大：$K_{drift}$ 增大可以加快漂移修正，但过大时弹簧力会主导 slave 动力学，破坏波变量的透明度。经验上限：$K_{drift} < \min(b/T, K_e/10)$——不超过波阻抗/延迟比，且不超过环境刚度的 10%
弱弹簧在自由空间中的副作用：在自由空间（$f_e = 0$）中，弱弹簧将 slave "拉"向位置指令 $x_s^{cmd}$。如果 master 停止移动，slave 会被弹簧缓慢拉到 $x_s^{cmd}$ 附近——这是一个阻尼振荡过程，时间常数 $\tau \approx M_s / B_{eff}$。操作者可能感受到 slave "飘"回来——这在某些场景（如精密定位后松手）是不可接受的。解决方案：在 master 停止后（$|\dot{x}_m| < \epsilon$ 持续 $> T_{hold}$）降低 $K_{drift}$ 到零，让 slave 保持当前位置

与不使用 Wave Integral 的对比：

测试条件	无修复漂移(mm/min)	Wave Integral 修复后	备注
常数延迟 100ms, 无丢包	0.5-2	<0.01	漂移来自数值积分误差
常数延迟 100ms, 1% 丢包	5-20	<0.1	丢包导致积分跳步
常数延迟 100ms, 5% 丢包	20-100	<1.0	高丢包率下弱弹簧持续工作
时变延迟 50-150ms, 无丢包	1-5	<0.05	延迟变化引入微小积分误差
时变延迟 + 3% 丢包	10-50	<0.5	最恶劣的实际场景

D6.7.3 位置漂移问题的深层数学分析 ⭐⭐⭐¶

位置漂移的根本原因可以从信号处理的角度理解。波变量传输的是**速度信息**（编码在波中），位置需要在接收端通过积分恢复。积分运算在信号处理中是一个**不稳定滤波器**——其传递函数 $H(s) = 1/s$ 在零频率处有一个极点。

直流偏置的灾难性影响：

如果波变量中有任何微小的直流偏置 $\delta$（来自量化噪声、传感器零偏、舍入误差），积分后产生的位置误差是：

\[\Delta x(t) = \frac{\delta}{\sqrt{2b}} \cdot t\]

线性增长——即使 $\delta$ 只有 $10^{-5}$ $\sqrt{\text{W}}$，经过 1 小时（3600 秒）后位置漂移达到：

\[\Delta x(3600) = \frac{10^{-5}}{\sqrt{2 \times 2}} \times 3600 = 0.018 \text{ m} = 18 \text{ mm}\]

这已经是可感知的偏差。Wave integral 的弱弹簧等效于给积分器加了一个**低频反馈**——弹簧力产生一个与漂移成正比的修正速度，将积分器从纯积分 $1/s$ 改为 $1/(s + K_{drift}/B_{eff})$，后者是一阶低通滤波器而非不稳定积分器。

跨领域类比：波积分的漂移修复与 SLAM 中的闭环修正在精神上相似。SLAM 中纯里程计积分会因累积误差漂移——闭环检测提供"约束"将漂移拉回。波积分中传输的 $U_m$ 提供"参考位置约束"，弱弹簧将积分漂移拉回。两者都是通过"外部参考 + 弱反馈"修复积分器的固有不稳定性。

D6.8 采样-保持效应与离散实现 ⭐⭐⭐¶

D6.8.1 从连续到离散的鸿沟¶

前述证明在连续时间下完成。实际系统是离散的——波变量每个采样周期 $T_s$ 计算一次，ZOH 保持到下一周期。

连续时间无源性不自动保证离散时间无源性。回顾 D05 的 Z-width：ZOH 引入额外的采样相关能量创生。

离散波变量的额外约束：

\[T_s \text{（采样周期）必须足够小，使 ZOH 效应不破坏被动性}\]

这与 D05 的 $K_{max} = 2b/T_s$ 约束一致——采样频率决定了可渲染的最大刚度。

D6.8.2 离散实现的无源性分析 ⭐⭐⭐¶

连续时间证明在离散实现中不自动成立。这一节严格分析离散化带来的额外约束。

离散波变量定义：

\[u_m[k] = \frac{f_m[k] + b \dot{x}_m[k]}{\sqrt{2b}}, \quad v_m[k] = \frac{f_m[k] - b \dot{x}_m[k]}{\sqrt{2b}}\]

离散功率恒等式：

\[f_m[k] \cdot \dot{x}_m[k] = \frac{1}{2}(u_m[k]^2 - v_m[k]^2)\]

这在离散时间中**精确成立**（纯代数恒等式，不涉及积分）。

离散通道储能：

\[E_{comm}[k] = \frac{1}{2}\sum_{i=k-N}^{k-1} u_m[i]^2 \cdot T_s + \frac{1}{2}\sum_{i=k-M}^{k-1} v_s[i]^2 \cdot T_s\]

其中 $N = T_1/T_s$, $M = T_2/T_s$（延迟的采样数）。

$E_{comm}[k] \geq 0$ 仍然成立——因为所有被加项都是非负的。

这里的 $E_{comm}$ 专指**波域延迟线里正在传输的管线储能**，天然非负。不要把它和 TDPA/PO 常用的端口观测能量混用。若代码在累计 $\sum f v \Delta t$ 来观察端口是否透支，应命名为 E_obs、E_port_obs 或 E_obs_total，而不是 E_comm。

但 ZOH 引入额外能量创生：

ZOH 使得波变量在两个采样点之间保持恒定：$u_m(t) = u_m[k]$ for $t \in [kT_s, (k+1)T_s)$。

在此期间，实际的力和速度在变化，但波变量保持旧值。这导致：

\[\int_{kT_s}^{(k+1)T_s} f_m(t) \dot{x}_m(t) dt \neq \frac{1}{2}(u_m[k]^2 - v_m[k]^2) T_s\]

差值就是 ZOH 引入的"额外能量"——与 D05 的虚拟墙分析本质相同。

离散无源性的额外条件（综合 D05 Z-width 约束）：

\[\text{功率样本必须来自同一采样时刻的共轭端口变量： } f[k] \leftrightarrow v[k]\]

\[b \geq \frac{K_{max} T_s}{2} \quad \text{（波阻抗不低于 Z-width 约束）}\]

\[T_s \leq \frac{2\pi}{10\omega_{max}} \quad \text{（每个最高操作周期至少约 10 个样本）}\]

若采样周期有抖动，应使用实际 $\Delta t_k$ 记账；若力和速度来自不同线程或不同 frame，必须先时间对齐和坐标对齐，否则 $f[k]v[k]$ 不再是同一端口功率。注意 $T_s \ll T_{delay}$ 不是离散无源性的数学条件；常数延迟的波域证明不要求采样周期小于延迟，只要求离散实现本身没有通过 ZOH、插值、时戳错配或控制器带宽引入额外主动性。

工程实践：1 kHz 采样率对 1-10 Hz 操作带宽和 10-100 ms 通信延迟通常足够。50 Hz（ALOHA）对高保真力反馈和 TDPA/波变量功率记账都偏低，主要问题是端口功率分辨率、Z-width 和控制带宽不足，而不是“采样周期没有远小于延迟”。

D6.8.3 完整仿真代码——Python 端到端实现 ⭐⭐¶

import numpy as np
import matplotlib.pyplot as plt

class WaveVariableTeleop1DOF:
    """1-DOF 波变量遥操作完整仿真"""

    def __init__(self, b=1.0, dt=0.001,
                 Mm=0.5, Bm=2.0, Ms=1.0, Bs=1.0,
                 T_delay=0.1, K_drift=20.0):
        # 波阻抗
        self.b = b
        self.dt = dt

        # Master 动力学
        self.Mm, self.Bm = Mm, Bm
        self.xm, self.vm = 0.0, 0.0

        # Slave 动力学
        self.Ms, self.Bs = Ms, Bs
        self.xs, self.vs = 0.0, 0.0

        # 延迟缓冲
        self.N_delay = int(T_delay / dt)
        self.um_buffer = np.zeros(self.N_delay)
        self.Um_buffer = np.zeros(self.N_delay)
        self.vs_buffer = np.zeros(self.N_delay)
        self.Vs_buffer = np.zeros(self.N_delay)
        self.buf_idx = 0

        # 波积分
        self.Um, self.Vs = 0.0, 0.0
        self.Um_remote, self.Vs_remote = 0.0, 0.0
        self.K_drift = K_drift

        # 能量监测
        self.E_comm_pipe = 0.0  # 波域延迟线储能；本例未显式重算
        self.E_obs_m, self.E_obs_s = 0.0, 0.0

        # 历史记录
        self.history = {'t': [], 'xm': [], 'xs': [], 'fm': [],
                        'fs': [], 'E_obs_total': [], 'vm': [], 'vs': []}

    def step(self, f_human, Ze_func):
        """
        单步仿真
        Args:
            f_human: 人手施力 (N)
            Ze_func: 环境力函数 f_e = Ze_func(xs, vs)
        """
        sqrt2b = np.sqrt(2 * self.b)

        # === 环境力 ===
        f_env = Ze_func(self.xs, self.vs)

        # === Master 端 ===
        # Master 从延迟缓冲读取 slave 的反向波
        vs_delayed = self.vs_buffer[self.buf_idx]
        Vs_delayed = self.Vs_buffer[self.buf_idx]

        # 从反向波恢复 master 控制力
        f_m_ctrl = sqrt2b * vs_delayed - self.b * self.vm

        # 波积分位置修正（master 端）
        x_m_cmd = (self.Um - Vs_delayed) / sqrt2b  # 本地用

        # Master 动力学
        am = (f_human + f_m_ctrl - self.Bm * self.vm) / self.Mm
        self.vm += am * self.dt
        self.xm += self.vm * self.dt

        # Master 编码正向波
        f_m_port = f_human + f_m_ctrl
        um = (f_m_port + self.b * self.vm) / sqrt2b
        self.Um += um * self.dt

        # === Slave 端 ===
        # Slave 从延迟缓冲读取 master 的正向波
        um_delayed = self.um_buffer[self.buf_idx]
        Um_delayed = self.Um_buffer[self.buf_idx]

        # 从正向波恢复 slave 控制力
        f_s_wave = sqrt2b * um_delayed - self.b * self.vs

        # 波积分位置修正
        xs_cmd = (Um_delayed - self.Vs) / sqrt2b
        f_drift = self.K_drift * (xs_cmd - self.xs)

        f_s_total = f_s_wave + f_drift

        # Slave 动力学
        a_s = (f_s_total - f_env - self.Bs * self.vs) / self.Ms
        self.vs += a_s * self.dt
        self.xs += self.vs * self.dt

        # Slave 编码反向波
        f_s_port = f_s_total - f_env
        vs_wave = (f_s_port - self.b * self.vs) / sqrt2b
        self.Vs += vs_wave * self.dt

        # === 更新延迟缓冲 ===
        self.um_buffer[self.buf_idx] = um
        self.Um_buffer[self.buf_idx] = self.Um
        self.vs_buffer[self.buf_idx] = vs_wave
        self.Vs_buffer[self.buf_idx] = self.Vs
        self.buf_idx = (self.buf_idx + 1) % self.N_delay

        # === 能量监测 ===
        self.E_obs_m += f_m_port * self.vm * self.dt
        self.E_obs_s += f_s_port * self.vs * self.dt

        # 记录
        t = len(self.history['t']) * self.dt
        self.history['t'].append(t)
        self.history['xm'].append(self.xm)
        self.history['xs'].append(self.xs)
        self.history['vm'].append(self.vm)
        self.history['vs'].append(self.vs)
        self.history['E_obs_total'].append(self.E_obs_m + self.E_obs_s)

# === 运行示例 ===
def demo_wave_variable():
    """波变量遥操作演示：自由空间 + 硬墙碰撞"""
    sim = WaveVariableTeleop1DOF(b=2.0, T_delay=0.1)

    def environment(xs, vs):
        """虚拟墙在 x=0.05"""
        if xs > 0.05:
            return 10000 * (xs - 0.05) + 10 * vs  # 刚墙+阻尼
        return 0.0

    for i in range(10000):  # 10 秒仿真
        t = i * 0.001
        # 人手力：正弦推 → 碰墙 → 释放
        f_human = 5.0 * np.sin(2 * np.pi * 0.5 * t) if t < 5 else 0.0
        sim.step(f_human, environment)

    return sim.history

D6.8.4 与 TDPA (D07) 的统一能量框架 ⭐⭐⭐¶

波变量（D06）和 TDPA（D07）看似是两种独立的方法，但它们可以统一在一个**能量框架**中理解。

统一视角：遥操作系统的能量流图

能量流图（统一框架）
══════════════════════════════════════════════════════

人手 ──P_h──→ [Master] ──P_m→comm──→ [Channel] ──P_comm→s──→ [Slave] ──P_s→e──→ 环境
                 ↑                        ↑                      ↑
            V_m(储能)              E_comm(管线储能)          V_s(储能)
                 ↑                        ↑                      ↑
           波变量编码              纯延迟(波域无源)          波变量解码
                 ↑                        ↑                      ↑
           TDPA PO/PC              能量监测(冗余)           TDPA PO/PC

三层无源性保证：

层	保证方式	保证范围	失效场景
结构层	波变量变换	通信通道无源	时变延迟 $\dot{T}>1$
修复层	Gain scheduling / 能量罐	时变延迟下通道无源	极端丢包
安全网	TDPA PO/PC	被监测端口无源；要求 PC 能实际修改力或速度参考来耗散能量	未测到的能量通道、执行器饱和、无速度/力接口、采样抖动过大、主动操作者/策略注入能量

工程建议：

低延迟+稳定网络（LAN, 5G URLLC）：只需 TDPA 安全网即可，不需要波变量
中延迟+轻抖动（WiFi 6）：波变量 + TDPA 安全网
高延迟+重抖动（4G/互联网）：波变量 + 能量罐 + TDPA，三层全开
极高延迟（卫星/深空）：放弃 bilateral，转向 model-mediated 或 supervisory control

"不是 X 而是 Y"纠正：波变量和 TDPA 不是竞争关系（"用了一个就不需要另一个"），而是**互补的深度防御**。波变量在结构层保证通道无源（预防），TDPA 在运行时保证被监测端口不透支能量（纠正），前提是控制器确实有力/速度参考的耗散权限。两层独立存在，才能覆盖更多工程故障。

D6.8.5 工程实现注意事项¶

注意事项	要求	后果
采样同步	Master/slave 频率相同或整数比	不同步→功率恒等式不精确
时间戳	每个波变量包带时间戳	无时间戳→无法正确排序恢复
丢包检测	序列号检测丢包	未检测→位置漂移
数值精度	使用 double 而非 float	float 精度在长时间积分中不够
包格式	$[seq, timestamp, u, U_{integral}]$	缺少积分值→无法做 wave integral 修复
UDP 优先	实时通信用 UDP 不用 TCP	TCP 重传导致额外延迟抖动
抖动缓冲	接收端维护小缓冲(2-5 包)平滑抖动	无缓冲→包到达顺序不一致

D6.9 前沿工作与开放问题 ⭐⭐⭐¶

D6.9.1 DLR KONTUR-2 空间遥操作¶

2015-2016 年 ISS 实验——宇航员通过 S-band 遥控地面臂，10-30 ms 时延，4 通道 + Franken 能量罐。这是波变量/TDPA 技术的最高级别工程验证。

KONTUR-2 技术细节：

参数	值	来源
Master	DLR joystick (2-DOF 力反馈)	定制硬件
Slave	DLR LWR-III (7-DOF)	地面实验室
控制频率	1 kHz	两端同步
通信链路	ISS S-band → 地面站	双向
延迟范围	10-30 ms (S-band) / 100-800 ms (互联网)	实测
无源性保证	波变量 + Franken 能量罐	双层架构
波阻抗	$b = 3$ Ns/m (自适应)	在线估计
能量罐	$E_0 = 1.0$ J, $E_{max} = 5.0$ J	经验参数

关键实验结果：同一套参数（$b, E_0, E_{max}$）在 S-band（10-30 ms）和互联网（100-800 ms）两种链路下都保持稳定——证明了双层架构对延迟变化的极强鲁棒性。

这一结果的工程意义：不需要根据延迟大小调参。只要底层框架正确（波变量+能量罐），系统可以自动适应延迟从 10 ms 到 800 ms 的 80 倍变化。

D6.9.2 不使用散射变换的替代方案¶

Chopra-Spong-Lozano (2008) 提出了 OSP (Output Strictly Passive) + Lyapunov-Krasovskii 泛函方案——直接传力/速度，不做波变换，但通过 Lyapunov 函数保证稳定性。

OSP 方案的核心思想：

在 master/slave 两端各设计一个 OSP 控制器，使得端口满足 Output Strictly Passive 条件：

\[\int_0^t y(\tau) u(\tau) d\tau \geq \rho \int_0^t \|y(\tau)\|^2 d\tau + \beta\]

其中 $\rho > 0$ 是严格无源性余量，$\beta$ 是初始储能常数。

然后用 Lyapunov-Krasovskii 泛函处理延迟：

\[V_{LK} = V_m + V_s + \int_{t-T_1}^t \|y_m(\tau)\|^2 d\tau + \int_{t-T_2}^t \|y_s(\tau)\|^2 d\tau\]

严格无源性余量 $\rho$ 用来"抵消"延迟积分项——只要 $\rho$ 足够大（取决于 $T_1 + T_2$），$\dot{V}_{LK} \leq 0$。

与波变量的关系：Nuno et al. (2011) 证明了波变量方案可以被重新解释为 OSP 方案的特殊情况——波变量选择了一种特定的 OSP 控制器形式使得 $\rho$ 与延迟无关。这就是为什么波变量的无源性证明中延迟 $T$ 不出现的深层原因。

Nuno et al. (2011) 用统一的 Lyapunov-Krasovskii 框架重新证明了波变量、OSP 和直接被动设计三大流派——这是领域的教学最佳参考。

三大流派的统一视角：

流派	核心思想	延迟处理方式	先验信息	代表论文
散射/波变量	改变信号表示使通道天然无源	延迟不出现在无源条件中	需要 $b$	Anderson-Spong 1989
OSP + Lyapunov-Krasovskii	严格被动余量 $\rho$ 抵消延迟	$\rho$ 取决于 $T_1 + T_2$	需要 $\rho$ 和延迟上界	Chopra-Spong-Lozano 2008
直接被动设计	控制器本身设计为被动	依赖系统特定的 Lyapunov 函数	需要系统模型	Lee-Li 2005

波变量为什么最优雅：波变量的关键优势是 $T$ 不出现在无源条件中——$E_{comm}(t) \geq 0$ 对任意 $T \geq 0$ 成立。OSP 方案需要 $\rho > f(T_1 + T_2)$——如果延迟增大，$\rho$ 必须增大，这意味着更大的阻尼（更低的透明度）。波变量通过信号域变换将"延迟适应性"内建到系统中，不需要显式依赖 $T$。

但 OSP 的优势在于：它不要求改变通信协议——力和速度直接传输，接收端不需要做波变换和逆变换。这在已有通信基础设施不能修改的场景中（如在 legacy 系统上加装安全层）更实用。

Nuno 2011 的教学价值：该论文证明了当 OSP 控制器选择特定形式 $f_c = -\rho v + f_{nominal}$ 且 $\rho = b/2$ 时，系统在 Lyapunov-Krasovskii 分析下与波变量方案**数学等价**——它们产生相同的闭环行为。这揭示了波变量并非"魔法"——它是特定 OSP 参数选择的一种编码方式。波变量的"优雅"来自于这种编码使得无源性证明变得简单（功率恒等式的平方结构），而不是因为它提供了更好的性能。

本质洞察：三大流派不是三种不同的物理机制——它们是同一物理事实（能量守恒）在三种不同数学框架下的表述。波变量是最"编码高效"的表述（证明最短），OSP 是最"灵活"的表述（可用于非标准拓扑），直接被动设计是最"系统特定"的表述（利用系统特有结构）。选择哪种取决于问题的具体约束——不存在"最好的"流派。

⚠️ 前沿工作的常见陷阱¶

🧠 思维陷阱：认为"新方法一定比旧方法好"
   新手想法："2024 年的三通道架构一定优于 1989 年的波变量"
   实际上：新方法解决的是特定场景下的特定问题（如三通道解决低频透明度），
          但引入了新的复杂性（额外通道的能量管理）。
          对于常数延迟+简单环境，1989 年的标准波变量仍然是最优选择——
          简单、成熟、有 35 年的工程验证。
   正确思维：选择方法应基于具体场景的需求和约束，而非发表年份。

D6.9.3 波变量在多 DOF 系统中的扩展 ⭐⭐⭐¶

单 DOF 波变量的推广到多 DOF 并非简单的"每个 DOF 独立一套"——存在以下关键问题。

独立 vs 耦合波变量：

方案 A：各 DOF 独立波阻抗

\[u_i = \frac{f_i + b_i v_i}{\sqrt{2b_i}}, \quad i = 1, ..., n\]

每个 DOF 使用自己的波阻抗 $b_i$。优势是简单，各 DOF 可独立调优。劣势是忽略了 DOF 间的运动学耦合。

方案 B：矩阵波阻抗（Albu-Schaffer-Ott-Hirzinger 2007）

\[\mathbf{u} = \frac{1}{\sqrt{2}}(B^{1/2} \mathbf{v} + B^{-1/2} \mathbf{f})\]

其中 $B$ 是正定矩阵。$B = bI$ 退化为独立情况。$B = M(q)$（质量矩阵）可以利用运动学耦合信息——但 $M(q)$ 是构型依赖的，通信两端的 $M$ 不同。

方案 C：操作空间波变量

在笛卡尔空间而非关节空间定义波变量：

\[\mathbf{u}_{cart} = \frac{1}{\sqrt{2b_{cart}}}(\mathbf{f}_{cart} + b_{cart} \mathbf{v}_{cart})\]

优势是透明度在操作空间最优化。劣势是需要在线计算雅可比矩阵并传输（增加通信开销）。

工程推荐：6-DOF 系统使用方案 A（各 DOF 独立），平动和转动 DOF 使用不同的 $b$：

\[b_{trans} \in [0.5, 5] \text{ Ns/m}, \quad b_{rot} \in [0.05, 0.5] \text{ Nms/rad}\]

多 DOF 波变量的通信带宽分析：

每个 DOF 的波变量需要传输 $[u_i, U_i]$（瞬时波 + 波积分），各 8 字节（double），加上 4 字节序列号和 8 字节时间戳。6-DOF 系统的单向包大小为：

\[\text{Payload} = 4 + 8 + 6 \times (8 + 8) = 108 \text{ bytes}\]

加上 UDP/IP 头（28 字节）和以太网帧头（14 字节）：

\[\text{Total} = 108 + 28 + 14 = 150 \text{ bytes/packet}\]

在 1 kHz 采样率下，单向带宽需求为：

\[\text{BW} = 150 \times 8 \times 1000 = 1.2 \text{ Mbps}\]

双向（正向波 + 反向波）约 2.4 Mbps——在现代网络中完全不是问题。但在卫星通信（KONTUR-2 使用的 S-band 上行链路约 2 Mbps）中接近极限。

多 DOF 的能量记账：

6-DOF 系统的通道总储能是各 DOF 储能之和：

\[E_{comm}^{total}(t) = \sum_{i=1}^{6} E_{comm,i}(t) = \sum_{i=1}^{6} \left[\frac{1}{2}\int_{t-T_1}^t u_{m,i}^2 d\tau + \frac{1}{2}\int_{t-T_2}^t v_{s,i}^2 d\tau\right]\]

每个 $E_{comm,i}(t) \geq 0$（因为被积函数是平方），因此 $E_{comm}^{total}(t) \geq 0$——多 DOF 的无源性是各 DOF 无源性的自然推论。

但跨 DOF 耦合可能引入问题：当 master 和 slave 的运动学不同（异构系统），slave 端的控制律可能在关节空间和操作空间之间做转换。这种转换引入了雅可比矩阵 $J(q)$，而 $J(q)$ 是构型依赖的。如果 $J(q)$ 在某个构型变化很快（接近奇异），波变量在操作空间和关节空间之间的映射可能引入额外的能量——这需要特别注意。

实践建议：异构系统使用操作空间波变量（方案 C），在 master 和 slave 端分别做笛卡尔力/速度到波变量的变换。这避免了跨空间映射的能量问题，但增加了通信开销（需要传输 6-DOF 波变量而非关节波变量）。

D6.9.4 三通道波变量补偿架构（2024）⭐⭐⭐¶

2024 年 Electronics 期刊发表的 Novel Design of Three-Channel Bilateral Teleoperation with Communication Delay Using Wave Variable Compensators 提出了三通道波变量架构。传统波变量是两通道（正向波 + 反向波），三通道架构在此基础上增加了一个**位置通道**——直接传输位置信息（而非从波积分恢复位置）。

三通道 vs 两通道：

维度	两通道（标准波变量）	三通道（波变量 + 位置）
传输信号	$u_m, v_s$	$u_m, v_s, x_m$
位置获取	波积分恢复	直接传输
位置漂移	需要 wave integral + 弱弹簧	自然消除（位置直接可用）
带宽	低（2 个 double/DOF）	中（3 个 double/DOF）
无源性	波域证明	需额外证明位置通道无源性
透明度	中（波阻抗粘滞）	高（位置通道提供低频透明度）

三通道架构的核心思想是：用波变量保证高频稳定性，用直接位置传输保证低频透明度。波变量在低频时渲染刚度为 $K_{eff} = b/T$（D6.5.4 节频域分析），远低于真实环境刚度；直接传输的位置信息可以补偿这一缺陷。

无源性保证：位置通道引入了额外的通信延迟 $T$。延迟的位置信号 $x_m(t-T)$ 用于 slave 端的位置目标。位置控制器产生的力 $f_{pos} = K_p(x_m(t-T) - x_s)$ 可能不满足无源性（延迟使力和速度失相）。解决方案是用**能量罐**或 TDPA 约束位置通道的力输出——只在能量预算充足时才执行位置跟踪。

本质洞察：三通道架构体现了一个普遍的工程原则——用多个互补通道分别处理不同频率范围的需求。波变量通道处理高频（稳定性），位置通道处理低频（透明度），能量罐在两者之间协调能量预算。这与通信工程中的"频分复用"在精神上一致——不同频率的需求由不同的机制分别满足。

D6.9.5 波变量的工程实现检查清单 ⭐⭐¶

在实际部署波变量系统前，逐条确认以下事项：

波变量工程部署检查清单（17 项）
══════════════════════════════════════════
硬件层
  □ 力传感器精度 < 0.1 N (6-axis F/T sensor)
  □ 速度测量精度 < 0.001 m/s (编码器+微分/观测器)
  □ 采样频率 >= 500 Hz (推荐 1 kHz)
  □ 两端时钟同步精度 < 1 ms (NTP/PTP)

通信层
  □ UDP 协议（非 TCP）
  □ 包格式: [seq(4B), timestamp(8B), u(8B), U_integral(8B)]
  □ 接收端排序缓冲（2-5 包深度）
  □ 丢包检测（序列号间隔）
  □ 延迟测量功能（时间戳差）

算法层
  □ 波阻抗 b 初值设定（查表 D6.5.4 节）
  □ 散射变换正确性验证（正向+逆变换误差 < 1e-12）
  □ 功率恒等式在线验证（|fv - (u^2-v^2)/2| < 1e-10）
  □ Wave integral 启用（位置漂移修复）
  □ 弱弹簧 K_drift 设定（10-50 N/m）

安全层
  □ 能量监测实时绘图：波域延迟线用 E_comm(t)，端口 PO 用 E_obs_total(t)
  □ TDPA 安全网启用（D07）
  □ 急停功能（E_comm 或 E_obs 异常时自动触发）

D6.9.6 Chattering-Free TDPA 与波变量的融合前沿（2022-2025）⭐⭐⭐¶

传统 TDPA（D07）在 PC 介入时会产生力信号的"chattering"（高频抖振）——阻尼系数 $\alpha$ 在零和非零之间快速切换，操作者感受到不自然的"毛糙"力反馈。2022 年 Panzirsch 等人（IEEE T-Haptics）提出了 Chattering-Free TDPA，其核心改进是将 PC 的介入从**硬切换**改为**软过渡**：

\[\alpha_{smooth}(k) = \alpha_{smooth}(k-1) + \kappa \cdot [\alpha_{target}(k) - \alpha_{smooth}(k-1)]\]

其中 $\kappa \in (0, 1]$ 是平滑因子。当 $\kappa = 1$ 退化为标准 TDPA（无平滑）；$\kappa = 0.1$ 时平滑窗口约为 10 个采样周期。

与波变量的融合：Chattering-Free TDPA 可以作为波变量系统的安全层。在波域中实施 EBA（Energy Bounding Approach，D6.9.9 节）限制波能量上界，同时在端口域用 Chattering-Free TDPA 消除残余能量异常——两层的失真特征不同（EBA 是波域幅值衰减，TDPA 是力域阻尼注入），它们的叠加效果比任一单独使用更平滑。

2024 年的 Prescient Energy Reflection：Enhancing the Force Transparency of TDPA（IEEE T-Haptics, 2024）提出了"预见性能量反射"（Prescient Energy Reflection），其核心思想是利用已知的通信延迟预测未来的能量流入，从而提前调整 PC 的介入时机。这将 TDPA 从"事后纠正"部分升级为"短期预测纠正"——在能量赤字实际发生前就开始温和地介入，进一步减少力信号的失真。

2024 年位置-位置架构改进：Springer IJIRA 2024 发表的工作专门针对延迟位置-位置遥操作系统中 TDPA 保守性过强的问题，通过更精细的能量记账（区分"有用功"和"虚功"）减少了不必要的 PC 介入。在 100ms 延迟下，PC 介入频率从标准 TDPA 的 15%/min 降低到 3%/min，透明度主观评分从 3.2/5 提升到 4.1/5。

D6.9.7 变旋转阻抗遥操作中的无源性保证（2024）⭐⭐⭐¶

IEEE T-RO 2024 发表的 Passivity-Based Teleoperation With Variable Rotational Impedance Control 将波变量/无源性理论扩展到**姿态空间**。传统波变量在笛卡尔平动空间中定义（力 $f$ 和速度 $v$ 是三维向量），但姿态空间 $SO(3)$ 的非线性结构使得波变量的直接推广面临根本困难：

非线性功率：姿态空间的功率是 $P = \tau^T \omega$，其中 $\tau$ 是力矩、$\omega$ 是角速度。虽然形式上与 $f^T v$ 相同，但 $\omega$ 不是某个"旋转位置"的时间导数（角速度不是旋转的时间导数——这是 $SO(3)$ 非交换性的体现）
阻抗匹配：旋转域的环境阻抗 $Z_{rot}$ 是一个依赖于构型的 $3 \times 3$ 矩阵（不是标量），最优波阻抗应该也是矩阵形式

该论文使用**单位四元数**和**李理论**处理旋转，用**能量罐**保证变阻抗切换过程中的无源性。实验在 DLR LWR-IV 上验证，在硬接触（旋转刚度 50 Nm/rad）和自由空间之间切换时保持稳定。

这一结果对 D08（运动映射）有直接影响：D8.1 节讨论的姿态缩放 $R_s = R_s^{ref} \cdot \text{Exp}(\lambda_R \cdot \text{Log}((R_m^{ref})^{-1} R_m))$ 在力反馈遥操作中需要配合旋转域的波变量或能量罐来保证缩放过程的无源性。

D6.9.8 开放问题¶

问题	当前状态	挑战
RL 策略在环	波变量理论对被动终端成立但 RL 是主动能量源	需要新框架
自适应 $b$ 收敛性	经验有效但缺严格证明	时变 $K_e$ 估计不稳定
UDP 丢包最优处理	保持/插值/丢弃各有利弊	无统一最优方案
高维耦合	6-DOF 波变量各 DOF 耦合	各 DOF 的 $b$ 是否应独立
非线性环境模型	线性 $Z_e$ 假设	软物体、塑性变形
5G/6G 超低延迟	<1ms 端到端	可能使波变量不再必要
Chattering-Free 融合	2022 年首次提出	平滑因子 $\kappa$ 与延迟的最优关系未明
旋转域波变量	2024 能量罐方案	$SO(3)$ 非交换性对波域积分的影响
触觉数据压缩	波域可用于 haptic data reduction	压缩比与透明度的量化 trade-off
多操作者多机器人	N-port 扩展	$O(N^2)$ 条通信链路的波阻抗协调

D6.9.9 Time-Domain Passivity Approach 的 Energy Bounding 变种 ⭐⭐⭐¶

D07 将详细讨论 TDPA 的完整理论，但此处值得预告一个与波变量密切相关的变种——Energy Bounding Approach (EBA)，它融合了波变量的结构性安全与 TDPA 的运行时监测。

传统 TDPA 的 PC（Passivity Controller）在检测到能量违反时注入阻尼——这是"事后纠正"。EBA（Ryu et al., IEEE T-RO 2010）的核心思想是在波域中设置**能量上界**：通信通道中存储的波能量 $E_{comm}(t)$ 不允许超过预设阈值 $E_{max}$。当 $E_{comm}$ 接近 $E_{max}$ 时，发送端的波变量幅值被衰减——这等效于在波域中实施了一个"软限幅"。

\[u_m^{bounded}(t) = \begin{cases} u_m(t) & \text{if } E_{comm}(t) + \frac{1}{2}u_m^2(t)\Delta t \leq E_{max} \\ \sqrt{\frac{2(E_{max} - E_{comm}(t))}{\Delta t}} \cdot \text{sgn}(u_m(t)) & \text{if } E_{comm}(t) < E_{max} \\ 0 & \text{if } E_{comm}(t) \geq E_{max} \end{cases}\]

与标准 TDPA（D07）相比，EBA 的优势在于限幅发生在**波域**而非**功率域**，因此不会破坏波变量的对称结构——散射逆变换仍然适用，位置漂移修复（wave integral）仍然有效。代价是需要精确跟踪 $E_{comm}(t)$，这要求两端的时钟同步精度 <1 ms。

跨章综合练习¶

[跨章综合题——D05+D06] 考虑一个 PF 架构遥操作系统（D05 D5.4 节），通信延迟 $T = 50$ ms，master 阻尼 $b_m = 0.5$ Ns/m，slave 力增益 $C_f = 1$。

(a) 用 D05 的 Llewellyn 准则计算：当环境为刚性墙（$Z_e = K_e/s$，$K_e = 5000$ N/m）时，$\eta(\omega)$ 在关键频率 $\omega = \pi/(2T) = 31.4$ rad/s 处的值。系统是否绝对稳定？

(b) 现在加入 D06 的波变量通信层：选择 $b = 2$ Ns/m，将力/速度编码为波变量后传输。证明无论 $K_e$ 取何值，通信通道的端口能量 $E_{comm}(t) \geq 0$ 恒成立。

(c) 对比 (a) 和 (b)：Llewellyn 在延迟存在时要求增大 $b_m$ 牺牲透明度，而波变量通过信号域变换直接保证无源性。用数值说明两种方案下操作者感受阻抗 $Z_{to}$ 的差异——哪种方案的自由空间透明度更高？

本章常见误解汇总¶

误解	正确理解
波变量消除了延迟的所有影响	波变量保证稳定性但不消除延迟对透明度的影响——自由空间中仍有力反馈偏差
波阻抗 $b$ 越大越好	$b$ 过大导致自由空间"粘滞"，过小导致接触时振荡——需要匹配任务
位置漂移是数值误差	位置漂移是波变量理论的固有缺陷——延迟期间传输的力脉冲导致积分偏差
波变量只适用于恒定延迟	标准波变量对恒定延迟无源，时变延迟需要额外的能量监控（TDPA）
散射变换 = 波变量	散射变换是数学工具（变换方法），波变量是物理变量（传输线上的信号）
功率守恒 = 能量守恒	瞬时功率守恒不等于累积能量守恒——需要验证无源性（输出能量 $\le$ 输入能量）
改进型波变量完全解决了经典问题	每种改进引入新的权衡——如位置漂移补偿可能降低力反馈质量
数据驱动方法可以完全替代波变量	数据驱动方法的泛化性和安全性保证仍是开放问题

本章常见误解汇总¶

误解	正确理解
理论模型可以完美描述实际系统	实际系统存在建模误差、传感器噪声、通信延迟等非理想因素
参数越大/越小越好	参数设计是多目标权衡，需要在性能指标之间寻找平衡
仿真验证通过即可部署	仿真与实物存在 Sim2Real gap，需要在实物上再次验证和调参
经典方法已被学习方法取代	经典方法提供安全性和稳定性保证，学习方法提供自适应能力，两者互补
高频控制总是更好	高频控制增加计算负担，且传感器噪声在高频被放大
线性分析工具可以完全预测非线性行为	线性分析提供局部近似和设计指导，但非线性效应需要额外验证

本章小结¶

知识点	核心结论	难度
传输线类比	波变量将通信通道等效为无损传输线——延迟不产生能量	⭐⭐
散射变换	$a = (f+bv)/\sqrt{2b}$；功率恒等式 $fv = (a^2 - b_w^2)/2$	⭐⭐⭐
波变量通信	传 $u_m, v_s$；接收端延迟解码力/速度	⭐⭐
常数时延无源性	$E_{comm} = \frac{1}{2}\int_{t-T}^t u_m^2 + \frac{1}{2}\int_{t-T}^t v_s^2 \geq 0$ 恒成立	⭐⭐⭐
波阻抗 $b$	过小→振铃，过大→粘滞；最优 $b = \sqrt{K_e M_m}$	⭐⭐
时变时延	$\dot{T}>1$ 能量创生；gain scheduling / 能量罐 / TDPA 才是能量层修复，丢弃过期包只是网络卫生	⭐⭐⭐
位置漂移	速度积分累积→wave integral + 弱弹簧修复	⭐⭐
离散实现	ZOH 引入额外被动性约束，需足够高采样频率	⭐⭐⭐

术语速查表¶

本章核心术语的中英对照，按首次出现顺序排列。详细定义见正文对应小节。

波变量与经典反馈的统一视角 ⭐⭐⭐¶

为什么波变量能在延迟下保持无源而直接的力/速度传输不能？理解这个问题的关键在于**传输线类比**。

直接传输（力和速度信号直接通过通信通道传输）：

Master → f_m(t) → [延迟 T] → f_m(t-T) → Slave
Slave  → v_s(t) → [延迟 T] → v_s(t-T) → Master

功率平衡：
  Master 端输出功率 = f_m(t) · v_s(t-T)
  Slave 端输入功率  = f_m(t-T) · v_s(t)

  在延迟 T > 0 时，通道的净功率 ≠ 0
  → 通道可能产生能量（活性！）
  → 违反无源性 → 可能不稳定

波变量传输（波变量信号通过通信通道传输）：

波变换：
  u_m = (f_m + b·v_m) / sqrt(2b)   (入射波)
  w_s = (f_s - b·v_s) / sqrt(2b)   (反射波)

Master → u_m(t) → [延迟 T] → u_m(t-T) → Slave
Slave  → w_s(t) → [延迟 T] → w_s(t-T) → Master

功率平衡：
  通道输入功率 = |u_m(t)|² / 2
  通道输出功率 = |u_m(t-T)|² / 2

  由于 |u_m(t-T)|² = |u_m(t)|²（延迟不改变信号幅度）
  → 通道净功率 = 0（无源！）
  → 无论延迟 T 多大，通道都不产生能量

本质洞察：波变量之所以有效，是因为延迟只改变信号的**相位**而不改变**幅度**。直接传输力和速度时，延迟使力和速度信号"不匹配"（$f(t) \cdot v(t-T)$ 的积分不等于 $f(t) \cdot v(t)$ 的积分），产生能量误差。波变换将力和速度"混合"成单一的波信号，延迟只使波信号整体延迟而不改变其幅度——因此功率守恒。

波变量的经典问题与改进方法详解 ⭐⭐⭐¶

问题 1：位置漂移（Position Drift）

波变量保证了通道的无源性，但副作用是**位置漂移**——延迟期间传输的力脉冲导致 master 和 slave 的位置逐渐偏离。

场景：操作者快速推 master，然后松手
  t = 0:    操作者施力 F → master 运动
  t = T:    力信号到达 slave → slave 开始运动
  t = Δt:   操作者松手 → master 停止
  t = T+Δt: "松手"信号到达 slave → slave 停止

  结果：slave 比 master 多运动了 T 秒
  → 位置偏差 Δp = v_avg × T
  → 这个偏差不会自动消除（没有积分项）

  工程后果：
  - 操作者看到 slave 位置与 master 不一致
  - 重复操作后偏差累积
  - 精密操作变得不可能

解决方案：位置漂移补偿

方法 1：位置层叠加（Niemeyer 2004）
  在波变量之上叠加一个低增益位置反馈：
  u_m' = u_m + K_drift · (x_m - x_s_delayed)

  K_drift 足够小以不破坏无源性，
  但足以在 10-30 秒内消除位置漂移

方法 2：能量预算位置补偿（Lee 2010）
  记录因延迟"多消耗"的能量 E_excess
  在安全范围内用这个能量预算驱动位置补偿
  → 补偿量由能量预算限制，保证无源性

方法 3：预测增强（Smith Predictor 风格）
  在 slave 端预测 master 的当前位置
  用预测位置替代延迟位置做位控
  → 减小有效延迟，减小位置漂移
  代价：预测误差在模型不准确时引入能量

问题 2：波阻抗选择

波阻抗 $b$ 是波变换中的自由参数——它决定了力和速度信号在波变量中的"混合比例"。

$b$ 的选择	自由空间行为	接触行为	最佳适用
$b$ 大	操作者感到"粘滞"	接触力反馈精确	精密力控操作
$b$ 小	自由运动流畅	接触时可能振荡	大范围快速运动
$b = \sqrt{K_e \cdot m_e}$	匹配环境阻抗	最优透明度	已知环境
$b$ 时变	自适应	自适应	环境未知

**时变波阻抗**是 2010 年代的研究热点——根据实时估计的环境阻抗调整 $b$，使自由空间中 $b$ 小（流畅），接触时 $b$ 大（稳定）。但时变 $b$ 破坏了经典波变量的无源性证明——需要 TDPA（D07）提供额外的安全保障。

数据驱动方法的最新进展 ⭐⭐⭐⭐¶

2024-2025 年，数据驱动方法开始挑战经典波变量。代表性工作 "Beyond Wave Variables"（2025）提出用 Transformer/LSTM 集成学习延迟补偿，核心思想是用序列模型预测延迟信号，替代波变换。优势是不需要固定的波阻抗 $b$，可以自适应各种延迟和环境；劣势是安全性保证依赖 Lipschitz 常数估计和无源性验证——目前还不够成熟，不建议在安全关键场景中使用。

累积项目：本章新增模块¶

章节	新增模块	功能
D05	二端口分析 + Z-width	Llewellyn 稳定分析
D06	波变量通信模块	力/速度→波变换→延迟通道→波逆变换→力/速度
D06	无源性监测器	区分 $E_{comm}(t)$（波域管线储能）与 $E_{obs}(t)$（端口功率观测），在线检测能量创生
D06	自适应波阻抗	在线估计 $K_e$→更新 $b = \sqrt{K_e M_m}$

本章与后续章节的关系¶

后续章节	与 D06 的关系	从 D06 带走的关键知识
D07 TDPA	D06 的波变量 $\to$ D07 的时域能量监控	波变换公式、功率守恒、位置漂移问题
D08 运动映射	D06 的延迟补偿 $\to$ D08 的遥操作数据采集	延迟对力反馈的影响、波阻抗选择

延伸阅读¶

资源	类型	难度	关注点
Anderson-Spong 1989, "Bilateral Control of Teleoperators with Time Delay"	论文	⭐⭐⭐	散射变换原始推导——必读
Niemeyer-Slotine 1991, "Stable Adaptive Teleoperation"	论文	⭐⭐⭐	波变量定义和物理直觉——与 1989 对读
Niemeyer-Slotine 2004, "Telemanipulation with Time Delays"	论文	⭐⭐⭐	Wave integral 解决位置漂移
Nuno et al. 2011, "Bilateral Teleoperation of Flexible-Joint Manipulators with Dynamic Gravity Compensation and Time-Varying Delay", Automatica (DOI: 10.1016/j.automatica.2011.01.067)	论文	⭐⭐	Lyapunov-Krasovskii 柔性关节遥操作——教学参考
Franken et al. 2011, "Bilateral Telemanipulation With Time Delays: A Two-Layer Approach Combining Passivity and Transparency", IEEE Trans. Robot. (DOI: 10.1109/TRO.2011.2142430)	论文	⭐⭐⭐⭐	能量罐双层架构——KONTUR-2 采用
Chopra, Spong, Lozano 2008, "Synchronization of Bilateral Teleoperators with Time Delay", Automatica (DOI: 10.1016/j.automatica.2008.01.012)	论文	⭐⭐⭐⭐	不使用散射变换的替代方案
Panzirsch et al. 2022, "Chattering-Free Time Domain Passivity Approach", IEEE T-Haptics	论文	⭐⭐⭐	消除 TDPA 力抖振的平滑方法
Enhancing the Force Transparency of TDPA: Prescient Energy Reflection, IEEE T-Haptics 2024	论文	⭐⭐⭐⭐	预见性能量反射——从事后纠正到短期预测
Novel Design of Three-Channel Bilateral Teleoperation Using Wave Variable Compensators, Electronics 2024	论文	⭐⭐⭐	三通道波变量架构——位置+波变量融合
Passivity-Based Teleoperation With Variable Rotational Impedance Control, IEEE T-RO 2024	论文	⭐⭐⭐⭐	旋转域的波变量/无源性扩展——李理论+能量罐

精读优先级建议：

入门必读：Anderson-Spong 1989（散射变换原始推导，只有 8 页）+ Niemeyer-Slotine 1991（波变量命名和物理直觉）
核心理论：Nuno et al. 2011（三大流派统一框架——教学最佳参考）
工程实现：Niemeyer-Slotine 2004（wave integral）+ Franken 2011（能量罐）
前沿方向：2024 年的旋转域和三通道架构论文

波变量的频域分析 ⭐⭐⭐¶

波变量对遥操作系统透明度的影响可以通过频域分析精确量化。设 PF 架构 + 波变量 + 恒定延迟 $T_d$，则系统的 h 参数变为：

\[h_{11}^{\text{wave}}(s) = \frac{b(1 - e^{-2sT_d})}{1 + e^{-2sT_d}} + Z_m(s)\]

\[h_{12}^{\text{wave}}(s) = \frac{-2be^{-sT_d}}{1 + e^{-2sT_d}} \cdot K_f\]

其中第一项 $\frac{b(1-e^{-2sT_d})}{1+e^{-2sT_d}}$ 是波变量通道引入的**等效阻抗**。

频率特性分析：

低频 (ω → 0):
  h_11 附加阻抗 → 0（自由空间透明）
  h_12 力增益 → -Kf（完美力传输）
  → 低频透明度良好

中频 (ω ∼ π/T_d):
  h_11 附加阻抗达到峰值 ∼ 2b（最大粘滞感）
  h_12 力增益下降（力反馈衰减）
  → 中频透明度显著下降

高频 (ω → ∞):
  h_11 附加阻抗 → b（恒定阻尼）
  h_12 → 0（无力传输）
  → 高频完全不透明

这个频率特性揭示了波变量透明度损失的物理根源——波变量在通道中引入了**频率依赖的等效阻尼** $b_{\text{eff}}(\omega)$，这个阻尼在中频（$\omega \sim \pi/T_d$）最大。减小波阻抗 $b$ 可以降低这个阻尼，但代价是接触时稳定裕度下降。

时变波阻抗的设计准则：

基于上述频率分析，时变波阻抗 $b(t)$ 的设计应遵循：

\[b(t) = b_{\min} + (b_{\max} - b_{\min}) \cdot \sigma(\|f_e(t)\| / f_{\text{thresh}})\]

其中 $\sigma(\cdot)$ 是 sigmoid 函数，$f_e(t)$ 是环境力估计，$f_{\text{thresh}}$ 是接触力阈值。自由空间中 $b \to b_{\min}$（流畅），接触时 $b \to b_{\max}$（稳定）。

波变量与现代控制理论的联系 ⭐⭐⭐¶

波变量变换与控制理论中的几个重要概念有深刻联系：

控制理论概念	与波变量的关系
传输线理论	波变量本质上是无损传输线的端口变量
散射矩阵 (S 参数)	波变换矩阵 $W$ 是散射矩阵的力学类比
保辛变换	波变换保持端口功率——这是保辛性的一种特殊情况
端口 Hamilton 系统	波变量是 port-Hamiltonian 系统理论的应用
LQR 对偶	波阻抗 $b$ 的最优选择可通过 LQR 对偶性分析

本质洞察：波变量不是一个"ad hoc 技巧"，而是有深厚的物理和数学根基——它来自传输线理论（电气工程）、port-Hamiltonian 系统（控制理论）和散射理论（量子力学/微波工程）的交叉。理解这些联系有助于设计更优的波变量变体。

研究实践建议¶

层次	建议	适用读者
入门实践	用 Python 实现经典波变量变换，验证恒定延迟下的功率守恒	硕一新生
中级实践	在波变量通道中加入位置漂移补偿，评估补偿效果	硕士研究生
高级实践	实现时变波阻抗，用 TDPA 监控时变 b 下的无源性	博士研究生

波变量理论的历史演进 ⭐⭐¶

年份	里程碑	贡献者	核心贡献
1989	散射变换遥操作	Anderson-Spong	首次将传输线理论应用于遥操作
1993	波变量命名	Niemeyer-Slotine	波变量的物理解释和命名
1997	波变量位置漂移分析	Niemeyer-Slotine	发现并分析位置漂移问题
2004	位置漂移补偿	Niemeyer	能量预算位置补偿方法
2006	时变波阻抗	Chopra-Spong	自适应波阻抗以提升透明度
2010	能量预算补偿	Lee-Huang	基于能量的系统化漂移补偿
2012	多自由度波变量	Hirche-Buss	6-DOF 波变量的矩阵形式
2019	减少 TDPA 保守性	Panzirsch et al.	考虑能量反射的改进 PO
2025	数据驱动替代	Beyond Wave Var.	用序列模型替代波变换

反事实推理：如果 Anderson 和 Spong 在 1989 年没有发现散射变换可以用于遥操作，双边遥操作领域会怎样发展？很可能会停留在"增大阻尼"的保守方法上——直到有人从其他领域（如微波工程或量子信息）重新发现这个联系。事实上，散射变换在微波工程中已经使用了 40 年（Llewellyn 1952），Anderson-Spong 的贡献是看到了机械系统与微波系统的深层类比。

🔧 故障排查手册¶

症状	可能原因	排查步骤	相关章节
自由空间粘滞感严重	波阻抗 $b$ 过大	1. 降低 $b$ 2. 测量 $Z_{to}$ 3. 用自适应 $b$	D6.5
硬墙接触振铃	$b$ 过小（阻抗失配）	1. 增大 $b$ 2. 估计 $K_e$ 3. 自适应 $b$	D6.5
两端位置逐渐漂移	速度积分误差 / 丢包	1. 检查丢包率 2. 实现 wave integral 3. 加弱弹簧	D6.7
时变延迟下不稳定	$\dot{T} > 1$ 能量创生	1. 监测波域 $E_{comm}(t)$ 与端口 $E_{obs}(t)$ 2. gain scheduling 3. 能量罐或 TDPA 4. 丢弃过期包仅用于乱序治理	D6.6, D07
波变量编解码有噪声	$1/\sqrt{2b}$ 放大量化噪声	1. 检查力/速度测量精度 2. 波域加低通滤波 3. 增大 $b$	D6.5
自适应 $b$ 导致力跳变	$b$ 切换时波连续性断裂	1. 加 $b$ 变化率限制 2. 低通滤波 $b(t)$ 3. 减小自适应增益 $\alpha$	D6.5.4
包乱序导致波积分错误	UDP 包到达顺序不一致	1. 检查序列号 2. 加接收端排序缓冲 3. 丢弃乱序包	D6.8.5
能量罐持续缩放	罐初始值太低或充能不足	1. 增大 $E_0$ 2. 检查充能率 3. 确认 master 端正常输入能量	D6.6.3
Wave integral 修复后仍有微漂移	数值精度累积	1. 使用 double 精度 2. 定期同步位置 3. 增大 $K_{drift}$	D6.7.2

波变量实现的 Python 参考代码 ⭐⭐¶

以下是经典波变量的最小实现，可用于仿真验证：

import numpy as np

class WaveTransform:
    """经典波变量变换器"""

    def __init__(self, b=10.0):
        """b: 波阻抗 (N·s/m)"""
        self.b = b
        self.sqrt2b = np.sqrt(2 * b)

    def force_velocity_to_wave(self, f, v):
        """力/速度 → 入射波/反射波"""
        u = (f + self.b * v) / self.sqrt2b  # 入射波
        w = (f - self.b * v) / self.sqrt2b  # 反射波
        return u, w

    def wave_to_force_velocity(self, u, w):
        """入射波/反射波 → 力/速度"""
        f = self.sqrt2b * (u + w) / 2
        v = (u - w) / self.sqrt2b
        return f, v

    def verify_power(self, f, v, u, w):
        """验证功率守恒: f·v = (u² - w²)/2"""
        P_fv = f * v
        P_wave = (u**2 - w**2) / 2
        return np.allclose(P_fv, P_wave, atol=1e-10)


class DelayedWaveChannel:
    """带延迟的波变量通信通道"""

    def __init__(self, delay_samples, b=10.0):
        self.wt = WaveTransform(b)
        self.delay = delay_samples
        self.buffer_m2s = np.zeros(delay_samples)  # master→slave
        self.buffer_s2m = np.zeros(delay_samples)  # slave→master
        self.idx = 0

    def transmit(self, u_master, w_slave):
        """传输波变量，返回延迟后的信号"""
        # Master→Slave: u 信号延迟
        u_delayed = self.buffer_m2s[self.idx]
        self.buffer_m2s[self.idx] = u_master

        # Slave→Master: w 信号延迟
        w_delayed = self.buffer_s2m[self.idx]
        self.buffer_s2m[self.idx] = w_slave

        self.idx = (self.idx + 1) % self.delay
        return u_delayed, w_delayed

波变量在不同场景下的性能评估 ⭐⭐¶

场景	延迟	波阻抗 $b$	位置漂移	力反馈质量	建议
局域网遥操作	1-5 ms	$b = 10$	$< 0.1$ mm	优秀	直接力反馈可能足够
5G 远程操作	10-50 ms	$b = 20$	0.1-1 mm	良好	波变量有明显优势
卫星通信	200-500 ms	$b = 50$	1-10 mm	一般	需位置漂移补偿
深空探测	3-22 min	—	严重	不可用	必须用监督式遥操作

工程决策：当延迟 < 10 ms 时，波变量的优势不明显（直接传输也足够稳定）。当延迟 10-500 ms 时，波变量是必需的。当延迟 > 1 s 时，双边遥操作本身不可行——应切换到监督式遥操作（操作者下达高层指令，机器人自主执行）。

跨章综合练习¶

[综合 D05+D06] 对 D05 中的 PF 架构，用波变量替代直接信号传输。用 Python 仿真比较有/无波变量在 50 ms 延迟下的稳定性和透明度。绘制 master 和 slave 的位置跟踪曲线和力反馈曲线。
[综合 D06+D07] 在波变量通道中加入时变延迟（$T_d(t) = 50 + 20\sin(2\pi t)$ ms）。观察经典波变量是否仍然无源。然后加入 TDPA（D07），观察 PO/PC 的介入频率。
[工程实践] 用上述 Python 参考代码实现完整的双边遥操作仿真：master（弹簧-阻尼-质量）+ 波变量通道 + slave（弹簧-阻尼-质量）+ 虚拟墙环境。扫描波阻抗 $b$ 从 1 到 100，绘制位置漂移 vs $b$ 和力反馈质量 vs $b$ 的 Pareto 曲线。

波变量理论的开放问题¶

尽管波变量理论已有 35 年历史，以下问题仍然活跃：

最优波阻抗的自动选择：如何在线估计环境阻抗并自动调整 $b$，同时保证无源性？目前的方法要么需要环境模型先验，要么需要 TDPA 额外保障。
多通道波变量：6-DOF 波变量需要 $6 \times 6$ 的波变换矩阵——如何选择这个矩阵以最大化各方向的透明度？是否存在"最优"的多通道波变换？
离散化效应：连续时间波变量的无源性在离散化后是否精确保持？ZOH（零阶保持）和 FOH（一阶保持）离散化的能量误差有多大？
非线性波变量：经典波变量基于线性变换。是否存在非线性的信号变换，在保持无源性的同时提供更好的透明度？
与学习方法的结合：如何将波变量的物理保证与学习方法的自适应能力结合？"Beyond Wave Variables"（2025）提供了初步探索，但安全性证明仍不充分。

给研究生的建议：如果你正在寻找遥操作领域的研究方向，以上 5 个问题中的任何一个都是有价值的博士课题。问题 1 和 5 是当前最活跃的方向；问题 3 虽然看起来"小"，但对工程部署至关重要。

波变量与 port-Hamiltonian 系统的深层联系¶

波变量可以在 port-Hamiltonian 系统框架下得到统一的理解。port-Hamiltonian 系统将物理系统描述为能量存储（Hamilton 函数 $H$）、能量耗散（阻尼矩阵 $R$）和能量端口（力/速度对）的组合：

\[\dot{x} = (J - R) \frac{\partial H}{\partial x} + Bu, \quad y = B^T \frac{\partial H}{\partial x}\]

其中 $J$ 是反对称矩阵（保守力），$R \ge 0$ 是对称正半定矩阵（耗散力），$u, y$ 是端口变量（力和速度）。

波变量变换本质上是 port-Hamiltonian 系统端口变量的**Casimir 守恒变换**——它保持系统的 Hamilton 结构不变，因此保持无源性。这解释了为什么波变量在任意延迟下都保持无源——延迟不改变 Hamilton 结构。

版本信息速查¶

库 / 工具	推荐版本	备注
Pinocchio	$\ge$ 2.6.x	运动学和动力学计算
Eigen	$\ge$ 3.4	矩阵运算和 SVD
MuJoCo	$\ge$ 2.3.x	物理仿真验证
ROS2	Humble+	通信框架

| MuJoCo | >= 2.3.x | 波变量遥操作的物理仿真验证 |

实现建议：开发波变量系统时，建议先用 Python 搭建原型（利用 NumPy + control 库快速验证数学正确性），然后用 C++ 移植到实时系统（利用 Eigen 的 SIMD 加速）。Python 原型的开发时间通常是 C++ 的 1/5-1/10。

D06 到 D07 的过渡：本章的波变量解决了恒定延迟下的无源性问题，但真实网络的延迟是时变的（jitter）。时变延迟下，经典波变量的功率守恒不再精确成立——可能出现微小的能量产生。D07 的 TDPA 提供了运行时安全网：在线监控能量流，检测到活性时注入自适应阻尼。波变量 + TDPA 的组合提供了最完整的遥操作稳定性保障。

波变量的工程实现注意事项¶

数值精度：波变换涉及 $\sqrt{2b}$ 除法——当 $b$ 很小时（如 $b = 0.1$），$\sqrt{2b} \approx 0.45$，数值精度足够。当 $b$ 极小（$< 0.01$）时可能出现数值问题。
初始化：波变量缓冲区应初始化为零——非零初始化会在启动时产生能量脉冲。
饱和保护：波变量信号可能因力传感器饱和而出现异常大值——需要在波变换前后加限幅保护。
采样率匹配：Master 和 Slave 的采样率可能不同——需要在波变换域做重采样（而非在力/速度域），以保持无源性。

给工程师的总结：波变量是遥操作稳定性的理论基石。工程实现时，选择合理的波阻抗 $b$（匹配预期环境阻抗），加入位置漂移补偿（低增益位置反馈），并用 TDPA（D07）提供运行时安全保障。这三个步骤的组合可以覆盖绝大多数工业遥操作场景。

给研究者的展望：波变量理论的下一个突破可能来自与学习方法的深度融合——用数据驱动的方式自动选择波变换参数，同时用 port-Hamiltonian 结构保证安全性。这个方向结合了物理保证和数据自适应的优点。

D06 到 D07 承接：本章给出了波变量这一"结构性"无源保证方案——在波域中，通信通道天然无源。但工程实践中还面临 ZOH 离散化、控制器 bug、传感器噪声等问题，波变量无法覆盖这些"非结构性"的能量异常。D07 的 TDPA 正是为此设计——它是系统级的"运行时安全网"，在线监测能量并实时纠正任何异常。工业系统通常**组合使用**波变量（结构层安全）和 TDPA（运行层安全）——两层独立、互为备份。

D06 的核心收获：散射变换将功率分解为两个非负项之差（$fv = (u^2-v^2)/2$），使无源性分析从"力$\times$速度积分"简化为"两个非负量的比较"。这一数学变换是遥操作理论中最优美的成果——时延 $T$ 不出现在非负性条件中，因为波能量密度（平方量）的积分恒非负，与积分区间宽度无关。理解了这一点，就理解了为什么"传输线不产生能量"——波变量只是将这一物理事实编码进信号表示中。

研究实践建议¶

给初学者的建议：

先实现 1-DOF 仿真：用 Python 实现本章的 WaveVariableTeleop1DOF 类，亲手验证功率恒等式和常数时延无源性。数值实验比看证明更直观——当你看到 $E_{comm}(t)$ 曲线始终在零上方时，会真正理解"波能量恒非负"的含义
精读 Anderson-Spong 1989 原文：只有 8 页，推导清晰。重点关注 Section III（散射变换定义）和 Section IV（稳定性证明）。与本章内容交叉阅读——本章补充了原文没有展开的量纲分析、物理直觉和工程实现
不要跳过 D05：波变量的意义只有在理解了"没有波变量时延迟如何破坏 Llewellyn 稳定性"之后才能充分体会。D05 的 Llewellyn 分析提供了"动机"——没有动机就没有对解决方案的深刻理解
关注符号约定：波变量文献中最大的混乱来源是端口方向和符号约定不一致。本章统一使用"流入通信通道为正"的约定。阅读其他文献时，第一件事是确认该文献的符号约定，然后做必要的符号转换

给有经验者的建议：

关注 Nuno et al. 2011 的统一框架：该论文用 Lyapunov-Krasovskii 泛函统一了波变量、OSP 和直接被动设计三大流派——如果你想发表遥操作理论论文，这是必须掌握的分析工具
关注旋转域扩展：2024 年的变旋转阻抗遥操作（D6.9.7 节）开辟了新方向——$SO(3)$ 上的波变量理论远未成熟，特别是在灵巧手遥操作（D8.3 retargeting）中，旋转域的无源性保证是未解决的问题
关注 RL + 遥操作的融合：当 slave 端运行的不是被动控制器而是 RL 策略时，整个无源性框架需要重新审视。RL 策略是主动能量源——它可以从内部（神经网络参数）产生任意大的能量。目前没有成熟的理论保证"RL 策略 + 波变量通信"的稳定性
工程部署优先用 D6.9.4 检查清单：17 项逐条确认可以避免 80% 的工程故障

版本信息速查¶

工具/库	版本	用途	备注
Python	3.10+	仿真代码	NumPy + Matplotlib
MATLAB/Simulink	R2024a+	波变量仿真	Simscape 可选
ROS2	Humble/Jazzy	通信框架	UDP 自定义或 DDS
Pinocchio	3.0+	运动学（多 DOF 扩展）	D08 需要
manif	0.0.5+	$SE(3)$//$SO(3)$ 运算	波变量旋转域扩展
SciPy	1.12+	优化（L-BFGS-B）	自适应波阻抗优化
PlotJuggler	3.8+	实时诊断可视化	监控 $E_{comm}(t)$ 和端口能量
Wireshark	4.0+	网络包分析	延迟/丢包/抖动诊断

电气传输线	力学遥操作	波变量
电压 \(V\)	力 \(f\)	—
电流 \(I\)	速度 \(v\)	—
正向波 \(V^+\)	—	入射波 \(u\)
反向波 \(V^-\)	—	反射波 \(v_w\)
特征阻抗 \(Z_0\)	—	波阻抗 \(b\)
功率分解 \((V^+)^2/Z_0 - (V^-)^2/Z_0\)	\(fv\)	\(\frac{1}{2}(u^2 - v_w^2)\)

频率范围	\(Z_{to}\)（刚墙）	\(Z_{to}\)（自由空间）	透明度
\(\omega \ll 1/T\)	\(K_{eff}/j\omega = b/(j\omega T)\)	\(j\omega B_{eff} = j\omega bT\)	低频近似透明，但刚度/阻尼被延迟限制
\(\omega = \pi/(4T)\)	\(b/j\tan(\pi/4) = b/j\)	\(jb\tan(\pi/4) = jb\)	中频，$
\(\omega = \pi/(2T)\)	\(b/j\tan(\pi/2) \to 0\)	\(jb\tan(\pi/2) \to \infty\)	反共振/共振——透明度完全丧失

编号	问题	答不出时回顾
1	无源性的能量表述：写出单端口系统无源性的能量不等式 \(\int_0^t f(\tau)v(\tau)\,d\tau + V(0) \geq 0\)。\(V(0)\) 代表什么？	F02.4 无源性基础
2	Llewellyn 准则：写出稳定因子 \(\eta(\omega)\) 的表达式。理想透明度下 \(\eta = ?\)	D05 Llewellyn 准则
3	时延对 Llewellyn 的影响：通信延迟 \(T\) 如何改变 \(h_{12}h_{21}\) 的实部？关键频率 \(\omega = \pi/T\) 处发生了什么？	D05 时延分析
4	传输线基础：无损传输线的波速 \(c = 1/\sqrt{LC}\) 和特征阻抗 \(Z_0 = \sqrt{L/C}\) 是什么含义？	电磁学/电路理论
5	d'Alembert 解：一维波动方程的通解中正向波和反向波分别代表什么？	数学物理

项	物理含义
\(\frac{1}{2}\int_{t-T_1}^{t} u_m^2 d\tau\)	Master 已发射但 slave 尚未收到的正向波能量
\(\frac{1}{2}\int_{t-T_2}^{t} v_s^2 d\tau\)	Slave 已发射但 master 尚未收到的反向波能量

\(b\) 值	波的主导分量	自由空间感受	硬墙感受	问题
\(b \to 0\)	力	几乎零粘滞（好）	振铃严重	大阻抗失配→波大量反射
\(b \approx \sqrt{K_e M_m}\)	平衡	适中粘滞	平滑	阻抗匹配→反射最小
\(b \to \infty\)	速度	严重粘滞（差）	稳定	力信息被压制

DOF 类型	推荐 \(b\) 范围	依据
平动 (m/s)	\(b \in [0.5, 5]\) Ns/m	接近人手操作阻抗量级
转动 (rad/s)	\(b \in [0.05, 0.5]\) Nms/rad	接近手腕阻抗量级

方案	先验信息	透明度	复杂度	典型案例	推荐场景
Gain Scheduling	需要 \(\dot{T}_{max}\)	中（持续衰减）	低	已知延迟范围	延迟变化率可预测的专用链路
能量罐	不需要	高（按需介入）	中	DLR KONTUR-2	通用场景——推荐默认方案
丢弃过期包	不需要	中（数据丢失）	最低	简单 UDP 系统的网络卫生；不提供无源性证明	仅作为网络层预处理，必须配合上述方案之一
Gain Sched. + 能量罐	需要 \(\dot{T}_{max}\)	高	中高	航天遥操作	安全关键 + 高透明度
能量罐 + TDPA	不需要	最高	高	工业双层架构	全面保护——D07 详述

来源	机制	量级
初始化	\(x_m(0) \neq x_s(0)\)	固定偏移
数值积分	累积舍入误差	随时间线性增长
丢包	速度采样丢失	随丢包率增加
\(b\) 切换	自适应 \(b\) 变化瞬间不连续	脉冲偏移

维度	两通道（标准波变量）	三通道（波变量 + 位置）
传输信号	\(u_m, v_s\)	\(u_m, v_s, x_m\)
位置获取	波积分恢复	直接传输
位置漂移	需要 wave integral + 弱弹簧	自然消除（位置直接可用）
带宽	低（2 个 double/DOF）	中（3 个 double/DOF）
无源性	波域证明	需额外证明位置通道无源性
透明度	中（波阻抗粘滞）	高（位置通道提供低频透明度）

误解	正确理解
波变量消除了延迟的所有影响	波变量保证稳定性但不消除延迟对透明度的影响——自由空间中仍有力反馈偏差
波阻抗 \(b\) 越大越好	\(b\) 过大导致自由空间"粘滞"，过小导致接触时振荡——需要匹配任务
位置漂移是数值误差	位置漂移是波变量理论的固有缺陷——延迟期间传输的力脉冲导致积分偏差
波变量只适用于恒定延迟	标准波变量对恒定延迟无源，时变延迟需要额外的能量监控（TDPA）
散射变换 = 波变量	散射变换是数学工具（变换方法），波变量是物理变量（传输线上的信号）
功率守恒 = 能量守恒	瞬时功率守恒不等于累积能量守恒——需要验证无源性（输出能量 \(\le\) 输入能量）
改进型波变量完全解决了经典问题	每种改进引入新的权衡——如位置漂移补偿可能降低力反馈质量
数据驱动方法可以完全替代波变量	数据驱动方法的泛化性和安全性保证仍是开放问题

\(b\) 的选择	自由空间行为	接触行为	最佳适用
\(b\) 大	操作者感到"粘滞"	接触力反馈精确	精密力控操作
\(b\) 小	自由运动流畅	接触时可能振荡	大范围快速运动
\(b = \sqrt{K_e \cdot m_e}\)	匹配环境阻抗	最优透明度	已知环境
\(b\) 时变	自适应	自适应	环境未知

后续章节	与 D06 的关系	从 D06 带走的关键知识
D07 TDPA	D06 的波变量 \(\to\) D07 的时域能量监控	波变换公式、功率守恒、位置漂移问题
D08 运动映射	D06 的延迟补偿 \(\to\) D08 的遥操作数据采集	延迟对力反馈的影响、波阻抗选择

症状	可能原因	排查步骤	相关章节
自由空间粘滞感严重	波阻抗 \(b\) 过大	1. 降低 \(b\) 2. 测量 \(Z_{to}\) 3. 用自适应 \(b\)	D6.5
硬墙接触振铃	\(b\) 过小（阻抗失配）	1. 增大 \(b\) 2. 估计 \(K_e\) 3. 自适应 \(b\)	D6.5
两端位置逐渐漂移	速度积分误差 / 丢包	1. 检查丢包率 2. 实现 wave integral 3. 加弱弹簧	D6.7
时变延迟下不稳定	\(\dot{T} > 1\) 能量创生	1. 监测波域 \(E_{comm}(t)\) 与端口 \(E_{obs}(t)\) 2. gain scheduling 3. 能量罐或 TDPA 4. 丢弃过期包仅用于乱序治理	D6.6, D07
波变量编解码有噪声	\(1/\sqrt{2b}\) 放大量化噪声	1. 检查力/速度测量精度 2. 波域加低通滤波 3. 增大 \(b\)	D6.5
自适应 \(b\) 导致力跳变	\(b\) 切换时波连续性断裂	1. 加 \(b\) 变化率限制 2. 低通滤波 \(b(t)\) 3. 减小自适应增益 \(\alpha\)	D6.5.4
包乱序导致波积分错误	UDP 包到达顺序不一致	1. 检查序列号 2. 加接收端排序缓冲 3. 丢弃乱序包	D6.8.5
能量罐持续缩放	罐初始值太低或充能不足	1. 增大 \(E_0\) 2. 检查充能率 3. 确认 master 端正常输入能量	D6.6.3
Wave integral 修复后仍有微漂移	数值精度累积	1. 使用 double 精度 2. 定期同步位置 3. 增大 \(K_{drift}\)	D6.7.2

场景	延迟	波阻抗 \(b\)	位置漂移	力反馈质量	建议
局域网遥操作	1-5 ms	\(b = 10\)	\(< 0.1\) mm	优秀	直接力反馈可能足够
5G 远程操作	10-50 ms	\(b = 20\)	0.1-1 mm	良好	波变量有明显优势
卫星通信	200-500 ms	\(b = 50\)	1-10 mm	一般	需位置漂移补偿
深空探测	3-22 min	—	严重	不可用	必须用监督式遥操作

库 / 工具	推荐版本	备注
Pinocchio	\(\ge\) 2.6.x	运动学和动力学计算
Eigen	\(\ge\) 3.4	矩阵运算和 SVD
MuJoCo	\(\ge\) 2.3.x	物理仿真验证
ROS2	Humble+	通信框架

D06 无源通信理论——散射变换、波变量与时延无源性¶

前置自测 ⭐¶

本章知识导航¶

前置知识桥接¶

如果跳过本章会怎样¶

本章目标¶

预计阅读时间¶

D6.1 从传输线到散射变换——物理直觉先行 ⭐⭐¶

D6.1.1 传输线类比的动机¶

D6.1.2 无损 LC 传输线方程¶

D6.1.3 力学-电气-波变量的三重类比¶

D6.1.4 传输线类比的深层物理意义——为什么"延迟不产生能量" ⭐⭐⭐¶

D6.1.5 从微波工程到遥操作——散射参数的历史脉络¶

D6.2 散射变换的完整定义与推导 ⭐⭐⭐¶

D6.2.1 散射波的定义¶

D6.2.2 逆变换¶

D6.2.3 功率恒等式——散射变换的核心性质 ⭐⭐⭐¶

D6.2.4 散射变换矩阵的逐步推导 ⭐⭐⭐¶

D6.2.5 散射矩阵与无源性等价¶

⚠️ 常见陷阱¶

练习¶

D6.3 波变量——Niemeyer-Slotine 的物理直觉 ⭐⭐¶

D6.3.1 波变量的完整定义¶

D6.3.2 通信协议¶

D6.3.3 Niemeyer-Slotine 完整证明——从定义到控制律 ⭐⭐⭐¶

D6.3.4 波域中的力/速度恢复¶

D6.4 任意常数时延下的无源性证明 ⭐⭐⭐¶

D6.4.1 问题陈述¶

D6.4.2 展开端口功率¶

D6.4.3 代入通信关系¶

D6.4.4 合并——最终结果¶

D6.4.5 证明的深层含义¶

D6.4.6 证明的数学结构——为什么如此简洁 ⭐⭐⭐¶

D6.4.7 与 D05 Llewellyn 分析的对比¶

⚠️ 常见陷阱¶

练习¶

D6.5 波阻抗 \(b\) 的选择——透明度与鲁棒性的权衡 ⭐⭐¶

D6.5.1 波阻抗的物理含义¶

D6.5.2 \(b\) 对系统行为的系统分析¶

D6.5.3 波阻抗 b 选择的权衡分析——透明性 vs 鲁棒性 ⭐⭐⭐¶

D6.5.4 波阻抗对传递阻抗 \(Z_{to}\) 的频域分析 ⭐⭐⭐¶

D6.5.5 经验值与自适应方案¶

⚠️ 常见陷阱¶

练习¶

D6.6 时变时延下的无源性破坏与修复 ⭐⭐⭐¶

D6.6.1 破坏机制¶

D6.6.2 破坏机制的完整推导 ⭐⭐⭐¶

D6.6.3 修复方案与网络卫生措施——完整推导与代码¶

D6.6.4 三种方案的 MATLAB/Python 对比仿真 ⭐⭐¶

D6.6.5 三种方案的深度分析与工程选型¶

⚠️ 常见陷阱¶

练习¶

D6.7 位置漂移问题与 Wave Integral ⭐⭐¶

D6.7.1 漂移的来源¶

D6.7.2 Wave Integral 修复——完整推导与实现（Niemeyer 1996/2004） ⭐⭐⭐¶

D6.7.3 位置漂移问题的深层数学分析 ⭐⭐⭐¶

D6.8 采样-保持效应与离散实现 ⭐⭐⭐¶

D6.8.1 从连续到离散的鸿沟¶

D6.8.2 离散实现的无源性分析 ⭐⭐⭐¶

D6.8.3 完整仿真代码——Python 端到端实现 ⭐⭐¶

D6.8.4 与 TDPA (D07) 的统一能量框架 ⭐⭐⭐¶

D6.8.5 工程实现注意事项¶

D6.9 前沿工作与开放问题 ⭐⭐⭐¶

D6.9.1 DLR KONTUR-2 空间遥操作¶

D6.9.2 不使用散射变换的替代方案¶

⚠️ 前沿工作的常见陷阱¶

D6.9.3 波变量在多 DOF 系统中的扩展 ⭐⭐⭐¶

D6.9.4 三通道波变量补偿架构（2024）⭐⭐⭐¶

D6.9.5 波变量的工程实现检查清单 ⭐⭐¶

D6.9.6 Chattering-Free TDPA 与波变量的融合前沿（2022-2025）⭐⭐⭐¶

D6.9.7 变旋转阻抗遥操作中的无源性保证（2024）⭐⭐⭐¶

D6.9.8 开放问题¶

D6.9.9 Time-Domain Passivity Approach 的 Energy Bounding 变种 ⭐⭐⭐¶

跨章综合练习¶

本章常见误解汇总¶

本章常见误解汇总¶

本章小结¶

术语速查表¶

波变量与经典反馈的统一视角 ⭐⭐⭐¶

波变量的经典问题与改进方法详解 ⭐⭐⭐¶