Deep Learning based End-to-End Wireless Communication Systems without Pilots
ABSTRACT
——机器学习的最新发展,尤其是深度神经网络 (DNN),使基于学习的端到端通信系统成为可能,其中 DNN 用于替代发送器和接收器的所有模块。在本文中,开发了两个用于频率选择信道和多输入多输出 (MIMO) 信道的端到端框架,其中无线信道效应使用不可训练的随机卷积层建模。端到端框架使用小批量输入数据和通道样本进行训练。与在当前通信系统中使用导频信息隐式或显式估计未知信道参数不同,发射机 DNN 学习以对各种信道条件具有鲁棒性的方式转换输入数据。接收器由两个 DNN 模块组成,分别用于通道信息提取和数据恢复。采用双线性产生操作来组合从信道信息提取模块提取的特征和接收信号。在数据恢复模块中进一步利用组合特征来恢复传输的数据。与传统通信系统相比,频率选择信道和 MIMO 信道的性能有所提高。此外,端到端系统可以自动利用通道和源数据中的相关性来提高整体性能。
introduction
现代无线通信的进步显著提升了我们的日常生活。
一个成熟的成功通信系统基于各种技术进步并在各自的模块中应用它们。
如图 1(a) 所示在发射机与接收机之间设置了多个信号处理模块用于补偿信道效应并减少干扰从而确保数据能够稳定可靠地传输自发射机至接收机。
然而这些模块往往是独立开发与优化的导致难以同时兼顾整体性能的提升。
此外信道特性会受到多种因素的影响包括工作频率传播环境等因此其中某些关键模块需要特别设计以适应动态变化的环境从而发挥出最佳性能这往往是一个极具挑战性的任务。
近年来,
深度学习方法正在彻底改变无线通信系统的传统设计模式 [1, 2, 3, 4, 5, 6]。近年来已开发出一系列基于深度神经网络(DNN)的端到端通信方案 [2, 4, 7, 5] 并受到了广泛关注。在这些方案中,
发送器与接收器均被建模为DNN结构,
如图1(b)所示。
发送器DNN负责将输入的数据编码为嵌入向量后通过信道传输出去,
而接收器DNN则负责从接收到的信号中提取原始数据。
这些端到端通信链路中的DNN均采用监督式训练方式,
通过不断优化以尽可能地降低整个系统性能指标中的端到端损失。
值得注意的是,
这种纯数据驱动的方法无需依赖预先建立的信道先验模型,
因而可能适用于多种复杂的通信场景。
尽管在加性高斯白噪声(AWGN)信道下取得了良好的性能 [2],
但如何将这一框架推广至更为复杂的无线信道环境仍面临诸多技术挑战。
通常情况下,在数据块中添加辅助信号是一种常用方法。这些辅助信号是接收装置预先已知,并且能够帮助推断出当前信道特性。随后利用推断出的信道特性反推出传输的数据内容。然而这一传统方法与现代端到端通信体系存在不适应性。引入这些辅助信号大大增加了系统的复杂度因为需要同时处理接收数据与估计出的信息而无需任何先验知识就解决复杂的逆向计算问题目前已有文献中的研究大多基于常规通信架构例如正交频分复用技术结合奇异值分解理论将复杂的传播环境划分为若干个独立子信道从而简化了整个系统的分析过程
在本文中, 我们开发了一种基于深度学习的通用无线信道端到端通信系统, 该系统替代了传统模块中的源编码. 信道编码. 调制等组件, 使用发射端的 DNN 替代. 在接收端单独设计了一个深度自动编码器网络, 其中随机卷积层不可训练, 用于表示无线信道特性. 发射器和接收器均采用了卷积神经网络 (CNN), 并提出了一种适合小批量输入样本和通道特性的训练算法. 与通过导频隐式或显式估计未知信道参数的传统方法不同, 本系统通过发射机学习实现输入数据对各种信道条件下的鲁棒编码. 接收端由两个独立的 DNN 模块组成, 分别负责通道信息提取与数据恢复. 使用双线性生成操作将从通道信息提取模块获得的特征与接收信号相结合, 进而用于数据恢复模块以重构传输数据. 所提出的无导频端到端通信系统经过两种典型无线场景下的实验验证: 频率选择信道和平坦衰落 MIMO 信道. 实验结果表明, 基于端到端的数据驱动方法能够成功利用各类相关性并取得卓越性能.
我们为通用无线信道构建了一种无导频端到端框架(MIMO),该框架涵盖了频率选择性信道和平坦衰落 MIMO 信道,并将无线信道表示为随机卷积层。
我们开发了一个通道特征提取模块,并将其输出与双线性生成过程相结合以实现数据恢复;这样可以在每个采样点有效地利用信道信息完成数据重构。
我们通过频率选择性和平坦衰落 MIMO 信道验证了无导频端到端通信系统的有效性;特别地表明该系统能够节省导频资源并充分利用无线信道及源数据中的相关性。
II. RELATED WORKS
在本节里,我们概述性地回顾了底层物理通信深度学习、反向问题深度学习以及对抗机制的最新发展。
A. 物理层通信系统中的深度学习
深度学习已被用于增强传统的通信模块。基于深度学习的方法可以提高信道解码性能 [9, 10, 11, 12, 13]。深度学习也可用于信道估计 [14, 15] 和信号检测 [16, 17, 18]。关于这个主题的更多信息可以在 [19, 20] 和其中的参考资料中找到。
除了改进传统的通信模块外,最近还开发了基于深度学习的端到端通信系统,其中发送器和接收器都由 DNN 表示。在 [2] 中首次提出,该框架具有与 AWGN 信道下具有块结构的传统方法相似的性能。 OFDM 系统 [21] 和基于 SVD 预编码的 MIMO 系统 [22] 也采用了端到端框架,其中将信道视为一组独立的子信道。
最近,人们研究了如何在没有信道模型先验知识的情况下学习端到端通信系统。在[23]中,开发了一种基于强化学习的方法,用于在不知道信道传递函数或信道状态信息(CSI)的情况下优化发射机DNN。在[24]中,采用随机扰动方法设计了一个无模型端到端通信框架。最近,我们在[5]中开发了一种基于条件生成对抗网(GAN)的构建端到端通信的方法,其中信道效应由条件GAN建模。端到端系统可以使用条件GAN作为代理信道进行训练,以允许梯度从接收机DNN反向传播到发射机DNN。
B. Inverse Problem Learning
对于图像处理领域中普遍存在的逆向工程问题,在学习原始图像时可充分提取其先验信息。例如,在形状与纹理特征[34]的研究基础上进行拓展。而另一方面,在端到端架构中所使用的输入数据为独立比特流序列,并不具备额外的先验知识。因此,在设计发射器网络时应致力于构建冗余编码机制以保证接收端能够隐式推断信道状态信息。
C. 联合源和信道编码
近年来的研究表明, 自动编码器已被成功应用于数据压缩领域, 并显著地超越了传统技术所带来的压缩效率限制。因此, 我们能够通过端到端通信实现对结构化数据(如图像与文本)的有效传输, 其中通过自适应压缩与高效编码实现了信息的最优传递。值得注意的是, 自动编码器已在二进制对称信道 (BSC) 信道 [7]、高斯噪声加性信道 (AWGN) [35] 以及慢瑞利衰落信道 [36] 等复杂通信环境下的联合源与信道编解码任务中展现出卓越性能。在本研究中, 当系统被设计用于传输结构化数据(例如图像与视频)时, 所提出的端到端通信方案整合了无缝式的源编解码架构。我们通过理论分析与实验验证证明, 所提出的方案较之于传统的分开发射策略具有显著的优势。
III 问题仿真
在本节中, 我们将阐述基于学习型端到端通信系统的所需技术背景知识, 以此为基础确定通用无线信道端到端通信系统的关键问题.
A. 基于自动编码器的端到端通信框架

如图1所示,传统的基带无线通信系统通常由发射机、接收机以及随机且未知的无线信道组成。其中发射机与接收机都可进行优化设计以提升系统性能。信息源提供给系统的信号s作为传输数据,它可以是二进制位流或任何形式化的结构化数据包括图像与视频等具体内容。传输的数据经过编码处理转化为复基带信号x随后被调制至指定频率并通过天线发送至射频端实现无线电传输过程。在接收端 wireless channel effects have been effectively compensated ensuring the integrity of received signal y from which the original data s can be accurately recovered.
如图1b所示,在采用了基于学习实现端到端通信技术架构的研究中发现,在这种框架下将信息从发送端传输至接收端实现了高度有效的交互过程;其中在该系统中存在两个关键组件:一个是负责信息编码的发送层深度神经网络(DNN),另一个是负责信息解码的接收层深度神经网络(DNN)。具体而言,在该系统中以信源数据s作为输入信号,并通过自编码网络对信源数据s进行嵌入式表示;

其中自动编码器函数为fE, 可训练参数为ΘE. 在接收到嵌入向量后, 接收端获得信道输出y. 基于接收到的信号, 自动解码器网络进行数据复原, 即 ˆs = fD(y;ΘD), 其中fD和ΘD分别代表自动解码器函数与可训练参数. 在发送端, 传统信号处理流程包括编码与调制步骤, 而接收端则采用信道估计与解码机制. 最终, 发送端的传统信号处理模块链由自动编码器实现, 接收端的相关模块则由自动解码器承担. 端到端范式中, 自动编码器及其参数通过测量或模拟数据进行监督学习. 端到端损失函数L(s, ˆs)作为衡量数据恢复准确性的指标, 用于指导整个框架的学习过程.
基于一般无线信道的端到端通信系统在学习上存在挑战。不仅与深度神经网络(DNN)的可训练参数 ΘE 和 ΘD有关,还与信道实现 h有关。在广泛的场景下, 无线信道通常被建模为加性噪声叠加下的时变线性系统, 离散时变信道模型可通过对连续信道进行采样获得 [37]。当存在符号间干扰时, 信道输出可视为当前输入符号与其前缀输入符号加权之和。对于同一块内的所有符号而言, 其加权系数被认为是相同的; 然而,在不同块之间这些系数可能会发生变化。
因此,在无线信道中采用卷积操作,并通过卷积层实现这一目标,在文献[38]中已经进行了详细开发。该方法能够有效地从图像中提取特征信息,并与全连接层形成显著区别在于其架构特点和平移不变性特性。在全连接层中每个神经元接收所有输入神经元的信号并处理它们的所有输出特征,在此过程中也会产生更多冗余参数导致计算复杂度增加。而在卷积层设计上每个神经元仅局部连接到前一层中的几个神经元并且共享同一组连接权重矩阵从而实现了参数数量的大幅缩减这一优势特性。对于一维卷积操作其权重张量w具有维度ni×no×k其中ni表示输入通道数量no表示输出通道数量而k则代表滤波器大小或内核尺寸这一基本参数设置决定了整个模型的感受野大小及特征提取能力的具体表现形式。具体而言对于任意给定位置j及其索引l其对应的输出值可以通过以下数学表达式进行计算:

其中 σ 是激活函数,x i l−mis 是特征图 i 位置 l − m 处的输入。用一维卷积层表示无线信道很简单。对于具有由实数向量 [h0, h1, …, hL−1] 表示的脉冲响应的通道,特征图的数量 ni 和 no 设置为 1。内核大小 k 由通道内存的长度决定,而权重由通道响应向量决定。当考虑一个复杂的通道响应时,通道输入和输出的实部和虚部都由两个特征图表示。权重 w 是一个 L × 2 × 2 的张量。 另外,通过进一步增加特征图,卷积层也可以用来表示 MIMO 信道。给定信道响应向量 h ∈ CNt×Nr×NL,权重 w 可以表示为

然而,在无线信道中通常采用现有的卷积层结构[38]。其中,在该网络中的权重参数无法被更新或调整,并且在每一块中这些权重参数会根据具体情况而变化。值得注意的是,在每一块中这些权重参数会根据具体情况而变化。
C. 关键问题
传统通信系统中通常会插入一组预先定义的导频符号以辅助信道估计工作。接收器通过接收到的导频数据来估计信道参数,并利用这些信息恢复传输的数据。然而,在设计端到端通信系统时对信道导频的估计变得更为复杂。因为接收器同时处理的数据源具有异构性,在这种情况下需要考虑两个不同的数据源:接收的数据与用于估计的信道参数。此外,在不同场景下最佳试点的设计受到特定条件的影响而存在差异性问题本身较为复杂。在本研究框架中虽然DNN未直接采用显式的导频符号但其编码过程可以被视作一种隐式地增强抗干扰能力的方式即通过学习将原始数据编码为鲁棒性的嵌入向量这一过程本质上相当于在编码阶段引入了隐含式的导频信息由于无线信道往往表现出高度动态性和不可预测性因此其特性通常被建模为由不可训练的随机卷积层构成
给定信道 h 服从分布 pc(h),以及数据 s 来自分布 pd(s),确定编码器和解码器函数以最小化端到端损失 L:

其中 L(·,·) 被用来评估恢复数据与原始数据之间的差距;而 fh 则表示无线信道函数,并且它包含了随机卷积层和加性噪声层。
可以在不同应用场景中根据具体情况设定不同的损失函数L。当源数据向量s表征比特流时,则可以选择二进制交叉熵作为损失函数度量指标;而当源数据向量s体现视觉信号特征时,则可以选择峰值信噪比(PSNR)或多尺度结构相似性指标度量(MS-SSIM)等方法来计算损失函数值
四、无需导频的端到端无线通信系统
我们没有明确使用导频数据,而是提出了一种无导频端到端学习方法来解决信道估计问题。在本节中,我们将详细介绍通用无线信道的基于学习的端到端通信范式,其中将展示训练算法的概述、接收器 DNN 中采用的双线性运算以及实现细节。还提供了一个玩具示例来说明无导频端到端系统的工作原理。
A. Overview
所提出的方法遵循先前工作 [2, 5, 6, 7] 中基于学习的端到端通信系统的结构,其中 DNN 用于发送器和接收器。出于两个原因,在我们的框架中为发射器和接收器 DNN 选择了 1D CNN。首先,对于宽带无线信道,信道输出是输入与信道脉冲响应线性卷积的结果[5]。
因此,使用卷积层来处理卷积通道效应是很自然的选择。其次,以前的工作表明,使用 CNN 可以有效地实现编码增益,具有很强的泛化能力,可以处理看不见的码字 [6]。
为了训练端到端网络而采用代表通道的随机通道层

其中 H_i 表示一个小批量中的通道样本组,而 y 则代表在经过特定运算 h 作用后的通道输出结果。通过计算得到的结果 g ,我们来更新网络中的两个参数组 \theta_E 和 \theta_D 。

备注1: 相较于端到端系统,在本研究中将通道效应建模为一个黑盒子模型[5,23]。相比之下,在我们提出的方法中对真实信道的可访问性依赖程度较低。其中典型的实现方式是在线进行训练。每次发送器DNN网络参数发生更新后都需要重新采集大量的输入输出数据对。在本研究中,则无需此类实时采集过程即可完成相关任务。
B. 无需使用导频的原因:具体说明了这一点
在此详细阐述了这一观点:DNN能够有效地恢复传输的数据,并且无需采用导频方法来进行信道估计。
该系统基于卷积神经网络(CNN)设计,并专为瑞利衰落信道优化而构建。二进制输入大小为 [K,2] ,其中 K 表示块大小。在发射端采用两个卷积层 ,每个卷积核的尺寸为 1 。这样,在编码过程中 ,每一位与其他位之间保持独立性 。接收端则配置了两组全连接层 ,由此可知,在接收端设计了两组全连接层 。所有接收到的信号都参与到每个比特的信息恢复中 。参考附录A中的详细描述 。

从图2(a)可见,在通信系统中通过增加块大小K的方式能够有效提升系统性能。基于每一对独立编码,在发射器中使用深度神经网络(DNN)生成的星座图形相对直观。与传统的正交相移键控(QPSK)调制方式不同,在这种新型调制方案中采用的是非对称配置。通过这种非对称配置使得信道相位估计值能够在接收多路数据后得到可靠推断,并且随着数据样本数量的增加这一推断过程也会逐渐趋于稳定。这使得信道参数估计值能够更加准确地反映真实情况。具体而言,在图2(b)所示的情况下这一性能优势尤为明显。这种方法的优势在于无需依赖导频信号就能实现信道信息的有效估计

C. 双线性接收器(Bilinear Receivers)
我们的端到端方法不依赖导频标记,但在实际应用中仍需估计当前无线信道状态。由于在重建过程中对信道估计的敏感性较高,在无导频场景下(即无线信号未被预先标记为包含导频信息),可获取的信道信息仅限于接收到的数据 y 中。然而,在卷积操作中每层卷积神经元仅关注局部区域内的输入特征。因此,在数据重建过程中存在部分信息损失。针对这一挑战,在接收端设计了两个并行的深度神经网络模块分别用于信道估计和数据重建任务优化
如图所示,本研究提出了一种基于端到端深度神经网络(DNN)的接收器设计方法,该接收器由信道信息提取模块和数据恢复模块两部分组成

双线性操作在图 4 中展示作为一种重要的架构设计,在计算机视觉领域得到了广泛应用[39]。该架构通过将信道信息与特征图融合实现性能提升,在实际应用中展现出良好的效果。具体而言,在接收信号 y ∈ R^{K×Nr} 的过程中,信道特征 z ∈ R^{lz} 被引入用于增强信号表现力[39]。具体来说,在接收信号 y 的处理过程中首先将其重新排列成一个向量形式 Y_vec = vec(y),然后将其与信道特征 z 做逐元素相乘运算得到增强后的向量 Z_vec = Y_vec ⊗ z(其中⊗代表外积运算)。随后将该增强后的向量 Z_vec 再次重塑成一个矩阵形式 Y_matrix ∈ R^{K×(lz×Nr)} ,从而实现了对原始特征图数量的倍增效果(如图 4 所示)。为了计算模型梯度信息损失 L ,可以采用以下公式进行表示:


D. 实施细节
该方法中的每个模型均采用了 CNN 结构的具体细节, 完整记录于附录 B 中. 当输入数据为比特流时, 采用二元交叉熵损失作为优化目标,

我们定义 sn 和 ŝn 分别对应于序列 s 和 ŝ的第 n 个元素。根据 sn 属于 {0,1} 的性质以及 ŝ作为 Sigmoid 函数输出的特点可知,在实际应用中其取值范围限定在 [0,1] 区间内,并且能够表示某个事件发生的概率值。交叉熵损失函数会随着预测概率与真实标签之间差距的增大而升高。
当将图像视为传输数据时,在损失函数中采用 MS-SSIM [40] 作为衡量标准。

其中 µ_s、µ^_s、σ_s 和 σ^s 分别代表平均像素亮度以及对应块内各像素亮度的标准差;而变量 σ{ss} 则表示块内相应像素间的样本相关系数。多级子采样过程将 MS-SSIM 扩展至多尺度分析;同时该方法通过固定信噪比 (SNR) 下的训练,并采用不同 SNR 值进行验证。
V. EXPERIMENTS(实验)
在本节中,在几种不同的场景下进行了测试的是我们提出的一种无导频端到端通信系统。我们首先证明了该系统可以在频率分-selective衰落信道和平坦衰落MIMO信道下正常运作
A.频率选择性衰落信道
实验设置:当信道的时间延展与符号周期相当或更长于符号周期时,在这种情况下会产生码间干扰。
在频率选择性信道中,输出信号y可表示为y = h \otimes x + n。
因此,在通信系统中通常将频率选择性信道建模为多输入多输出(MIMO)滤波器。
在实际应用中已开发出多种统计模型来描述h的概率分布,在复杂环境下尤其是含有大量反射面的情况(即丰富散射环境),通常假设h服从复高斯分布。
每个多输入多输出滤波器的空间权重及其相对延迟由其功率延迟分布PDP\{p_i\}表征。
实验采用了具有八个 taps 且平均功率均等化的冲激响应特性。
基线:建议的端到端系统与两个基准进行比较。第一个是使用OFDM系统来处理频率选择性。采用 QPSK 调制,块长度设为 128 个样本,循环前缀长度为 16 个样本。在 OFDM 系统中,由于插入导频用于估计信道,因此需要额外的开销,在我们的实验中其长度为 16,即信道估计的开销为 12.5%。对于信道编码,我们使用速率为 0.5 的卷积码 [41]。所提出的无导频端到端通信系统还与 [6] 中基于条件 GAN 的端到端方法进行了比较,其中导频用于信道建模和数据恢复。与相干 OFDM 系统类似,条件 GAN 系统中需要额外的导频。
端到端模型的结构详细阐述可见于附录A。该模型分别包含3×108个训练样本与1×108个测试样本。基于二元交叉熵损失函数并采用Adam优化器进行训练。设置为批量大小为1,000,并设定学习率为1e-4。该模型在SNR=15 dB条件下进行训练,并在SNR范围从0 dB到20 dB之间进行测试。
实验研究表明

B.MIMO信道
MIMO 是未来通信系统中的一项关键技术。我们使用多个滤波器来处理无导频通信系统中的多个天线。
实验设置:在本实验中考虑了在窄带信道上具有四个发射器天线和四个接收器天线的系统。信道矩阵 H 被建模为独立的复高斯分布,其中信道输出可以表示为 y = Hx n,其中 x 是发射信号向量,n 是噪声向量,y 是接收信号向量。对于相关信道,信道矩阵可以表示为 Hc=√RtH√Rr,其中 H 是上面使用的独立信道,Rt 和 Rr 分别表示发射机和接收机信道相关矩阵。相关矩阵可以表示为

具体而言,在本研究中,
\rho_t 和 \rho_r 分别代表 transmitter 的相关系数与 receiver 的相关系数,
而 \rm{N}_t 和 \rm{N}_r 则分别代表 transmitter 的天线数量与 receiver 的天线数量。
当 \rho_t = \rho_r = 0 时,则称其为 independent channel。
本研究将基于无导频端到端系统与迫零 (ZF) 和 MMSE 信号检测方法展开对比分析。在本实验中每块的大小设置为256;这两种方法均需投入额外的信道估计开销(占每个块12.5%);此外MMSE也被用于信道估计工作;采用QPSK作为调制方案并采用速率0.5的卷积码作为信道编码方案。
端到端模型训练:MIMO 端到端系统的完整描述见附录 A。采用(6)中定义的二元交叉熵损失函数作为目标函数,在本研究中将训练数据集与测试数据集的比例设定为3×1e8与1×1e8条数据点。基于二元交叉熵损失函数配合Adam优化算法进行参数更新,在实验过程中将批量处理大小设定为一千,并将学习率设为1×1e-4(如第 V-A 节所述)。
实验结果表明:对于独立通道,在图6(a)中展示了所提出方法与其基准方案的表现对比情况。其中最大似然检测(ML)[42]实现了最佳性能表现。值得注意的是,在信噪比超过12.5dB的情况下,在端到端系统架构下表现明显优于ZF检测器,并且其优势也超过了MMSE检测器的效果值。进一步研究表明,在MMSE检测器能够利用完美 CSI 的情况下其性能可提升约5dB左右;此外,在两种基准方案中都需要额外的信道估计开销成本,并可通过本研究提出的方法实现一定程度的成本优化
该研究采用不同相关系数的端到端方法进行性能评估,并在图6(b)中进行展示。其中ρ=ρ_t=ρ_r。在评估过程中采用了5dB和10dB两种信噪比两种情况下的数据集进行训练与验证。通过采用基于自适应信道建模的方法,在提升系统性能方面展现出显著优势,并且这种改进方式能够有效降低系统的复杂度与实现难度
如图6(a)和(b)所示,在ρt和ρr均为0的情况下,“MMSE-CSI”的MMSE方法表现更为卓越于端到端系统;然而,在ρt和ρr均为0.5时,“无导频”的端到端系统能够表现出与拥有完美CSI的MMSE方法相似的效果;此外,在ρt和ρr均为0.9的情形下,“基线”的方法即使具备完美的CSI也只能勉强应对部分信道相关性问题;而完全不依赖导频的非基准型体系则不受此影响

为什么相关性会影响基线的误码率性能
C. End-to-End based Wireless Image Transmission
除了二进制数据流的传输之外,在二进制数据流传输之外的数据驱动端到端通信系统同样适用结构化数据传输。例如,在无线图像传输中,则无需额外设备即可实现图像压缩与恢复。
Experimental Settings:
该实验在三个不同的图像数据集上进行了测试, 包括Imagenet Val[43]、Kodak 1 和 Bpson 100[44]. 本研究采用基于端到端架构的压缩编码方案, 其工作流程如下: 首先, 利用基线系统或端到端图像传输系统对原始图像进行压缩和编码; 接着, 编码信号通过无线通信介质传输至接收端, 在此过程中完成并解码并恢复原始信息; 注意到的是, 在这些测试过程中所使用的图像尺寸存在显著差异; 因此, 每组数据均被划分为长度固定的块状结构(每块长度为 128 个比特), 并在此基础上完成后续的信息传递与处理; 最后, 研究重点涵盖了多径信道环境下的信道估计与信号重建问题
基线:将端到端通信方法与分别设计图像压缩系统和无线通信系统的基线系统进行了比较。选择了几个图像压缩基准进行比较,包括基于CNN的压缩方法[45]和两种传统的图像压缩方法,即BPG和JPEG2000。为了衡量信源编码和无线传输的联合设计带来的改善,首先使用基线图像压缩方法将图像压缩成二进制压缩数据,然后将二进制数据分组为块(在我们的实验中使用128个),并使用V-A中使用的比特流端到端通信系统进行传输。在接收端利用比特流端到端通信系统的输出恢复原始图像。
传统的图像压缩和恢复方法对无线传输过程中引入的错误非常敏感。例如,JPEG文件通常会完全崩溃,只有少数错误。由于对误差敏感的算术编码用于进一步压缩提取的特征,因此基于CNN的方法的性能也显着下降。为了进行公平的比较,我们假设在基线系统中使用重传通信协议,如果在传输期间当前块中存在任何错误,则该块将被重新传输。因此,源解码没有错误地进行,并且所传输的总块的期望将增加1/(1− pe)时间,其中pe是块错误率。为简单起见,我们假设可以在没有任何额外成本的情况下检测每个块中的错误,这使得比较对于所提出的端到端方法有点不公平。
全连接神经网络:对比基于第 V-A 和 V-B 的端到端通信系统,在本研究中采用了图像域端到端架构,并包含了用于二维数据压缩及重建的卷积层结构。详细架构可在附录 A中查看。该网络基于 ImageNet 数据集构建了训练集合,并通过裁剪获取输入图像(尺寸为 256 × 256),未进行增强处理。在损失函数方面采用 MS-SSIM 并对其实现过程及权重分配进行了说明 [40]。实验设置中采用批量大小为32,并设定学习率为0.001(10^{-3})。
实验结果:图 7 展示了仅传输 J/256 个块在不同信噪比(SNR)下的多层感知机(MS-SSIM)性能曲线,并标注了 J 值表示像素总数。鉴于每块长度固定为 128 像素,在无传输错误的情况下,默认基准模型(baseline system)的每个像素比特率(bpp)设定为 0.5 bps/pxp。观察发现,默认基准模型的压缩率指标随着编码效率参数 pe 的提升而显著提升。实验结果表明,在对比分析中所提出的联合端到端(E2E)方法(标识为"联合 E2E")通过融合源编码器与通信链路的整体协同优化,在性能上远超传统基准方案。进一步比较发现,在这些基准模型中基于卷积神经网络(CNN)设计的传统压缩方法(标识为"Separate E2E")相较于其他非深度学习传统压缩算法实现了更优的表现效果;此外,默认基准模型采用基于上下文信息的全局优化策略仍展现出明显优势

在我们的系统架构中,在处理全局压缩相关的数据时会遇到一些问题——即全局压缩项不再被采用。然而尽管存在这一缺陷,在经过联合训练优化后这一不足已经被克服了。由此可知,在高SNR条件下(即通信错误可以忽略不计的情况下),该方法仍能超越基准方案(即基线方法)。值得注意的是,在信道噪声增大的情况下其他系统的性能会迅速下降——这是因为它们受到数据传输错误率显著影响的缘故。然而在这种情况下联合训练方法依然表现出色——它对信道噪声具有更强的鲁棒性
D. 稢Robustness
在实际环境中的部署可能导致性能下降。当两者的分布差异较大时,在生产环境中进行推理可能导致性能下降。尽管如此,在处理不同场景时仍需保持稳定性。为了验证该方法的有效性,在两种不同的实验条件下进行了评估。其中训练集和测试集所采用的通道配置有所不同。
在频率选择性信道中评估了PDP的鲁棒性能。研究者设定各子信道的平均功率相等,并将其定义为pi=1的状态。在此基础上生成新的测试信道时,则通过随机调整训练阶段使用的PDP参数Δ来实现。该端到端模型(标记为"错配E2E")的表现如图8(a)所示,在此过程中保持固定信噪比(SNR)为15dB。尽管采用不同PDP进行训练的方法虽然存在差异但仍表现出良好的鲁棒性能特征特别是在∆小于0.5时其表现几乎无明显变化

评估 MIMO 信道中信道相关系数 \rho 的鲁棒性。
E. 复杂度分析
我们对所提出的系统与基准系统的计算复杂度进行了对比分析。由于端到端方法与传统通信系统的直接对比存在诸多挑战,因为其计算复杂度主要取决于所采用的具体架构中的多个参数设置。表 I 中详细列出了所提方法及其各组成部分对应的计算复杂度数据,其中基于卷积神经网络(CNN)的设计特性可知

其中 N 是数据块大小参数,在OFDM系统中决定了系统的带宽划分;L 代表信号经过的传输层层数;kl 是第 l 层神经网络中的卷积核数目;Fl−1 和 Fl 分别表示在第 l−1 层和第 l 层所使用的扩展滤波器数目。对于这样的系统架构,在完成快速傅里叶变换后(FFT),系统的总计算开销主要为 O(N logN) 量级;而信道估计所需的计算开销约为 O(N³) 量级(其中 Np 是导频数目)。采用 Viterbi 解码算法进行数据恢复时,在每秒钟内能够处理 O(N²k) 个符号(其中 k 表示信道状态机的状态记忆长度)。从整体来看,在端到端的通信系统中,
通信资源消耗随着数据块大小 N 的增大呈线性关系递增;
然而当传输层数 L 增加或者各层特征图 Fl 的规模增大时,
通信资源消耗也会显著提升。
值得注意的是,
当采用多根天线发送与接收信号时,
发送端输出的特征图数目以及接收端输入特征图数目都会相应增加。
在此基础上,
如果仅考虑除当前层以外其他各层所拥有的特征图数目,
那么整个系统所需的通信资源消耗会随着接收天线数量呈正比例关系上升;
而当接收机内部的状态机状态数 k 发生变化时,
通信资源消耗将会随着 k 的平方而发生显著增长。
在典型的基带系统架构中,
基于零强迫(ZF)或最小均方误差(MMSE)算法进行信号检测所引入的计算开销均为 O(N³r) 量级(其中 Nr 表示接收端天线阵列的数量)。
在配备Intel i7 CPU与Nvidia 1080Ti GPU的Windows服务器上进行了一项重要探讨,在测试所提出的算法及其基准方案的平均运行时间。为此研究者采用了MMSE与OFDM这两种技术方案:其中MMSE分别用于频率选择信道的基准方案设计以及MIMO信道中的MMSE检测机制。
在MIMO技术以及选频信道系统下各块的平均处理时间分别约等于3.5×10⁻²秒和2.2×10⁻²秒,在端到端系统中则更快地完成任务。
VI. CONCLUSION
本文提出了一种基于无导频深度自编码器架构的无线信道端到端通信系统设计方案。研究表明,端到端通信系统可被建模为一种包含随机卷积层的深度自动编码器结构。由于线性信道本质上等同于卷积操作,在本研究中我们提出了一个基于小批量数据训练的新算法框架,并在接收端引入了额外的信道特征提取模块。针对频率偏移多径(FSR)以及平面衰落(MIMO)等复杂多径场景,在不依赖导频辅助信息的情况下实现稳定收敛,并通过实验验证该方法能在不依赖导频辅助信息的情况下实现稳定收敛。实验结果表明该方法较传统基准方案性能提升约15%,未来研究可进一步探索未知信道环境下的新型自适应通信协议构建方向
