DCT--离散余弦变换
1 DCT简介
离散余弦变换(DCT)通过将有限序列表示为不同频率振荡的余弦函数之和来进行数据建模。 Nasir Ahmed首次提出这一转换技术于1972年,并成为信号处理与数据压缩领域的核心工具之一。它在数字图像领域中采用的方式包括JPEG格式及HEIF格式,在数字视频领域则采用 MPEG编码方案及H.26x编码方案,在数字音频领域采用的压缩格式有杜比数字音效、MP3以及AAC格式,在数字电视领域覆盖了SDTV、HDTV等传统电视节目类型,在广播领域则采用AAC+与DAB+两种格式进行信息传递。此外,在科学与工程等多个领域也有重要应用,在数字信号处理与通信设备方面具有显著优势,并有效减少了网络带宽消耗;同时在求解偏微分方程的数值方法中也被广泛应用
与离散傅里叶变换(DFT)相似的是另一种傅里叶相关变换——离散余弦变换(DCT),它仅使用实数。这种变换通常与其对应的具有周期性和偶数对称扩展序列的傅里叶级数系数相关。相比之下,离散傅里叶变换(DFT)则与其相关的周期性扩展序列的傅里叶级数系数相对应。这相当于对其输入数据进行两次延拓后应用一个长度约为其两倍的快速傅里叶变换(FFT)。特别地,在实际应用中常用于处理具有偶数对称性的实数值数据。值得注意的是,在一些变体中,默认情况下输入和输出数据会被提前或延迟半个采样周期。
离散余弦变换的主要变体是II型DCT(简称DCT),最初由艾哈迈德提出。其反变换形式即为III型DCT,并通常被称为逆DCT或IDCT。与之相关的还包括离散正弦变换(简称DST),它等价于实数与奇函数相关的傅里叶变换(简称DFT)。为了将一维信号扩展到多维空间进行分析与建模,则发展了多维离散余弦转换(MD DCT)。多种算法被开发用于计算多维余弦转换,并已取得显著成果以降低其实现复杂度。其中一种重要方法是整数余弦转换(Int-DFT),它提供了标准余弦转换的有效整数近似方案并被广泛应用于多个国际信息压缩标准中
改进后的Markdown文本
注
2 DCT应用
DCT 广泛用于许多应用,其中包括:
音频信号处理— 音频编码、音频数据压缩(有损和无损环绕声回声和反馈消除、音素识别、时域混叠消除(TDAC
数字音频[1]
数字收音机—数字音频广播(DAB+), HD 收音机
语音处理—语音编码语音识别,语音活动检测(VAD)
数字电话— IP 语音 (VoIP)、移动电话、视频电话 电话会议、视频会议
生物识别—指纹定向、面部识别系统、生物识别水印、基于指纹的生物识别水印、掌纹识别/识别
人脸检测—人脸识别
计算机和互联网—万维网,社交媒体, 互联网视频
网络带宽使用率降低
消费电子产品 —多媒体系统,多媒体电信设备,消费类设备
密码学 —加密,隐写术,版权保护
数据压缩—转换编码、有损压缩、 无损压缩
编码操作 —量化、感知加权、熵编码、变量编码
数字媒体—数字发行
流媒体 — 流媒体音频、流媒体视频、流媒体电视、视频点播 (VOD)
伪造检测
地球物理瞬态电磁学(瞬态电磁学)
图像—艺术家识别 焦点和模糊度测量 特征提取
颜色格式化 — 格式化亮度和色差、颜色格式(如 YUV444 和 YUV411)、解码操作,如显示颜色格式(YIQ、YUV、RGB)之间的反操作
数码成像— 数码图像、数码相机、数码摄影高动态范围成像
图像压缩—图像文件格式, 多视图图像压缩, 渐进式图像传输
图像处理—数字图像处理、[1] 图像分析、基于内容的图像检索、拐角检测、 方向块图像表示、边缘检测、图像增强、 图像融合、 图像分割、插值、图像噪声水平估计、 镜像、 旋转、刚好可见的失真 (JND)轮廓,时空掩蔽效应,中央凹成像
图像质量评估 — 基于 DCT 的质量降级指标 (DCT QM)
图像重建 — 定向纹理自动检查、图像恢复、内绘画、视觉恢复
医疗技术
心电图— 矢量心电图 (VCG)
医学影像学 — 医学影像压缩、影像融合、水印、脑肿瘤加压分类
模式识别
感兴趣区域(ROI) 提取
信号处理—数字信号处理、数字信号处理器 (DSP)、DSP软件、多路复用、信令、控制信号、模数转换 (ADC)、[1] 压缩采样、DCT 金字塔误差隐蔽、下采样、升采样、信噪比(SNR) 估计、传输复用、维纳滤波器
复合头孢子特征分析
直流输电滤波
监视[48]
车载黑匣子摄像机
视频
数字电影 —数字电影摄影, 数字电影摄影机,视频编辑, 电影编辑, 杜比数字音频
数字电视(DTV - 数字电视广播,标清电视(SDTV),高清电视(HDTV),HDTV编码器/解码器芯片,超高清电视(UHDTV
数字视频— 数字多功能光盘 (DVD), 高清视频
视频编码—视频压缩、[1]视频编码标准、运动估计、运动补偿、 帧间预测、 运动矢量、 3D 视频编码、 局部失真检测概率 (LDDP) 模型、 运动目标检测、 多视图视频编码 (MVC)
视频处理—运动分析, 3D-DCT 运动分析, 视频内容分析,数据提取,视频浏览,专业视频制作
水印-数字水印,图像水印,视频水印,3D视频水印,可逆数据隐藏,水印检测
无线技术
移动设备 — 移动电话、智能手机可视电话
射频技术 —射频工程,孔径阵列, 波束成形,数字算术电路, 方向感测, 空间成像
无线传感器网络(WSN) — 无线声学传感器网络
