小波变换在时序预测中的应用

在时序预测研究中,傅里叶变换(FT)长期作为频率分析的核心工具,但它无法同时兼顾时域与频域的局部化信息——这一缺陷成为多尺度周期检测的关键瓶颈。小波变换(Wavelet Transform,WT)通过“伸缩平移”的灵活基函数设计,完美弥补了这一不足,成为捕捉时序数据全局趋势与局部细节的核心技术。本文将从数学本质出发,系统解析小波变换的原理、性质及在时序预测中的应用,为TimesNet模型的多尺度周期检测融合提供理论支撑。

相关阅读:从傅里叶变换到快速傅里叶变换

Hyplus目录

1 从傅里叶变换到小波变换

要理解小波变换的价值,需先明确傅里叶变换的局限性。

1.1 傅里叶变换的缺陷

对于平方可积信号f(t) \in L^2(\mathbb{R})(时序数据常用假设),连续傅里叶变换(CFT)定义为:

\hat{f}(\omega) = \int_{\mathbb{R}} f(t) \text{e}^{-\text{i}\omega t} \text{d}t

其中\omega为角频率,\text{e}^{-\text{i}\omega t} = \cos(\omega t) - \text{i}\sin(\omega t)是全域振荡的基函数。其逆变换为:

f(t) = \frac{1}{2\pi} \int_{\mathbb{R}} \hat{f}(\omega) \text{e}^{\text{i}\omega t} \text{d}\omega

傅里叶变换的核心问题在于时域局部化缺失:

  • \hat{f}(\omega)仅反映信号中频率\omega的整体强度,无法告知该频率成分在哪个时间点出现(例如,一个包含1Hz和5Hz的信号,FT无法区分“1Hz先出现、5Hz后出现”与“两者同时出现”的差异)。
  • 对于突变信号(如时序数据中的异常点、周期切换点),FT的基函数因全域振荡,会产生严重的“频谱泄漏”,导致频率分析失真。

1.2 小波变换的核心思想

小波变换的本质是用局部化的基函数小波) 替代傅里叶变换的全域基函数。这类基函数满足两个关键条件:

  • 零均值性(保证振荡性):\int_{\mathbb{R}} \psi(t) \text{d}t = 0,即小波函数在时域内正负振荡抵消,仅对局部信号变化敏感。
  • 快速衰减性(保证局部性):\psi(t)在时域内仅在有限区间内有非零值(或快速趋于零),例如高斯小波\psi(t) = (1 - t^2)\text{e}^{\frac{-t^2}2}

通过伸缩(尺度)和平移操作,可从母小波\psi(t)生成一组覆盖全时域-频域的基函数:

\psi_{a,b}(t) = \frac{1}{\sqrt{|a|}} \psi\left( \frac{t - b}{a} \right)

其中各参数的详细解释如下:

  • a \in \mathbb{R} \setminus \{0\}尺度参数:控制小波的“宽度”与频率——|a|越小,小波越窄,对应高频(捕捉局部细节,如短期波动);|a|越大,小波越宽,对应低频(捕捉全局趋势,如长期周期);
  • b \in \mathbb{R}平移参数:控制小波在时域的位置,用于定位信号特征的出现时间;
  • \frac{1}{\sqrt{|a|}}能量归一化因子:保证不同尺度下小波的能量恒定(\int_{\mathbb{R}} |\psi_{a,b}(t)|^2 \text{d}t = \int_{\mathbb{R}} |\psi(t)|^2 \text{d}t),避免尺度变化导致系数幅值失真。

2 小波变换的定义

根据尺度与平移参数的取值方式,小波变换分为连续小波变换与离散小波变换,前者侧重理论分析,后者侧重工程应用。

2.1 连续小波变换

对于信号f(t) \in L^2(\mathbb{R}),其连续小波变换(Continuous Wavelet Transform,CWT)定义为信号与小波基的内积:

W_f(a,b) = \langle f, \psi_{a,b} \rangle = \int_{\mathbb{R}} f(t) \cdot \overline{\psi_{a,b}(t)} \text{d}t = \frac{1}{\sqrt{|a|}} \int_{\mathbb{R}} f(t) \cdot \overline{\psi\left( \frac{t - b}{a} \right)} \text{d}t

其中“\overline{\cdot}”表示复共轭(实小波可省略)。

CWT的物理意义:W_f(a,b)的幅值越大,说明信号f(t)尺度a(对应频率\omega \propto \frac{1}{a})和位置b处的特征与小波\psi_{a,b}(t)越相似。【例】当a较小时(高频),W_f(a,b)大值对应信号的局部突变(如时序异常点);当a较大时(低频),W_f(a,b)大值对应信号的全局趋势(如长期周期)。

CWT的逆变换(重构):若小波满足可容许性条件\int_{\mathbb{R}} \frac{|\hat{\psi}(\omega)|^2}{|\omega|} \text{d}\omega < \infty,保证基函数的完备性),则信号可由CWT重构:

f(t) = \frac{1}{C_{\psi}} \int_{\mathbb{R}} \int_{\mathbb{R} \setminus \{0\}} W_f(a,b) \cdot \psi_{a,b}(t) \cdot \frac{\text{d}a \text{d}b}{a^2}

其中C_{\psi} = \int_{\mathbb{R}} \frac{|\hat{\psi}(\omega)|^2}{|\omega|} \text{d}\omega为小波的容许常数

2.2 离散小波变换

CWT的尺度a和平移b连续取值,导致变换结果存在严重冗余(数据量远大于原信号),无法直接用于工程计算。离散小波变换(Discrete Wavelet Transform,DWT)通过对ab进行离散采样,解决了冗余问题,有效实现降维与高效计算,成为时序数据处理的核心工具。

2.2.1 二进离散采样

二进离散采样是最常用的离散策略,用于保证基函数的正交性(减少冗余)和覆盖性(不遗漏信息),通常采用:

a = a_0^j,\ b = b_0 \cdot a_0^j \cdot k \quad (j, k \in \mathbb{Z})

其中a_0 > 1(通常取 a_0 = 2,即二进尺度),b_0为基平移步长(通常取b_0 = 1)。当a_0 = 2b_0 = 1时,离散小波基简化为:

\psi_{j,k}(t) = 2^{-\frac{j}{2}} \psi\left( 2^{-j} t - k \right)

此时:

  • 尺度j对应频率:\omega_j \propto 2^jj增大,频率降低,尺度变粗)。
  • 平移k对应时域位置:t_k = k \cdot 2^jj增大,平移步长增大,时域分辨率降低)。

2.2.2 多分辨率分析

离散小波变换的本质是通过多分辨率分析(Multi-Resolution Analysis,MRA)将信号分解为“低频逼近”与“高频细节”的叠加,这一过程完美匹配时序预测的“多尺度周期检测”需求。

MRA的核心思想:将信号空间L^2(\mathbb{R})分解为一系列嵌套的子空间\{V_j\}_{j \in \mathbb{Z}},满足:

\cdots \subset V_{2} \subset V_{1} \subset V_{0} \subset V_{-1} \subset V_{-2} \subset \cdots

其中:

  • V_j为尺度j逼近空间:包含信号在尺度j下的低频成分(全局趋势)。
  • f(t) \in V_j,则f(2t) \in V_{j-1}(尺度伸缩对应空间嵌套)。
  • 所有子空间的并集稠密于L^2(\mathbb{R})\overline{\bigcup_{j \in \mathbb{Z}} V_j} = L^2(\mathbb{R})),交集为零空间(\bigcap_{j \in \mathbb{Z}} V_j = \{0\}),保证无信息丢失。

为分离不同尺度的细节,定义细节空间W_jV_jV_{j-1}中的正交补空间:

V_{j-1} = V_j \oplus W_j, \quad V_j \perp W_j

其中W_j包含信号在尺度j下的高频成分(局部细节)。由此可递归得到信号的多尺度分解:

V_0 = V_1 \oplus W_1 = V_2 \oplus W_2 \oplus W_1 = \cdots = V_N \oplus W_N \oplus W_{N-1} \oplus \cdots \oplus W_1

对应到离散信号(时序数据常用),若原信号属于V_0,则其DWT分解为:

f = A_N + D_N + D_{N-1} + \cdots + D_1

其中:

  • A_N:第N低频逼近系数(对应全局趋势,如长期周期);
  • D_jj=1,2,\cdots,N):第j高频细节系数(对应局部波动,如短期周期、异常点)。

这一分解过程的计算可通过双正交滤波器组高效实现(Mallat算法),无需直接计算积分,复杂度仅为O(N)N为信号长度),为大规模时序数据处理提供可能。


3 小波变换的关键性质

小波变换的4个核心性质,使其成为TimesNet模型“多尺度周期检测融合”的理想工具,尤其能与FFT形成互补,非常适配时序预测。

3.1 时域-频域双局部性

傅里叶变换仅能在频域局部化(时域全域),而小波变换通过伸缩平移实现时域与频域的双局部化:

  • 时域局部性:由小波\psi(t)的快速衰减性保证,其有效支撑集(非零值区间)长度\Delta t有限。
  • 频域局部性:由小波的傅里叶变换\hat{\psi}(\omega)的快速衰减性保证,其有效支撑集长度\Delta \omega有限。
  • 不确定性原理约束\Delta t \cdot \Delta \omega \geq \frac12,但小波可通过调整形状(如墨西哥帽小波、Daubechies小波)在“时域分辨率”与“频域分辨率”间灵活权衡——高频时(a小)时域分辨率高、频域分辨率低(适合捕捉短期突变),低频时(a大)频域分辨率高、时域分辨率低(适合捕捉长期周期)。

这一性质完美匹配时序预测的需求:FFT负责捕捉全局周期(频域分辨率高),小波变换负责定位周期的时域分布(时域分辨率高),两者结合可实现“全局周期+局部细节”的完整分析。

3.2 多分辨率特性

通过MRA的分层分解,小波变换可在不同尺度下分析信号:

  • 高层细节D_1, D_2(小j):高频成分,对应时序数据的短期波动(如日内周期、突发噪声)。
  • 低层细节D_{N-1}, D_N(大j):中频成分,对应时序数据的中期周期(如周度周期、月度周期)。
  • 低频逼近A_N:低频成分,对应时序数据的长期趋势(如年度周期、全局趋势)。

这种多分辨率特性可直接支撑“多尺度周期检测”——无需依赖单一尺度的周期假设,而是通过不同层的系数提取多尺度周期模式。

3.3 稀疏表示性

对于时序数据中的局部突变(如异常点、周期切换点)或分段平滑信号,小波变换的系数具有稀疏性:

  • 平滑区域:小波系数幅值小(信号无显著变化,与小波基的相似性低)。
  • 突变区域:小波系数幅值大(信号剧烈变化,与小波基的相似性高)。

这种稀疏性可用于:

  • 噪声去除:将小幅值系数置零(噪声通常对应小系数),再通过逆变换重构信号,保留有效周期特征;
  • 周期显著性评估:大幅值系数对应的尺度与位置,即为信号的显著周期及其时域分布。(可用于实现“频率掩码机制”,增强重要频率成分的权重)

3.4 平移不变性

部分小波

传统DWT(如基于Daubechies小波的正交DWT)因采样平移步长随尺度增大而增大,存在平移敏感性(信号微小平移导致系数大幅变化)。而双正交小波或冗余小波变换(如小波包变换)可通过放松正交性,实现近似的平移不变性——信号平移时,系数的相对分布不变,仅整体平移。

这一性质对周期检测的鲁棒性至关重要:时序数据的轻微时间偏移(如采集延迟)不会导致周期判断失效,可提升“周期一致性验证”的可靠性。


4 小波变换在时序预测中的应用

小波变换的特性可直接支撑TimesNet模型今后的改进,以下从具体应用场景展开。

4.1 多尺度周期检测

FFT的优势是全局频率分辨率高,可准确捕捉信号的主周期(如年度周期),但无法定位周期的时域变化(如某季度周期消失);小波变换的优势是时域-频域双局部化,可捕捉周期的局部变化(如短期周期的出现/消失)。

两者结合的具体方案:

  1. 用FFT分析信号的全局频率谱\hat{f}(\omega),确定候选主周期\omega_1, \omega_2, \cdots, \omega_k
  2. 对信号进行DWT分解,得到多尺度细节系数D_1 \sim D_N
  3. 计算各细节层D_j对应的频率范围(\omega_j \propto 2^j),将FFT得到的主周期\omega_m匹配到对应的细节层。
  4. 分析匹配层的小波系数幅值分布,确定主周期在时域的有效区间(如D_3层系数大值对应季度周期的活跃时间段),实现“全局周期+局部时域定位”的融合检测。

4.2 频率掩码与周期权重

基于小波系数的显著性评估

小波系数的幅值直接反映对应尺度-位置特征的显著性,可用于设计“可学习的频率掩码机制”:

  1. 对DWT分解后的各层系数A_N, D_N, \cdots, D_1,计算每层的 “能量归一化幅值”,如下所示,其中S_j表示第j层细节(对应某一频率范围)的能量占比,即该频率的显著性权重:
S_j = \frac{\sum\limits_{k} |D_j(k)|^2}{\sum\limits_{m=1}^N \sum_{k} |D_m(k)|^2 + |A_N(k)|^2} \quad (j=1,\cdots,N)
  1. S_j作为频率掩码的初始权重,再通过神经网络(如TimesNet的Inception块)学习调整,增强重要频率(高S_j)的贡献,抑制噪声频率(低S_j)。由此实现“频率掩码机制”和“置信度加权”。

4.3 周期一致性验证

为提升周期检测的鲁棒性,可采用多小波基交叉验证策略,利用不同小波的特性互补:

  1. 选择3种典型小波基,如Daubechies-4小波(正交,计算高效)、Symlet-8小波(近似对称,平移敏感性低)、Coiflet-6小波(逼近系数精度高)等。
  2. 用3种小波分别对信号进行DWT分解,得到3组多尺度系数。
  3. 对每组系数,提取显著周期(基于系数幅值),并计算周期的一致性得分,如下所示,其中\Omega_i为第i种小波检测到的显著周期集合,I(\cdot)为指示函数(存在则为1,否则为0):
C(\omega) = \frac{1}{3} \sum\limits_{i=1}^3 I\left( \omega \in \Omega_i \right)
  1. 保留C(\omega) \geq 2的周期(至少两种小波验证通过),剔除仅单种小波检测到的周期(可能为噪声),提升周期检测的鲁棒性。

5 参考资料

经典教材:

  • Ingrid Daubechies. 《Ten Lectures on Wavelets》(小波分析的奠基性著作,详细推导MRA与DWT的数学理论)
  • C. K. Chui. 《Wavelets: A Tutorial in Theory and Applications》(系统介绍小波变换的工程应用,含时序分析案例)
  • Robert H. Shumway, David S. Stoffer. 《Time Series Analysis and Its Applications》(时序分析权威教材,第4章专门介绍小波在时序预测中的应用)。

关键论文:

  • Mallat, S. G. 《A Theory for Multiresolution Signal Decomposition: The Wavelet Representation》(提出MRA框架与Mallat算法,奠定 DWT 的工程应用基础)
  • Donoho, D. L. 《De-noising by Soft-thresholding》(基于小波系数稀疏性的噪声去除方法,为周期检测的预处理提供思路)

工程指南:

  • MATLAB Wavelet Toolbox Documentation(含小波分解、重构的可视化案例,帮助直观理解多尺度特性)
  • Python pywt库官方教程(开源工具,适合快速验证小波变换的时序分析效果)

《小波变换在时序预测中的应用》有1条评论

  1. Pingback: TimesNet及其后续改进 – Hyperplasma

发表评论