在时序预测研究中,傅里叶变换(FT)长期作为频率分析的核心工具,但它无法同时兼顾时域与频域的局部化信息——这一缺陷成为多尺度周期检测的关键瓶颈。小波变换(Wavelet Transform,WT)通过“伸缩平移”的灵活基函数设计,完美弥补了这一不足,成为捕捉时序数据全局趋势与局部细节的核心技术。本文将从数学本质出发,系统解析小波变换的原理、性质及在时序预测中的应用,为TimesNet模型的多尺度周期检测融合提供理论支撑。
相关阅读:从傅里叶变换到快速傅里叶变换
1 从傅里叶变换到小波变换
要理解小波变换的价值,需先明确傅里叶变换的局限性。
1.1 傅里叶变换的缺陷
对于平方可积信号f(t) \in L^2(\mathbb{R})
(时序数据常用假设),连续傅里叶变换(CFT)定义为:
\hat{f}(\omega) = \int_{\mathbb{R}} f(t) \text{e}^{-\text{i}\omega t} \text{d}t
其中\omega
为角频率,\text{e}^{-\text{i}\omega t} = \cos(\omega t) - \text{i}\sin(\omega t)
是全域振荡的基函数。其逆变换为:
f(t) = \frac{1}{2\pi} \int_{\mathbb{R}} \hat{f}(\omega) \text{e}^{\text{i}\omega t} \text{d}\omega
傅里叶变换的核心问题在于时域局部化缺失:
\hat{f}(\omega)
仅反映信号中频率\omega
的整体强度,无法告知该频率成分在哪个时间点出现(例如,一个包含1Hz和5Hz的信号,FT无法区分“1Hz先出现、5Hz后出现”与“两者同时出现”的差异)。- 对于突变信号(如时序数据中的异常点、周期切换点),FT的基函数因全域振荡,会产生严重的“频谱泄漏”,导致频率分析失真。
1.2 小波变换的核心思想
小波变换的本质是用局部化的基函数(小波) 替代傅里叶变换的全域基函数。这类基函数满足两个关键条件:
- 零均值性(保证振荡性):
\int_{\mathbb{R}} \psi(t) \text{d}t = 0
,即小波函数在时域内正负振荡抵消,仅对局部信号变化敏感。 - 快速衰减性(保证局部性):
\psi(t)
在时域内仅在有限区间内有非零值(或快速趋于零),例如高斯小波\psi(t) = (1 - t^2)\text{e}^{\frac{-t^2}2}
。
通过伸缩(尺度)和平移操作,可从母小波\psi(t)
生成一组覆盖全时域-频域的基函数:
\psi_{a,b}(t) = \frac{1}{\sqrt{|a|}} \psi\left( \frac{t - b}{a} \right)
其中各参数的详细解释如下:
a \in \mathbb{R} \setminus \{0\}
为尺度参数:控制小波的“宽度”与频率——|a|
越小,小波越窄,对应高频(捕捉局部细节,如短期波动);|a|
越大,小波越宽,对应低频(捕捉全局趋势,如长期周期);b \in \mathbb{R}
为平移参数:控制小波在时域的位置,用于定位信号特征的出现时间;\frac{1}{\sqrt{|a|}}
为能量归一化因子:保证不同尺度下小波的能量恒定(\int_{\mathbb{R}} |\psi_{a,b}(t)|^2 \text{d}t = \int_{\mathbb{R}} |\psi(t)|^2 \text{d}t
),避免尺度变化导致系数幅值失真。
2 小波变换的定义
根据尺度与平移参数的取值方式,小波变换分为连续小波变换与离散小波变换,前者侧重理论分析,后者侧重工程应用。
2.1 连续小波变换
对于信号f(t) \in L^2(\mathbb{R})
,其连续小波变换(Continuous Wavelet Transform,CWT)定义为信号与小波基的内积:
W_f(a,b) = \langle f, \psi_{a,b} \rangle = \int_{\mathbb{R}} f(t) \cdot \overline{\psi_{a,b}(t)} \text{d}t = \frac{1}{\sqrt{|a|}} \int_{\mathbb{R}} f(t) \cdot \overline{\psi\left( \frac{t - b}{a} \right)} \text{d}t
其中“\overline{\cdot}
”表示复共轭(实小波可省略)。
CWT的物理意义:W_f(a,b)
的幅值越大,说明信号f(t)
在尺度a
(对应频率\omega \propto \frac{1}{a}
)和位置b
处的特征与小波\psi_{a,b}(t)
越相似。【例】当a
较小时(高频),W_f(a,b)
大值对应信号的局部突变(如时序异常点);当a
较大时(低频),W_f(a,b)
大值对应信号的全局趋势(如长期周期)。
CWT的逆变换(重构):若小波满足可容许性条件(\int_{\mathbb{R}} \frac{|\hat{\psi}(\omega)|^2}{|\omega|} \text{d}\omega < \infty
,保证基函数的完备性),则信号可由CWT重构:
f(t) = \frac{1}{C_{\psi}} \int_{\mathbb{R}} \int_{\mathbb{R} \setminus \{0\}} W_f(a,b) \cdot \psi_{a,b}(t) \cdot \frac{\text{d}a \text{d}b}{a^2}
其中C_{\psi} = \int_{\mathbb{R}} \frac{|\hat{\psi}(\omega)|^2}{|\omega|} \text{d}\omega
为小波的容许常数。
2.2 离散小波变换
CWT的尺度a
和平移b
连续取值,导致变换结果存在严重冗余(数据量远大于原信号),无法直接用于工程计算。离散小波变换(Discrete Wavelet Transform,DWT)通过对a
和b
进行离散采样,解决了冗余问题,有效实现降维与高效计算,成为时序数据处理的核心工具。
2.2.1 二进离散采样
二进离散采样是最常用的离散策略,用于保证基函数的正交性(减少冗余)和覆盖性(不遗漏信息),通常采用:
a = a_0^j,\ b = b_0 \cdot a_0^j \cdot k \quad (j, k \in \mathbb{Z})
其中a_0 > 1
(通常取 a_0 = 2
,即二进尺度),b_0
为基平移步长(通常取b_0 = 1
)。当a_0 = 2
、b_0 = 1
时,离散小波基简化为:
\psi_{j,k}(t) = 2^{-\frac{j}{2}} \psi\left( 2^{-j} t - k \right)
此时:
- 尺度
j
对应频率:\omega_j \propto 2^j
(j
增大,频率降低,尺度变粗)。 - 平移
k
对应时域位置:t_k = k \cdot 2^j
(j
增大,平移步长增大,时域分辨率降低)。
2.2.2 多分辨率分析
离散小波变换的本质是通过多分辨率分析(Multi-Resolution Analysis,MRA)将信号分解为“低频逼近”与“高频细节”的叠加,这一过程完美匹配时序预测的“多尺度周期检测”需求。
MRA的核心思想:将信号空间L^2(\mathbb{R})
分解为一系列嵌套的子空间\{V_j\}_{j \in \mathbb{Z}}
,满足:
\cdots \subset V_{2} \subset V_{1} \subset V_{0} \subset V_{-1} \subset V_{-2} \subset \cdots
其中:
V_j
为尺度j
的逼近空间:包含信号在尺度j
下的低频成分(全局趋势)。- 若
f(t) \in V_j
,则f(2t) \in V_{j-1}
(尺度伸缩对应空间嵌套)。 - 所有子空间的并集稠密于
L^2(\mathbb{R})
(\overline{\bigcup_{j \in \mathbb{Z}} V_j} = L^2(\mathbb{R})
),交集为零空间(\bigcap_{j \in \mathbb{Z}} V_j = \{0\}
),保证无信息丢失。
为分离不同尺度的细节,定义细节空间W_j
为V_j
在V_{j-1}
中的正交补空间:
V_{j-1} = V_j \oplus W_j, \quad V_j \perp W_j
其中W_j
包含信号在尺度j
下的高频成分(局部细节)。由此可递归得到信号的多尺度分解:
V_0 = V_1 \oplus W_1 = V_2 \oplus W_2 \oplus W_1 = \cdots = V_N \oplus W_N \oplus W_{N-1} \oplus \cdots \oplus W_1
对应到离散信号(时序数据常用),若原信号属于V_0
,则其DWT分解为:
f = A_N + D_N + D_{N-1} + \cdots + D_1
其中:
A_N
:第N
层低频逼近系数(对应全局趋势,如长期周期);D_j
(j=1,2,\cdots,N
):第j
层高频细节系数(对应局部波动,如短期周期、异常点)。
这一分解过程的计算可通过双正交滤波器组高效实现(Mallat算法),无需直接计算积分,复杂度仅为O(N)
(N
为信号长度),为大规模时序数据处理提供可能。
3 小波变换的关键性质
小波变换的4个核心性质,使其成为TimesNet模型“多尺度周期检测融合”的理想工具,尤其能与FFT形成互补,非常适配时序预测。
3.1 时域-频域双局部性
傅里叶变换仅能在频域局部化(时域全域),而小波变换通过伸缩平移实现时域与频域的双局部化:
- 时域局部性:由小波
\psi(t)
的快速衰减性保证,其有效支撑集(非零值区间)长度\Delta t
有限。 - 频域局部性:由小波的傅里叶变换
\hat{\psi}(\omega)
的快速衰减性保证,其有效支撑集长度\Delta \omega
有限。 - 不确定性原理约束:
\Delta t \cdot \Delta \omega \geq \frac12
,但小波可通过调整形状(如墨西哥帽小波、Daubechies小波)在“时域分辨率”与“频域分辨率”间灵活权衡——高频时(a
小)时域分辨率高、频域分辨率低(适合捕捉短期突变),低频时(a
大)频域分辨率高、时域分辨率低(适合捕捉长期周期)。
这一性质完美匹配时序预测的需求:FFT负责捕捉全局周期(频域分辨率高),小波变换负责定位周期的时域分布(时域分辨率高),两者结合可实现“全局周期+局部细节”的完整分析。
3.2 多分辨率特性
通过MRA的分层分解,小波变换可在不同尺度下分析信号:
- 高层细节
D_1, D_2
(小j
):高频成分,对应时序数据的短期波动(如日内周期、突发噪声)。 - 低层细节
D_{N-1}, D_N
(大j
):中频成分,对应时序数据的中期周期(如周度周期、月度周期)。 - 低频逼近
A_N
:低频成分,对应时序数据的长期趋势(如年度周期、全局趋势)。
这种多分辨率特性可直接支撑“多尺度周期检测”——无需依赖单一尺度的周期假设,而是通过不同层的系数提取多尺度周期模式。
3.3 稀疏表示性
对于时序数据中的局部突变(如异常点、周期切换点)或分段平滑信号,小波变换的系数具有稀疏性:
- 平滑区域:小波系数幅值小(信号无显著变化,与小波基的相似性低)。
- 突变区域:小波系数幅值大(信号剧烈变化,与小波基的相似性高)。
这种稀疏性可用于:
- 噪声去除:将小幅值系数置零(噪声通常对应小系数),再通过逆变换重构信号,保留有效周期特征;
- 周期显著性评估:大幅值系数对应的尺度与位置,即为信号的显著周期及其时域分布。(可用于实现“频率掩码机制”,增强重要频率成分的权重)
3.4 平移不变性
部分小波
传统DWT(如基于Daubechies小波的正交DWT)因采样平移步长随尺度增大而增大,存在平移敏感性(信号微小平移导致系数大幅变化)。而双正交小波或冗余小波变换(如小波包变换)可通过放松正交性,实现近似的平移不变性——信号平移时,系数的相对分布不变,仅整体平移。
这一性质对周期检测的鲁棒性至关重要:时序数据的轻微时间偏移(如采集延迟)不会导致周期判断失效,可提升“周期一致性验证”的可靠性。
4 小波变换在时序预测中的应用
小波变换的特性可直接支撑TimesNet模型今后的改进,以下从具体应用场景展开。
4.1 多尺度周期检测
FFT的优势是全局频率分辨率高,可准确捕捉信号的主周期(如年度周期),但无法定位周期的时域变化(如某季度周期消失);小波变换的优势是时域-频域双局部化,可捕捉周期的局部变化(如短期周期的出现/消失)。
两者结合的具体方案:
- 用FFT分析信号的全局频率谱
\hat{f}(\omega)
,确定候选主周期\omega_1, \omega_2, \cdots, \omega_k
。 - 对信号进行DWT分解,得到多尺度细节系数
D_1 \sim D_N
。 - 计算各细节层
D_j
对应的频率范围(\omega_j \propto 2^j
),将FFT得到的主周期\omega_m
匹配到对应的细节层。 - 分析匹配层的小波系数幅值分布,确定主周期在时域的有效区间(如
D_3
层系数大值对应季度周期的活跃时间段),实现“全局周期+局部时域定位”的融合检测。
4.2 频率掩码与周期权重
基于小波系数的显著性评估
小波系数的幅值直接反映对应尺度-位置特征的显著性,可用于设计“可学习的频率掩码机制”:
- 对DWT分解后的各层系数
A_N, D_N, \cdots, D_1
,计算每层的 “能量归一化幅值”,如下所示,其中S_j
表示第j
层细节(对应某一频率范围)的能量占比,即该频率的显著性权重:
S_j = \frac{\sum\limits_{k} |D_j(k)|^2}{\sum\limits_{m=1}^N \sum_{k} |D_m(k)|^2 + |A_N(k)|^2} \quad (j=1,\cdots,N)
- 将
S_j
作为频率掩码的初始权重,再通过神经网络(如TimesNet的Inception块)学习调整,增强重要频率(高S_j
)的贡献,抑制噪声频率(低S_j
)。由此实现“频率掩码机制”和“置信度加权”。
4.3 周期一致性验证
为提升周期检测的鲁棒性,可采用多小波基交叉验证策略,利用不同小波的特性互补:
- 选择3种典型小波基,如Daubechies-4小波(正交,计算高效)、Symlet-8小波(近似对称,平移敏感性低)、Coiflet-6小波(逼近系数精度高)等。
- 用3种小波分别对信号进行DWT分解,得到3组多尺度系数。
- 对每组系数,提取显著周期(基于系数幅值),并计算周期的一致性得分,如下所示,其中
\Omega_i
为第i
种小波检测到的显著周期集合,I(\cdot)
为指示函数(存在则为1,否则为0):
C(\omega) = \frac{1}{3} \sum\limits_{i=1}^3 I\left( \omega \in \Omega_i \right)
- 保留
C(\omega) \geq 2
的周期(至少两种小波验证通过),剔除仅单种小波检测到的周期(可能为噪声),提升周期检测的鲁棒性。
5 参考资料
经典教材:
- Ingrid Daubechies. 《Ten Lectures on Wavelets》(小波分析的奠基性著作,详细推导MRA与DWT的数学理论)
- C. K. Chui. 《Wavelets: A Tutorial in Theory and Applications》(系统介绍小波变换的工程应用,含时序分析案例)
- Robert H. Shumway, David S. Stoffer. 《Time Series Analysis and Its Applications》(时序分析权威教材,第4章专门介绍小波在时序预测中的应用)。
关键论文:
- Mallat, S. G. 《A Theory for Multiresolution Signal Decomposition: The Wavelet Representation》(提出MRA框架与Mallat算法,奠定 DWT 的工程应用基础)
- Donoho, D. L. 《De-noising by Soft-thresholding》(基于小波系数稀疏性的噪声去除方法,为周期检测的预处理提供思路)
工程指南:
- MATLAB Wavelet Toolbox Documentation(含小波分解、重构的可视化案例,帮助直观理解多尺度特性)
- Python pywt库官方教程(开源工具,适合快速验证小波变换的时序分析效果)
《小波变换在时序预测中的应用》有1条评论