0x00 论文来源

CommanderSong: A Systematic Approach for Practical Adversarial Voice Recognition

作者:Xuejing Yuan等。

0x01 研究动机

0x02 挑战

0x03 解决思路

0x04 具体

Kaldi平台

梯度下降算法

输入:

训练:

将这两个输入分别放入到语音识别模型中去跑。

训练输出:

优化:

我们要做的工作就是通过对原始歌曲音频添加一定的扰动,使其模型的训练输出m和目标命令的训练输出b之间的距离最小化。

那么问题来了,我们用什么来衡量m和b之间的距离呢?

本文中,作者用L1距离来进行衡量。

目标函数:

约束条件:

接下来,我们就用梯度下降算法循环得减少目标函数的值,直到趋向于一个稳定的状态,这样得到的x'(t),就可以被解码为想要的命令。

改进:

减少了b中的重复帧,不过没看懂

WAA攻击

该部分就是在上述的情况下添加了一个噪声模型,

这里用随机噪声进行模型物理世界中的噪声,生成方式如下:

其中,rand()函数会返回一个WAV格式的文件,可以直接作为原始音频的输入。

那么目标函数也就表示如下:

接下来,用上面的梯度下降算法处理就行。