Install¶
Requirements¶
mxnet-1.5.0+, gluonfr, av, librosa, …
音频库的选择主要考虑数据读取速度, 训练过程中音频的解码相比图像解码会消耗更多时间, 实际测试librosa从磁盘加载一个aac编码的短音频 耗时是pyav的8倍左右.
- librosa
pip install librosa
- ffmpeg
# 下载ffmpeg源码, 进入根目录
./configure --extra-cflags=-fPIC --enable-shared
make -j
sudo make install
- pyav, 需要先安装ffmpeg
pip install av
- gluonfr
pip install git+https://github.com/THUFutureLab/gluon-face.git@master