波形在NIST SPHERE格式,这往往是在语音识别研究中创建的音频文件;通常包含一个人说话的记录;可以作为输入提供给语音识别系统来提供。
SPHERE波形使用16位线性PCM和一个16KHz的采样率。他们有一个1024字节的人类可读的头,使用ASCII文本formatting.NOTE:SPH文件可以使用一种叫做sph_convert或SOX工具转换为.WAV格式。