[摘]PCM文件转WAV文件

Android  2019年5月16日 pm7:10发布6年前 (2019)更新 城堡大人
152 0 0

一、WAV和PCM的区别和联系

Android平台上要进行音频编辑操作(比如裁剪,插入,合成等),通常都是需要将音频文件解码为WAV格式的音频文件或者PCM文件。那么WAV和PCM之间有什么关系,这里有必要了解一下。

PCM(Pulse Code Modulation—-脉码调制录音)。所谓PCM录音就是将声音等模拟信号变成符号化的脉冲列,再予以记录。PCM信号是由[1]、[0]等符号构成的数字信号,而未经过任何编码和压缩处理。与模拟信号比,它不易受传送系统的杂波及失真的影响。动态范围宽,可得到音质相当好的影响效果。也就是说,PCM就是没有压缩的编码方式,PCM文件就是采用PCM这种没有压缩的编码方式编码的音频数据文件。

WAV是由微软开发的一种音频格式。WAV符合 PIFF Resource Interchange File Format规范。所有的WAV都有一个文件头,这个文件头音频流的编码参数。WAV对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码。WAV也可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的WAV,但这不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中,和AVI一样,只要安装好了相应的Decode,就可以欣赏这些WAV了。

在Windows平台下,基于PCM编码的WAV是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,WAV也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于PCM编码的WAV被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA。

二、WAV文件头信息

接下来有必要了解一下WAV文件头信息是什么样的格式信息。

WAV文件头信息由大小44个字节的数据组成:

  1. 4字节数据,内容为“RIFF”,表示资源交换文件标识
  2. 4字节数据,内容为一个整数,表示从下个地址开始到文件尾的总字节数
  3. 4字节数据,内容为“WAVE”,表示WAV文件标识
  4. 4字节数据,内容为“fmt ”,表示波形格式标识(fmt ),最后一位空格。
  5. 4字节数据,内容为一个整数,表示PCMWAVEFORMAT的长度
  6. 2字节数据,内容为一个短整数,表示格式种类(值为1时,表示数据为线性PCM编码)
  7. 2字节数据,内容为一个短整数,表示通道数,单声道为1,双声道为2
  8. 4字节数据,内容为一个整数,表示采样率,比如44100
  9. 4字节数据,内容为一个整数,表示波形数据传输速率(每秒平均字节数),大小为 采样率 * 通道数 * 采样位数
  10. 2字节数据,内容为一个短整数,表示DATA数据块长度,大小为 通道数 * 采样位数
  11. 2字节数据,内容为一个短整数,表示采样位数,即PCM位宽,通常为8位或16位
  12. 4字节数据,内容为“data”,表示数据标记符
  13. 4字节数据,内容为一个整数,表示接下来声音数据的总大小

由以上信息可知,对于一个PCM文件来说,只要知道它的大小,采样率,声道数,采样位数,就可以通过添加一个WAV文件头得到一个WAV文件了。

采样率简介

那么采样率是什么意思,我们来了解下。

音频采样率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。在当今的主流采集卡上,采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级,22.05KHz只能达到FM广播的声音品质,44.1KHz则是理论上的CD音质界限,48KHz则更加精确一些。

在数字音频领域,常用的采样率有:

  1. 8,000 Hz - 电话所用采样率, 对于人的说话已经足够
    11,025 Hz
  2. 22,050 Hz - 无线电广播所用采样率
  3. 32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率
  4. 44,100 Hz - 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率
  5. 47,250 Hz - 商用 PCM 录音机所用采样率
  6. 48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率
  7. 50,000 Hz - 商用数字录音机所用采样率
  8. 96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所用所用采样率
  9. 2.8224 MHz - Direct Stream Digital 的 1 位 sigma-delta modulation 过程所用采样率。

通常歌曲的采样率是44100,而Android平台的人声录音支持8000,16000,32000三种采样率。

三、声道数和采样位数下的PCM编码

声道通常可以分为单声道和双声道,双声道又分为左声道和右声道。

采样位数表示一个采样数据用多少位来表示,通常为8位和16位,对于8位表示一个字节来表示一个采样数据,16位表示用两个字节表示一个采样数据,两个字节为低位字节和高位字节,通常低位字节在前,高位字节在后。

因此结合声道和采样字节数(采样位数),可以组成下图的PCM数据格式:

可以看到8位单声道的PCM数据,只需要一个字节就能表示一个采样数据,而16位双声道(立体声)的PCM数据,需要4个字节来表示一个采样数据。那么计算一个PCM大小的方法就很简单了。

对于8位单声道,采样率为8000,1分钟的PCM音频来说,大小是

//采样率 * 通道数 * 采样位数/8 * 秒数
8000 * 1 * 8/8 * 60 = 480000,大约480k

对于16位双声道,采样率为44100,1分钟的PCM音频来说,大小是

//采样率 * 通道数 * 采样位数/8 * 秒数
44100 * 2 * 16/8 * 60 = 10584000,大约10M

而WAV文件的大小就是比PCM多出44个字节数。

四、PCM文件转WAV文件

现在我们得到了解码后的PCM文件,但是它是不可直接播放的,因为不带音频相关的格式信息,下面我们将PCM和指定的音频相关格式信息去转换得到一个可播放的WAV文件

/**
   * PCM文件转WAV文件
   * @param inPcmFilePath 输入PCM文件路径
   * @param outWavFilePath 输出WAV文件路径
   * @param sampleRate 采样率,例如44100
   * @param channels 声道数 单声道:1或双声道:2
   * @param bitNum 采样位数,8或16
   */
  public static void convertPcm2Wav(String inPcmFilePath, String outWavFilePath, int sampleRate,
      int channels, int bitNum) {

    FileInputStream in = null;
    FileOutputStream out = null;
    byte[] data = new byte[1024];

    try {
      //采样字节byte率
      long byteRate = sampleRate * channels * bitNum / 8;

      in = new FileInputStream(inPcmFilePath);
      out = new FileOutputStream(outWavFilePath);

      //PCM文件大小
      long totalAudioLen = in.getChannel().size();

      //总大小,由于不包括RIFF和WAV,所以是44 - 8 = 36,在加上PCM文件大小
      long totalDataLen = totalAudioLen + 36;

      writeWaveFileHeader(out, totalAudioLen, totalDataLen, sampleRate, channels, byteRate);

      int length = 0;
      while ((length = in.read(data)) > 0) {
        out.write(data, 0, length);
      }
    } catch (Exception e) {
      e.printStackTrace();
    } finally {
      if (in != null) {
        try {
          in.close();
        } catch (IOException e) {
          e.printStackTrace();
        }
      }
      if (out != null) {
        try {
          out.close();
        } catch (IOException e) {
          e.printStackTrace();
        }
      }
    }
  }


  /**
   * 输出WAV文件
   * @param out WAV输出文件流
   * @param totalAudioLen 整个音频PCM数据大小
   * @param totalDataLen 整个数据大小
   * @param sampleRate 采样率
   * @param channels 声道数
   * @param byteRate 采样字节byte率
   * @throws IOException
   */
  private static void writeWaveFileHeader(FileOutputStream out, long totalAudioLen,
      long totalDataLen, int sampleRate, int channels, long byteRate) throws IOException {
    byte[] header = new byte[44];
    header[0] = 'R'; // RIFF
    header[1] = 'I';
    header[2] = 'F';
    header[3] = 'F';
    header[4] = (byte) (totalDataLen & 0xff);//数据大小
    header[5] = (byte) ((totalDataLen >> 8) & 0xff);
    header[6] = (byte) ((totalDataLen >> 16) & 0xff);
    header[7] = (byte) ((totalDataLen >> 24) & 0xff);
    header[8] = 'W';//WAVE
    header[9] = 'A';
    header[10] = 'V';
    header[11] = 'E';
    //FMT Chunk
    header[12] = 'f'; // 'fmt '
    header[13] = 'm';
    header[14] = 't';
    header[15] = ' ';//过渡字节
    //数据大小
    header[16] = 16; // 4 bytes: size of 'fmt ' chunk
    header[17] = 0;
    header[18] = 0;
    header[19] = 0;
    //编码方式 10H为PCM编码格式
    header[20] = 1; // format = 1
    header[21] = 0;
    //通道数
    header[22] = (byte) channels;
    header[23] = 0;
    //采样率,每个通道的播放速度
    header[24] = (byte) (sampleRate & 0xff);
    header[25] = (byte) ((sampleRate >> 8) & 0xff);
    header[26] = (byte) ((sampleRate >> 16) & 0xff);
    header[27] = (byte) ((sampleRate >> 24) & 0xff);
    //音频数据传送速率,采样率*通道数*采样深度/8
    header[28] = (byte) (byteRate & 0xff);
    header[29] = (byte) ((byteRate >> 8) & 0xff);
    header[30] = (byte) ((byteRate >> 16) & 0xff);
    header[31] = (byte) ((byteRate >> 24) & 0xff);
    // 确定系统一次要处理多少个这样字节的数据,确定缓冲区,通道数*采样位数
    header[32] = (byte) (channels * 16 / 8);
    header[33] = 0;
    //每个样本的数据位数
    header[34] = 16;
    header[35] = 0;
    //Data chunk
    header[36] = 'd';//data
    header[37] = 'a';
    header[38] = 't';
    header[39] = 'a';
    header[40] = (byte) (totalAudioLen & 0xff);
    header[41] = (byte) ((totalAudioLen >> 8) & 0xff);
    header[42] = (byte) ((totalAudioLen >> 16) & 0xff);
    header[43] = (byte) ((totalAudioLen >> 24) & 0xff);
    out.write(header, 0, 44);
  }

上面操作其实也很简单,只要你知道了WAV文件头信息的格式,将采样率,声道数,采样位数,PCM音频数据大小等信息填充进去,然后将这个44个字节数据拼接到PCM文件的开头,就得到了一个可播放的WAV文件了。

 

本文摘抄于《android音频编辑之音频转换PCM与WAV

 历史上的今天

  1. 2023: Android图片旋转(0条评论)
版权声明 1、 本站名称: 笔友城堡
2、 本站网址: https://www.biumall.com/
3、 本站部分文章来源于网络,仅供学习与参考,如有侵权,请留言

暂无评论

暂无评论...

随机推荐

周国平:对自己的人生负责

人活在世上,不免要承担各种责任,小至对家庭、亲戚、朋友,大至对国家和社会。这些责任多半是应该承担的。此外,还有一项根本的责任,便是对自己的人生负责。每个人在世上都只有活一次的机会,没有任何人能够代替他重新活一次。如果这惟一的人生虚度了,也没有任何人能够真正安慰他。认识到这一点,对自己的人生怎么能不...

郑愁予:归航曲

飘泊得很久,我想归去了彷佛,我不再属于这里的一切我要摘下久悬的桅灯摘下航程里最后的信号我要归去了……每一片帆都会驶向斯培西阿海湾原注:像疲倦的太阳在那儿降落,我知道每一朵云都会俯吻汩罗江渚,像清浅的水涡一样在那儿旋没……我要归去了天隅有幽蓝的空席有星座们洗尘的酒宴在隐去...

Android 13之MediaProvider的优化

前言记录一下Android 13的MediaProvider的优化。随着Android发展,Android10 扫描器的的主要功能就放MediaProvider中了,MediaScannner类的作用就淡化了。记录一下,对MediaProvider的优化,方便自己查阅。正文这里只是简单记...

OkHttp简单介绍之一

前言okhttp很常用的一个网络请求框架,因此记录一下如何使用,然后走一下源码流程。这篇只是简单记录一下okhttp的同步和异步请求。好记性不让烂笔头正文同步和异步初始化都一样,只是最后调佣的方法不一样。这里只是简单记录,因此直接上代码。在Module的build.gradle中引入...

杨绛:喝茶

曾听人讲洋话,说西洋人喝茶,把茶叶加水煮沸,滤去茶汁,单吃茶叶,吃了咂舌道:“好是好,可惜苦些。”新近看到一本美国人做的茶考,原来这是事实。茶叶初到英国,英国人不知怎么吃法,的确吃茶叶渣子,还拌些黄油和盐,敷在面包上同吃。什么妙味,简直不敢尝试。以后他们把茶当药,治伤风,清肠胃。不久,喝茶之风大行,...

Launcher根据包名启动应用

前言很多项目中Launcher是有可能自定义的,毕竟Android原生的Launcher比较庞大,有时候需要的需求很简单,自己重新写Launcher也比较容易维护。为啥要根据包名启动,因为一个应用可能存在多个Activity,当按Home键退出后,再次从Launcher界面点击需要回到之前展示...