最近折腾了swift的语音录制识别和转码,这块还是比较坑的,由于语音识别的准确度实测大概也就80%左右,所以还是需要上传录音文件啊。

首先是用讯飞语音SDK实现语音录制和识别(语音听写),第一个坑是讯飞SDK只录制了PCM格式的文件,这个文件是原始格式,默认比较大,另外播放器支持也不好,因此需要先把它转成mp3,本来考虑使用系统的AudioConverter转aac格式,不过aac好像不能在浏览器上播放。

转成mp3需要lame库支持,注意国内网搜到的lame.a库不支持64位,所以现在不能用了。

还好已经有人做了这个事情,直接提供了最新编译脚本和编译好的framework库,地址是https://github.com/wuqiong/mp3lame-for-iOS

我直接用了上面编译的framework,没有自己去编译,直接把lame.framework拖到工程里。

然后需要用oc写个封装类,我不确定这个封装类能不能用swift写,毕竟里面用了很多c的语法,还是用oc桥接一层比较保险。oc封装类如下:


#import <Foundation/Foundation.h>
#import "AudioWrapper.h"
#import "lame/lame.h"

@implementation AudioWrapper

+ (void)audioPCMtoMP3 :(Nsstring *)audioFileSavePath :(Nsstring *)mp3FilePath
{
    
    @try {
        int read,write;
        
        FILE *pcm = fopen([audioFileSavePath cStringUsingEncoding:1],"rb");  //source 被转换的音频文件位置
        fseek(pcm,4*1024,SEEK_CUR);                                   //skip file header
        FILE *mp3 = fopen([mp3FilePath cStringUsingEncoding:1],"wb");  //output 输出生成的Mp3文件位置
        
        const int PCM_SIZE = 8192;
        const int MP3_SIZE = 8192;
        short int pcm_buffer[PCM_SIZE*2];
        unsigned char mp3_buffer[MP3_SIZE];
        
        lame_t lame = lame_init();
        lame_set_in_samplerate(lame,11025.0);
        lame_set_VBR(lame,vbr_default);
        lame_init_params(lame);
        
        do {
            read = fread(pcm_buffer,2*sizeof(short int),PCM_SIZE,pcm);
            if (read == 0)
                write = lame_encode_flush(lame,mp3_buffer,MP3_SIZE);
            else
                write = lame_encode_buffer_interleaved(lame,pcm_buffer,read,MP3_SIZE);
            
            fwrite(mp3_buffer,write,1,mp3);
            
        } while (read != 0);
        
        lame_close(lame);
        fclose(mp3);
        fclose(pcm);
    }
    @catch (NSException *exception) {
        NSLog(@"%@",[exception description]);
    }
    @finally {
        NSLog(@"MP3 converted: %@",mp3FilePath);
    }
    
}
@end


然后在桥接文件XXX-Bridging-Header.h中加入

#import "AudioWrapper.h"

最后 swift文件的调用如下:

 dispatch_async(dispatch_get_global_queue(disPATCH_QUEUE_PRIORITY_DEFAULT,0)) {
                AudioWrapper.audioPCMtoMP3(path,pathMp3)
}
我觉得在主线程调用容易出问题,就新开了个线程调用,实测没有问题。

Swift iOS实现把PCM语音转成MP3格式的更多相关文章

  1. HTML5录音实践总结(Preact)

    这篇文章主要介绍了HTML5录音实践总结,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

  2. html5 录制mp3音频支持采样率和比特率设置

    最初有个开源项目libmp3lame-js,直接将 lame 源码编译为 js版本,后来有人基于libmp3lame使用 js 进行了重写,就是如今的lamejs 项目。相比libmp3lame ,自身体积更小,而且能实现更快的编码速度。据介绍说,编码一个132秒长度的音频仅需6.5秒

  3. mp3音频播放不能在iOS上使用Cordova 3.5

    最近我将我们的iOS项目从Cordova3.3升级到3.5.mp3文件不能使用媒体API/插件播放.该代码已经在iOS上可靠地运行在许多版本上,包括Cordova3.3…任何建议或信息非常感谢.克里斯又名荒诞UPDATEON20/Jun/14:FixFound.我现在可以让我下载的.mp3播放在iOSCordova3.5…这也适用于显示图像和媒体,因此它是CordovaiOS3.5及更高版本的单一可靠解决方案.这是迄今为止首选的解决方案,因为它比使用相对路径更安全…

  4. Swift iOS实现把PCM语音转成MP3格式

    最近折腾了swift的语音录制识别和转码,这块还是比较坑的,由于语音识别的准确度实测大概也就80%左右,所以还是需要上传录音文件啊。首先是用讯飞语音SDK实现语音录制和识别,第一个坑是讯飞SDK只录制了PCM格式的文件,这个文件是原始格式,默认比较大,另外播放器支持也不好,因此需要先把它转成mp3,本来考虑使用系统的AudioConverter转aac格式,不过aac好像不能在浏览器上播放。

  5. swift – 显示.MP3文件的图稿

    我正在尝试在ImageView中显示本地存储的.MP3轨道的专辑图片.有谁知道如何在Swift中获取这件艺术品才能实现这一目标?

  6. 在Android webview app中播放本地音频文件

    m=1至于HTML5方法和使用AUdio标签,我仍然不确定为什么它在本地文件上失败.Phonegap的媒体类工作得很好,无论如何可能是一个更可靠的解决方案.PhonegapFTW!

  7. android – 解码音频文件并重新编码为所需的PCM格式:44,100 kHz,2个通道,16位

    解决方法根据我们在评论中的对话,这个答案涉及使用OpenSL将音频数据解码到PCM.不幸的是,我无法使用MediaCodec类提供类似的答案.首先,设置一个AndroidNDK项目(使用Eclipse:右键单击项目,Android工具–>添加本机支持…

  8. 如何确定Android上的音频功能?

    我正在尝试使用Android的录音和播放功能.有没有办法枚举我的设备上可用的音频参数?现在,当我传递硬件不喜欢的参数组合时,我只是得到一个错误.所以我不得不“猜测”:当然有更好的方法!Thischart表示唯一支持的音频输入采样率是8kHz?

  9. android – 如何将.pcm文件转换为.wav或.mp3?

    如果是这样,为什么代码示例将文件转换为白噪声?本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请发送邮件至dio@foxmail.com举报,一经查实,本站将立刻删除。

  10. Android:录制mp3格式的声音

    我正在构建一个Android应用程序,具有通过麦克风捕获声音并通过耳机播放的功能.为此,我使用了“AudioRecord”和“AudioTrack”.以下是我使用的代码的一部分,但主要的问题是我要录制mp3格式的传入声音吗?请帮我在这里,我真的很感激…

随机推荐

  1. Swift UITextField,UITextView,UISegmentedControl,UISwitch

    下面我们通过一个demo来简单的实现下这些控件的功能.首先,我们拖将这几个控件拖到storyboard,并关联上相应的属性和动作.如图:关联上属性和动作后,看看实现的代码:

  2. swift UISlider,UIStepper

    我们用两个label来显示slider和stepper的值.再用张图片来显示改变stepper值的效果.首先,这三个控件需要全局变量声明如下然后,我们对所有的控件做个简单的布局:最后,当slider的值改变时,我们用一个label来显示值的变化,同样,用另一个label来显示stepper值的变化,并改变图片的大小:实现效果如下:

  3. preferredFontForTextStyle字体设置之更改

    即:

  4. Swift没有异常处理,遇到功能性错误怎么办?

    本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请发送邮件至dio@foxmail.com举报,一经查实,本站将立刻删除。

  5. 字典实战和UIKit初探

    ios中数组和字典的应用Applicationschedule类别子项类别名称优先级数据包contactsentertainment接触UIKit学习用Swift调用CocoaTouchimportUIKitletcolors=[]varbackView=UIView(frame:CGRectMake(0.0,0.0,320.0,CGFloat(colors.count*50)))backView

  6. swift语言IOS8开发战记21 Core Data2

    上一话中我们简单地介绍了一些coredata的基本知识,这一话我们通过编程来实现coredata的使用。还记得我们在coredata中定义的那个Model么,上面这段代码会加载这个Model。定义完方法之后,我们对coredata的准备都已经完成了。最后强调一点,coredata并不是数据库,它只是一个框架,协助我们进行数据库操作,它并不关心我们把数据存到哪里。

  7. swift语言IOS8开发战记22 Core Data3

    上一话我们定义了与coredata有关的变量和方法,做足了准备工作,这一话我们来试试能不能成功。首先打开上一话中生成的Info类,在其中引用头文件的地方添加一个@objc,不然后面会报错,我也不知道为什么。

  8. swift实战小程序1天气预报

    在有一定swift基础的情况下,让我们来做一些小程序练练手,今天来试试做一个简单地天气预报。然后在btnpressed方法中依旧增加loadWeather方法.在loadWeather方法中加上信息的显示语句:运行一下看看效果,如图:虽然显示出来了,但是我们的text是可编辑状态的,在storyboard中勾选Editable,再次运行:大功告成,而且现在每次单击按钮,就会重新请求天气情况,大家也来试试吧。

  9. 【iOS学习01】swift ? and !  的学习

    如果不初始化就会报错。

  10. swift语言IOS8开发战记23 Core Data4

    接着我们需要把我们的Rest类变成一个被coredata管理的类,点开Rest类,作如下修改:关键字@NSManaged的作用是与实体中对应的属性通信,BinaryData对应的类型是NSData,CoreData没有布尔属性,只能用0和1来区分。进行如下操作,输入类名:建立好之后因为我们之前写的代码有些地方并不适用于coredata,所以编译器会报错,现在来一一解决。

返回
顶部