2。1。2 技术可行性

程序通过将音频文件上传至百度语音识别api的方式进行语音识别。文献综述

百度的语音识别技术运用相比目前大部分语音识别系统更加简单有效的方式,百度语音识别采用了类似神经网络的深度学习算法来代替过去的识别模块,可以大幅提高识别效率和识别精度。

支持的音频格式有:pcm(不压缩)、wav、opus、speex、amr、x-flac。原始 PCM 的录音参数必须符合 8k/16k 采样率、16bit 位深、单声道。

百度语音识别支持多达35个垂类领域的语义理解定制,以及自定义指令集和问答对设置。语音识别垂类就是特指某个领域,开发者可以根据使用者将场景设定为特定领域使得识别结果更准确。

在这里也讲述几个编写程序中遇到的问题及对于问题的处理方式。

(1) 语音识别时间较长

对音频文件进行剪切后,语音识别处理时间还是较长。所以使用了celery来进行异步处理,提高处理效率,用了异步处理之后用了阻塞的方式来等待全部处理完成。

(2) 调用api的方法

不同于此程序对于调用api的方式,提供回调地址给百度具有:用异步的方式,网页不容易超时的好处,但是因为不知道怎么使自己的电脑被百度访问而放弃了这个方法,希望有机会可以向老师学习。

上一篇:asp.net+sqlserver仪器设备采购与使用信息管理系统设计
下一篇:asp.net+sqlserver图书借还信息系统设计

基于Android的电子拍卖系统设计与开发

基于Web应用的致胜公司企业内部培训系统设计

Matlab基于多旋翼飞行器的飞行控制系统设计

基于字典学习的多视图低维相关表示方法研究

基于android通讯与游戏的手...

基于android的环境信息管理系统设计

基于激光超声检测金属材...

发酵米粉优势菌株的发酵特性研究

大淘宝网的虚假交易研究

肢体语言在小学英语教学中的应用浅谈

淮安市高校足球运动损伤问卷调查表

激光模拟训练器材国内外研究现状

浅谈农村大气环境保护的制度构建【1868字】

新疆农林高校學生昆虫生...

2021年什么行业赚钱,适合...

个案管理茬老年糖尿病患...

日语论文中日酒文化对比研究