博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
IOS Google语音识别更新啦!!!
阅读量:5203 次
发布时间:2019-06-13

本文共 867 字,大约阅读时间需要 2 分钟。

 
旧版本的API:
 
— Google 提供了一个在线语音识别的 API 接口,通过该 API 可以进行中文、英文等语言的识别。
 API 地址: xjerr =1& client = chromium& lang = zh-CN& maxresults =1
  — 参数解释: 

  xjerr:错误标准

  client: 客户端类型

  lang:待识别语言类型,en-US是英文,中文为zh-CN,

  maxresults:最大返回识别结果数量

—识别基本流程:
    • 从音频输入设备获取原始音频并编码或直接调用音频文件。
    • 将音频POST至接口地址。
    • 分析处理返回的JSON并得出结果。
—请求接口
    • 地址:如前
    • 请求方式:http post
    • 请求数据:编码后的音频数据
    • 音频编码格式:wav、speex或flac。
    • 音频采样频率:8000Hz、11025Hz、16000Hz、22050Hz、24000Hz、32000Hz、44100Hz、48000Hz
—主要优点
◦ 语音识别引擎庞大,识别精度很高,适用于文本语音识别。提供多国语言的语音识别。
◦ 任何平台都可以进行访问,容易使用。
—主要缺点
◦ API 未开放,未能获知具体开发细节。
◦ 识别引擎位于服务器端,识别的速度和网络质量有关,识别速度较慢。
◦ 待识别音频的格式、大小、时长的限制。
 
新版本的API:
   
api:地址: https://www.google.com/speech-api/v2/recognize?output=json&lang=en-us&key=yourkey 主要说一下变化:  URL路径: 之前的V1变成V2  参数: 新增output:输出类型,我们一般用json        新增KEY:需要去goole注册帐号,申请apikey,如果你不懂请google        其他的参数都能够继续使用 相关文档:

  谷歌官方开源代码: 

  谷歌开发者Key申请地址:

 

 

转载于:https://www.cnblogs.com/jimfrank/p/ios.html

你可能感兴趣的文章
对伪静态网站实施注射
查看>>
个人作业1——四则运算题目生成程序(基于控制台)
查看>>
oracle 12.2 linux/solaris正式发布
查看>>
文件操作体会及文件操作函数大全集合
查看>>
MongoDB C# CRUD (3)
查看>>
JQuery EasyUI DataGrid动态合并(标题)单元) 一
查看>>
前端(jQuery)(4)-- jQuery隐藏显示与淡入淡出、滑动、回调
查看>>
从Android中Activity之间的通信说开来
查看>>
hdu1251 统计难题
查看>>
WPF入门教程系列三——Application介绍(续)
查看>>
MvvmLight框架使用入门(一)
查看>>
db2如何确定某张表是否有锁?
查看>>
创建Oracle synonym 详解
查看>>
【SQL】181. Employees Earning More Than Their Managers
查看>>
uva 1335 Beijing Guards
查看>>
php7 新特性整理
查看>>
Nodejs.Electron(Nodejs的图形界面开发)安装和试用
查看>>
RabbitMQ、Redis、Memcache、SQLAlchemy
查看>>
20190716NOIP模拟赛T2 通讯(tarjan缩点+贪心)
查看>>
退出shell 脚本
查看>>