產品體驗

語種/方言: 申請試用方言










00: 00 / 01: 00

產品優勢

  • 超過98%的準確率
    訊飛開放平臺擁有領先的語音識別技術,核心技術達到國際領先水平,語音識別準確率已經超過98%,在業界遙遙領先。
  • 支持多種語種和方言
    支持中文、英文兩個語種的識別,同時,我們還提供粵語、河南話、四川話等方言的識別。
  • 方便快捷的信息溝通
    語音輸入速度達180字/分,識別結果響應時間低于200ms——系統運行效率讓信息溝通變得無比順暢。
  • 個性的語音識別
    基于用戶語音特征,建立個性化的詞條語言模型,調整識別參數,持續優化識別效果,提高用戶的個性化詞條識別準確率。
  • 中文標點智能預測
    語音聽寫使用超大規模的語言模型,對識別結果語句智能預測其對話語境,提供智能斷句和標點符號的預測。
  • 支持垂直領域和應用級聽寫
    基于大量垂直領域語料,我們不斷對模型進行訓練,目前提供三個垂直領域的聽寫模型:商旅、視頻和音樂。

應用場景

  • 社交聊天
    使用社交應用聊天時,將用戶的語音信息(≤60秒),轉成文字信息
  • 語音輸入法
    使用輸入法輸入時,將語音信息轉成文字信息,提升用戶閱讀體驗
  • 游戲娛樂
    將游戲娛樂中的音頻文件轉成文字消息,大大提升用戶體驗
  • 人機交互
    人機交互時,將雙方的語音信息轉成文字信息,提升交互體驗

客戶案例

  • 訊飛輸入法
  • 京東
  • 獵豹瀏覽器
  • 有道翻譯官
  • 新浪微博
  • 攜程

垂直聽寫模型

  • 商旅聽寫模型
  • 音樂聽寫模型
  • 視頻聽寫模型

個性化聽寫

  • 點擊使用服務
  • 選擇您的應用
  • 上傳熱詞文件
  • 發布熱詞文件
  • 完成

開發者資源

疑問解答

  • “音頻參數”?

  • 音頻參數 數值
    音頻長度(Input Length) ≤60s
    采樣率(Sampling Rate) 支持8KHz和16KHz
    采樣精度(Bit Depth) 16bits
    聲道(Channel) 單聲道
    語音起點(begin of the speech) 小于參數vad_bos
    音頻終點(end of the speech) 小于參數vad_eos
  • “標點符號支持”?

  • 語言 支持標點
    中文(普通話) 。,?!
    英文 . , ? !
    中文(粵語) 。,?!
    中文(四川話) 。,?!
  • 支持哪些平臺?

  • Android、iOS、Linux、WebAPI、Windows、Java等平臺。

  • 支持的返回結果有幾種?

  • 支持JSON、PLAIN等格式,方便解析。

  • 語音聽寫與語音轉寫的區別?

  • 不超過60秒。如果需大于60秒的,請移步到語音轉寫服務。

  • SDK形式是否支持多路并發?

  • 不支持。SDK調用形式只支持單路,WebAPI支持多路并發。

查看更多