產品特性

  • 上下文糾錯
    針對上下文進行語義理解,將中間結果進行智能糾錯,確保準確性。
  • 文字流時間戳
    對于音頻流實現毫秒級識別,并返回帶有時間戳的文字流,便于二次開發。
  • 文字格式智能轉換
    對結果中出現數字、日期、時間等內容格式化成規整的文本。
  • 標點智能預測
    運用超大規模的語言模型,智能預測語境,提供智能斷句和標點符號的預測。

技術規格

  • 輸入

    • 形式:實時音頻流

      支持格式:PCM

      采樣率:16KHz

      采樣精度:16bits

    • 支持語種:中文普通話

      聲道:單聲道

      分片時長:40ms

  • 輸出

    • 形式:json格式字符串

      編碼:UTF-8

      結果:句子開始&結束時間&詞識別內容&詞標識&詞開始時間&詞結束時間&結果類型標識&段落ID,整句的中間結果,整句的最終結果

注:

1、文法格式智能轉換包括電話號碼、車牌、日期、時間以及量詞的規整,如“五點三十”引擎會識別規整為“5:30”。

2、詞屬性包括:普通詞;語氣猶豫詞,如“嗯”、“啊”、“呃”或者無意義的重復詞等;標點符號,如“,”等。

3、語言支持:中國大陸地區普通話。后續將支持更多語種。

4、訊飛開放平臺的實時語音轉寫需接入WebSocket API接口,針對有編程基礎的開發者用戶。如果您是個人用戶,不想通過編程方式直接實現語音轉寫功能,可以去訊飛聽見官網,了解語音轉寫功能的更多詳情。

應用場景

  • 直播字幕
    在電視直播或現場直播過程中提供實時字幕,提升直播效果
  • 視頻會議&電話會議
    將視頻以及電話會議中的發言內容實時識別為文字,防止錯過重要會議內容,提高會議效率
  • 客服中心
    將客戶的電話語音內容實時識別為文字,作為客服答疑的參考記錄

客戶案例

  • 上海電視臺
  • 天潤融通
  • 唱吧
  • 掌眾金服
  • 愛屋吉屋

計費方式

  • 開放平臺實時轉寫業務按并發路數收費,即同一時間允許進行實時轉寫的WebSocket連接數。單價為2萬元/路/年

  • 新開通的用戶,我們可為您提供限時的免費試用,點擊立即申請試用

開發者資源

溫馨提示

  • 開放平臺“實時語音轉寫”需要WebSocket接入,針對是有編程基礎的開發者用戶。如果您是個人用戶,不想通過編程方式直接實現語音轉寫功能,可以去訊飛聽見官網,了解語音轉寫功能的更多詳情。