技術規格

  • 輸入

    • 形式:已錄制音頻

      聲道:單聲道&多聲道

      支持格式:

      wav,flac,opus,m4a,mp3

    • 支持語種:中文普通話

      采樣率:8KHz,16KHz

      采樣精度:8bits,16bits

  • 輸出

    • 形式:json格式字符串

      編碼:UTF-8

      結果:分詞形式&完整句子形式,詞&句置信息度詞&句時間戳,詞屬性,多候選詞,文法格式智能轉換雙發音人分離

注:

1、文法格式智能轉換包括電話號碼、車牌、日期、時間以及量詞的規整,如“五點三十”引擎會識別規整為“5:30”。

2、詞屬性包括:普通詞;語氣猶豫詞,如“嗯”、“啊”、“呃”或者無意義的重復詞等;標點符號,如“,”等。

3、語言支持:中國大陸地區普通話。

4、使用本服務前請參閱最佳實踐指南,以獲得更高的轉寫準確率。

5、訊飛開放平臺的語音轉寫為使用sdk接入,針對有編程基礎的用戶。如果您不想通過編程方式,可以去訊飛聽見官網,上傳音頻,直接實現語音轉文字功能。

應用場景

  • 電話銷售&客服
    將坐席通話轉成文字,幫助電話質檢和信息同步,也為數據挖掘提供原料基礎
  • 會議&訪談記錄
    將會議和訪談的音頻轉換成文字存稿,讓后期的信息檢索和整理更方便快捷
  • 字幕生成
    將視頻中音頻文件進行語音轉寫,輕松生成與視頻相對應的字幕文件
  • 語音鑒別
    可以從轉寫出的文字結果中搜索匹配相關詞類,對黃暴/涉政內容進行高效鑒別

客戶案例

  • 上海電視臺
  • 天潤融通
  • 唱吧
  • 掌眾金服
  • 愛屋吉屋

計費方式

  • 訊飛開放平臺語音轉寫服務目前提供有“批量購買”和“按單價購買”兩種模式,價格范圍為4.9~9.9元/小時 立即購買

  • 每項轉寫產品提供5小時免費試用,每帳號限領取一次
  • 套餐使用情況請通過“控制臺-我的應用-XXX(某個具體應用)-語音轉寫-服務管理”進行相關查詢

疑問解答

  • “語音轉寫 ”與 “語音聽寫 ”的區別是?

  • 產品名稱 支持的音頻時長 使用場景
    語音聽寫 一分鐘以內 人機對話,如輸入法、語音搜索
    語音轉寫 五小時以內 更自然地貼近日常的對話和演講
  • “已錄制音頻轉寫”和“實時音頻流轉寫”的區別是?

  • 已錄制音頻(recorded audio)轉寫:將預先錄制完畢的完整音頻文件傳輸至云端,轉寫服務處理完成后將輸出此音頻對應的完整文字結果。該流程為異步&非實時;

    實時音頻流(real-time streaming)轉寫:在采集音頻的同時,連續上傳音頻流至云端,轉寫服務將實時返回文字結果。可以實現文字和聲音的同步展現。

    實時語音轉寫已上線,歡迎使用。
查看更多