提高AutoSub語音轉文字辨識率的測試方法
AutoSub基本原理介紹
Google語音平台只能處理短語句,且不會回傳時間軸,因此語音的斷句是AutoSub以auditok模組做切割,再將切割後的一段一段的短語句傳給Google轉成文字再接收回來,AutoSub再加上時間軸而產生SRT檔案。
影響斷句效果的因素有下列幾個:
* 錄音設備的效果
* 錄音環境的雜音
* 說話的語氣、習慣
* 句間停頓的時間長短
我們測試的方法就是以變更auditok模組的參數來得到較佳的辨識率,以提升製作字幕的效率。
請留意:本人不具音效控制的知識,只能大致由autosub -h
的說明檔案裡 auditok 這段的參數來推測,因此若有音效專家發現問題,請留言告知。
測試AutoSub的批次檔
為了方便測試撰寫了一支測試用的批次檔 test.bat。請先由https://github.com/emisjerry/autosub-ahk/releases下載最新版的autosub-ahk後,將test.bat放置在解壓縮資料夾裡:
批次檔內容:https://gist.github.com/emisjerry/088c5e519c0337db4c281c0d03504d0b
set CURR_TIME=%TIME::=%
set OUTPUT=%CURR_TIME%.srt
set VIDEO_DIR=D:\jerry\ActivePresenter\autosub-ahk2\Video
set VIDEO_FILE=autosub-ahk.mp4
set PARAM=-et 55 -mxrs 6 -mxcs 0.2 -mnrs 0.8
rem ----- Run it -----
autosub\autosub -S cmn-hant-tw -i "%VIDEO_DIR%\%VIDEO_FILE%" -o "%VIDEO_DIR%\%OUTPUT%" %PARAM%
start "subtitle" %VIDEO_DIR%\%CURR_TIME%.cmn-hant-tw.srt
控制參數有4個:
-et 控制音量
-mxrs 語句的最長秒數
-mxcs 連續靜音的最長秒數,語句之間的停頓秒數
-mnrs 語句的最短秒數
測試結果
測試的標的是我前先錄製的[AHK#36] 自製AutoSub圖形介面工具由影片產生字幕:AutoSub-AHK;Windows適用,總長6分20秒。
- pyTranscriber使用的AutoSub 0.4.0沒有變更auditok的參數,因此沒有變更或改善的機會。
- 138個語句
- 0.5.7-Alpha預設的主要參數如下:
-et 45 -mxrs 10 -mxcs 0.2 -mnrs 0.5
- 37個語句
- 幾乎都是9.990秒語句
- 0.5.6-Alpha預設的主要參數如下:
-et 50 -mxrs 6 -mxcs 0.2 -mnrs 0.8
- 73個語句
- 有不少5.990秒的語句
- 用0.5.7-Alpha變更參數
-et 55 -mxrs 6 -mxcs 0.2 -mnrs 0.5
- 137個語句
- 約5個5.990秒語句
- 用0.5.7-Alpha變更參數
-et 55 -mxrs 6 -mxcs 0.1 -mnrs 0.5
- 166個語句
教學影片
##
您可能也會有興趣的類似文章
- [AHK#46] AutoSub-AHK自行增加語言的方法 (0則留言, 2021/05/31)
- [AHK#36] 自製AutoSub圖形介面工具:AutoSub-AHK;Windows適用 (7則留言, 2020/05/15)
- 捕捉每次點擊:用Keyviz展示你的按鍵操作,讓教學影片更生動 (0則留言, 2024/04/07)
- AHK61|Window的AutoHotkey .ahk與.ahk2檔案關聯-使用assoc與ftype命令 (0則留言, 2024/02/25)
- 使用AutoHotkey彈出對話窗,依回應執行不同動作 (0則留言, 2019/12/11)
- AHK60|AutoHotkey++擴充設定詳解與Code Snippets設置;使用VS Code (0則留言, 2024/02/24)
- [AHK#38] 快速跳過片頭的按鍵操作─PotPlayer輸入移動位置 (0則留言, 2020/10/04)
- AHK59|使用VS Code開發AutoHotkey-編輯、執行與除錯 (0則留言, 2024/02/11)
- 能離線使用的語音識別工具:Buzz,使用OpenAI Whisper神經網路,正確率高 (0則留言, 2022/12/04)
- 用命令行直接透過Gmail寄信,可以快速寄出電子書檔案給Kindle接收(AHK #8) (0則留言, 2019/06/15)
- AutoHotkey輸出中文的方法 (19則留言, 2008/03/01)
- 免費影片後製軟體《剪映》語音辨識上字幕和簡轉繁技巧~JianYing (0則留言, 2021/07/24)
- [AHK#39] 尋找網頁上特定文字並啟動的簡單作法 (0則留言, 2020/12/12)
- 用AutoHotkey輕鬆製作螢幕小鍵盤 (16則留言, 2008/03/16)
- [AHK#49] 整批多語言翻譯的2個方法:Google試算表與AutoHotkey脚本 (0則留言, 2021/10/15)
1 個回應
求職
提高AutoSub語音轉文字辨識率的測試方法 | 簡睿隨筆 | 學習過程的紀錄與備忘