Subtitle Edit OCR 文字辨識,將 sup/sub 轉成 srt 字幕,用 TesserAct 做比對

[圖文教學] 教你該如何使用 Subtitle Edit 將 Blu-ray 藍光的 .sup 圖片型字幕,或 DVD 之 .sub / .idx 圖片型字幕,轉換成 .srt 文字型字幕

Subtitle Edit 這套字幕處理軟體,有個 OCR 功能,用於識別 SUP 圖形或 SUB 圖形裡面的文字

所以先要了解 OCR 是什麼意思,可參考 wikipedia 光學字元辨識 內的解說

簡單的來說,就是辨識圖片內的文字,或識別圖形內的文字,這樣的功能,就叫做 OCR 光學字符識別





額...由於有不少英文字幕的影片,所以本篇的範例,先用英文字幕做比對,然後大家可以參考 [Subtitle Edit 使用教學] 自動翻譯,能將英文字幕,自動翻成中文字幕 這篇,將英文字幕,自動翻成中文字幕,之後再做修正,這樣可以提高英翻中的作業速度

步驟一、開啟要處理的 .sup 或 .sub 檔案

建議,將副檔名顯示出來,方便查看檔案類型

你可以檔案 → 開啟,或指定類型,或是點擊 [ 開啟 ] 按鈕

選取要處理的 .sup 或 .sub 檔案,然後點擊開啟




步驟二、字幕框點點,看看字幕裡面有沒有斜體,如果有斜體,斜體記得打勾

OCR 自動修正/拼字檢查,那個字典切成英文(美國),下方其他參數參考圖中




步驟三、字幕框點回最開頭,然後點擊 [ 開始進行 OCR ] 按鈕




步驟四、檢查字幕框橘黃色部分,修正識別錯誤的文字,ok無誤後點擊 [ 確定 ] 按鈕




步驟五、儲存 srt 檔案

點擊 [ 儲存 ] 按鈕
點擊 [ 存檔 ] 按鈕




然後參考 [Subtitle Edit 使用教學] 自動翻譯,能將英文字幕,自動翻成中文字幕 這篇,將英文字幕,自動翻成中文字幕,之後再做修正





額...由於 TesserAct 提供的中文字符圖形比對資料庫,目前效果不是很好;不過未來,可能會更好,所以要知道一下,如何使用他

步驟一、開啟要處理的 .sup 或 .sub 檔案

你可以檔案 → 開啟,或指定類型,或是點擊 [ 開啟 ] 按鈕

選取要處理的 .sup 或 .sub 檔案,然後點擊開啟




步驟二、下載繁體中文字典,就是字符比對用的模板

第一次使用,點選語言右邊的按鈕,會出現 [ 是否需要字典? ] 視窗

選到 Chinese Traditional 傳統中文,然後點擊下載




待下載完成後,確定 → 確定




將語言切到 Chinese Traditional 傳統中文




步驟三、取消 [ 斜體 ] 勾勾,取消 [ 音符 ] 勾勾

OCR 自動修正/拼寫檢查,切無

下方參數全部取消,參考圖中設定




步驟四、點擊 [ 開始進行 OCR ] 按鈕




步驟五、修正識別錯誤的文字

模糊比對中文,其實效果有限,接下來,就是練打字的時間了,將每一行,有錯的部分,進行修正

注意一下,裡面的 <br /> 這串,是換行標簽,就是有2行時,第1行字尾,會補上 <br /> 這個標簽,他不是亂碼,在修改中,請不要刪了他

全部修正完畢後,點擊 [ 確定 ] 按鈕




步驟六、儲存 srt 檔案

點擊 [ 儲存 ] 按鈕
點擊 [ 存檔 ] 按鈕

可以使用 notepad++ 之類的文字編輯軟體,查看 .srt 檔案的內容







其他事項

如果你是用成外掛式字幕,要注意 .srt 字幕檔之檔名,必須要與影片檔名相同

這樣 萬能影音播放器 才能自動由外部抓取字幕




如果要用成 ass 特效字幕,請參考 [Subtitle Edit 使用教學] 將 srt 字幕轉換成 ass 字幕,及 ass 樣式調整


由於修正中文字的時間要很久,如果你只是要讓 萬能影音播放器 能夠顯示字幕,可參考 使用 BDSup2Sub 將 Blu-ray 藍光的 SUP 字幕,轉成 DVD 之 SUB/IDX 字幕 這篇,將 SUP 字幕轉成 SUB/IDX 字幕,這樣也行;只是 srt 字幕比較普及,汎用率較高;當然有時間能夠用成 srt 字幕,那是最好


後續文章 → Subtitle Edit OCR 文字辨識,將 sup/sub 轉成 srt 字幕,用自建資料庫做比對


返回目錄 → ( 字幕編輯修改軟體 Subtitle Edit ) 之使用教學,連結總整理


對上述圖文教學,還不太明白的話,請至下方連結,查看 youtube 視頻解說

視頻解說之第一部分 https://www.youtube.com/watch?v=mG5wK5S739M

謝謝大家,抽空觀看,files備份檔名 converters01078

Teach you how to use OCR TesserAct on Subtitle Edit software

3 則留言:


  1. 请问Subtitle edit OCR 里面的下载地方也没有中文字幕可以下载,要去那里下载呢?

    回覆刪除
  2. 識別後的錯誤很多, 請問是否有好方法提高準確率?

    回覆刪除

由於經常被灌水,所以您再發表留言之後,需要耐心的等待博客主之審核,於審核過後才會公開您的留言,因此請您不要重複的留言,謝謝您的留言。
Hello my friend, I have no money, I am very poor, My blog is super chill, I welcome your comments, but in order to maintain a healthy discussion, please avoid spam or irrelevant comments.