2016年4月18日 星期一

Subtitle Edit OCR 文字辨識,將 sup/sub 轉成 srt 字幕,用 TesserAct 做比對

此篇為字幕編輯修改軟體 Subtitle Edit 之使用教學,連結總整理 [ 主篇目錄 ] 之分篇。

[圖文教學] 教你該如何使用 Subtitle Edit 將 Blu-ray 藍光的 .sup 圖片型字幕,或 DVD 之 .sub / .idx 圖片型字幕,轉換成 .srt 文字型字幕

Subtitle Edit 這套字幕處理軟體,有個 OCR 功能,用於識別 SUP 圖形或 SUB 圖形裡面的文字;

所以先要了解 OCR 是什麼意思,可參考 zh.wikipedia.org 內的解說;

簡單的來說,就是辨識圖片內的文字,或識別圖形內的文字,這樣的功能,就叫做 OCR 光學字符識別。



額。。。由於有不少英文字幕的影片,所以本篇的範例,先用英文字幕做比對,然後大家可以參考[Subtitle Edit 使用教學] 自動翻譯,能將英文字幕,自動翻成中文字幕這篇,將英文字幕,自動翻成中文字幕,之後再做修正,這樣可以提高英翻中的作業速度。

步驟一、開啟要處理的 .sup 或 .sub 檔案。

建議,將副檔名顯示出來,方便查看檔案類型;
你可以檔案 → 開啟,或指定類型,或是點擊 [ 開啟 ] 按鈕;
選取要處理的 .sup 或 .sub 檔案,然後點擊開啟。


步驟二、字幕框點點,看看字幕裡面有沒有斜體,如果有斜體,斜體記得打勾;
OCR 自動修正/拼字檢查,那個字典切成英文(美國),下方其他參數參考圖中。


步驟三、字幕框點回最開頭,然後點擊 [ 開始進行 OCR ] 按鈕。


步驟四、檢查字幕框橘黃色部分,修正識別錯誤的文字,ok無誤後點擊 [ 確定 ] 按鈕。


步驟五、儲存 srt 檔案。
點擊 [ 儲存 ] 按鈕;
點擊 [ 存檔 ] 按鈕;


然後參考[Subtitle Edit 使用教學] 自動翻譯,能將英文字幕,自動翻成中文字幕這篇,將英文字幕,自動翻成中文字幕,之後再做修正。



額。。。由於 TesserAct 提供的中文字符圖形比對資料庫,目前效果不是很好;不過未來,可能會更好,所以要知道一下,如何使用他。

步驟一、開啟要處理的 .sup 或 .sub 檔案。

你可以檔案 → 開啟,或指定類型,或是點擊 [ 開啟 ] 按鈕;
選取要處理的 .sup 或 .sub 檔案,然後點擊開啟。


步驟二、下載繁體中文字典,就是字符比對用的模板。

第一次使用,點選語言右邊的按鈕,會出現 [ 是否需要字典? ] 視窗;
選到 Chinese Traditional 傳統中文,然後點擊下載;


待下載完成後,確定 → 確定;


將語言切到 Chinese Traditional 傳統中文。


步驟三、取消 [ 斜體 ] 勾勾,取消 [ 音符 ] 勾勾;
OCR 自動修正/拼寫檢查,切無;
下方參數全部取消,參考圖中設定。


步驟四、點擊 [ 開始進行 OCR ] 按鈕。


步驟五、修正識別錯誤的文字。

模糊比對中文,其實效果有限,接下來,就是練打字的時間了,將每一行,有錯的部分,進行修正。

注意一下,裡面的 <br /> 這串,是換行標簽,就是有2行時,第1行字尾,會補上 <br /> 這個標簽,他不是亂碼,在修改中,請不要刪了他。

全部修正完畢後,點擊 [ 確定 ] 按鈕。


步驟六、儲存 srt 檔案。

點擊 [ 儲存 ] 按鈕;
點擊 [ 存檔 ] 按鈕;
可以使用 notepad++ 之類的文字編輯軟體,查看 .srt 檔案的內容。




其他事項:

如果你是用成外掛式字幕,要注意 .srt 字幕檔之檔名,必須要與影片檔名相同;
這樣影音播放軟體,才能自動由外部抓取字幕。


如果要用成 ass 特效字幕,請參考[Subtitle Edit 使用教學] 將 srt 字幕轉換成 ass 字幕,及 ass 樣式調整這篇。

由於修正中文字的時間要很久,如果你只是要讓影音播放軟體,能夠顯示字幕,可參考使用 BDSup2Sub 將 Blu-ray 藍光的 SUP 字幕,轉成 DVD 之 SUB/IDX 字幕這篇,將 SUP 字幕轉成 SUB/IDX 字幕,這樣也行;只是 srt 字幕比較普及,汎用率較高;當然有時間能夠用成 srt 字幕,那是最好。

後續文章 → Subtitle Edit OCR 文字辨識,將 sup/sub 轉成 srt 字幕,用自建資料庫做比對

返回目錄 → 字幕編輯修改軟體 Subtitle Edit 之使用教學,連結總整理 [ 主篇目錄 ]



對上述圖文教學,還不太明白的話,請至下方連結,查看 youtube 視頻解說。

視頻解說之第一部分:https://youtu.be/e1niT9jagbk

謝謝大家,抽空觀看,files備份檔名:software 00000188
如果很久,才用一次,怕忘記,可將本篇連結,貼至您的 facebook 或 google+

沒有留言:

張貼留言