2013年7月15日 星期一

notepad++ 配合 OpenOffice 簡體轉繁體UTF-8

現在大部份的php腳本都是開源,只有少數才使用zend加密,像 中國站長站 上方點 php源碼 ,就可以看到一大堆程序,上方還有分類,可選擇想要的種類,唯一的缺點就是都簡體,只有極極少數,才有支援繁體或多國語。

比較有規劃的php源碼,都會把語言及模板分離出來,這樣是最好,只要將導入mysql所需sql檔及語言檔和模板檔,用ConvertZ轉就好了,參考下述2則:

簡繁轉換工具 ConvertZ 下載及使用教學ConvertZ 針對網頁簡繁轉換之特別解說

用ConvertZ將php源碼目錄全轉,這是不可行的,轉完後跑起來會有問題,似乎是缺字造成,畢竟ConvertZ已經很久沒更新了。

算是後來才知道OpenOffice有簡轉繁的功能,似乎微軟的word也有此功能,但畢竟OpenOffice是免費,於是就去下載回來試試,開始時遇到一個問題,就是開啟的檔案,內有htm代碼,它會自動解析,很煩人,也找不到在那關掉,最後改用notepad++先切換成簡體,再貼到OpenOffice內,由簡體轉換成繁體後,再copy貼回notepad++,因為還要轉成utf-8不帶bom格式,不能直接用big5的,沒做asscii92處理,跑起來會有許功蓋問題,目前只有早期開站至今的網站還在用破爛big5,比較後來的網站都是使用utf-8編碼,utf-8問題少,相容性也高。

此則教學就是使用notepad++加上OpenOffice來進行簡轉繁,雖然是土法煉鋼的方式,一個檔一個檔的轉,但一次開個10檔配合快速鍵,數百個檔案,其實還ok能接受,後來我用此方式測試了一個之前想轉的php源碼,162100 PHP文本論壇 繁中UTF8,轉完後跑起來,還滿ok的沒什麼問題,因此key了這篇教學,和大家分享簡轉繁心得。

軟體:notepad++編輯軟體OpenOffice官網

快速鍵說明「 這大家應該都很熟 」,沒使用快鍵的話,八成會按死,而且還可能滑鼠沒點好出錯:

ctrl+a 全選
ctrl+c 複製
ctrl+v 貼上

下面就是我轉簡體文本論壇至繁體utf-8的範例:

使用 notepad++ 一次開起10個檔左右,並將這些檔的編碼切至簡體gb2312,注意這只是切換成簡體,並不是將亂碼轉換簡體,切換和轉換,這2者是不同的意思。



轉換成utf-8不含bom,這邊才是轉換,就是將gb2312轉換成utf-8不含bom的編碼。



將每行的尾部多餘空白清掉提高點效率,有的開發者都沒清掉尾部空白><。



將所有開啟的檔案,都執行上述步驟,然後用快速鍵 → 全選 〉複製,將內容貼到OpenOffice文字文件上,然後工具 〉語言 〉簡轉繁。







OpenOffice的快速鍵也相同,將轉好的內容,用快速鍵 → 全選 〉複製,然後貼回到notepad++對應的內容檔案上。



百來個檔案都轉完後,還要使用notepad++查找一下htm標頭的charset是否為utf-8,因為瀏覽器會抓那個值,來判斷用那種編碼來開啟該網頁,如果內容是utf-8,而charset的值是gb2312或gbk,那麼開啟來,除了亂碼還是亂碼。

當然不是每個檔案都打開來搜索,那會死人,在notepad++有個很棒的功能,就是指到要查找的路徑,它會對裡面所有的目錄及檔案做逐一比對,然後列出查找字串出現在那個檔案裡面及在第幾行,算是非常的方便,參考下圖:



使用OpenOffice簡轉繁,有些字翻的很怪,例如:注冊的注應該是註、前后的后應該是後。。。等字,也可參考上圖方式,查找所有檔案,在分別做修改。

將上述步驟,操作過一到二次應該就能明白了,至於其它腳本如:discuz插件及風格,也是可以用此方式簡繁轉換,於其等別人轉,不如自已轉。


其他相關文章 → 99_簡繁轉換相關

沒有留言:

張貼留言