Re: [MozTW-Dev] Re: 不知道該不該發這篇
=============================================
引言回覆:
Hung-Te Lin (piaip) 2005/9/28 上午 9:39
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
話說回來,關於 Mozilla 的 Big5 Table 我覺得有些想變動的地方
當年修訂的表格雖然大至與 TW-Big5 相容,但畢竟不是 Big5-2003
我想把它改為正式使用 Big5-2003 的版本
只是網路上 cns11643 好像沒有真正提供檔案 ><
唯一的版本只有 kcwu 的轉換表,感覺會給人不像正式資料的感覺
另外, Mozilla 支援 Big5 日文這麼久了,有哪些問題也大概了解,
最常看到的就是「從日文網頁(sjis or unicode)剪貼到 big5 網頁」
此時會轉出 big5 日文結果用純 cp950 的人就看不到
假定 Windows 短期內不會修正,我在想或許我們可以把 mozilla
unicode->big5 的對應表變成純 CP950,只有 Big5->Unicode 才是 Big5-2003
這樣應該問題會少很多。
這樣想的話,關於 UAO (Unicode 補完計畫, 以下以2.40a3 為主) 要不要進來或許也可以
在不與 Big5-2003 衝突的前提下加進來 (只給讀取用)
UAO 進來其實以「最廣泛的 extension」名義應該可以,但怕的是
(1) 影響自動偵測,因為 UAO 的 code range 比較大,而且還用了所謂 C1 區 (0x80~0x9F)
(2) 有些與 Big5-2003 衝突的字
上面兩點解決後,或許一切可以更美好...
只是不知道能不能趕上 1.5, 太晚動手了。
--
Hun...@gmail.com , <pi...@csie.ntu.edu.tw>
http://ntu.csie.org/~r92030/gmailtree/img/radial.png引言回覆:
Jose Sun 2005/9/28 下午 7:12
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
http://pingyeh.net/big5/這可以算權威資料嗎? 不過也不是官方的就是...
> 當年修訂的表格雖然大至與 TW-Big5 相容,但畢竟不是 Big5-2003
> 我想把它改為正式使用 Big5-2003 的版本
> 只是網路上 cns11643 好像沒有真正提供檔案 ><
> 唯一的版本只有 kcwu 的轉換表,感覺會給人不像正式資料的感覺
--
Jose Sun
引言回覆:
s793016 (Witch Five) 2005/9/28 下午 7:30
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
Hung-Te Lin (piaip) wrote:
> 話說回來,關於 Mozilla 的 Big5 Table 我覺得有些想變動的地方
>
> 當年修訂的表格雖然大至與 TW-Big5 相容,但畢竟不是 Big5-2003
> 我想把它改為正式使用 Big5-2003 的版本
> 只是網路上 cns11643 好像沒有真正提供檔案 ><
> 唯一的版本只有 kcwu 的轉換表,感覺會給人不像正式資料的感覺
關於這點,其實 cns11643
有提供詳細對照表,可是要拿到這份對照表,您必需去他的網站填一份「中文」切結資料,而且還要收台票300元,然後他才會慢慢的寄一張
cd 給您 ... orz
...
給人感覺上他們並不想人拿到這個東西的感覺,也因此我並不想花這300元。
另,當然我對 big5-2003 正式進入 gecko based
環境是給正面期待的。
> 另外, Mozilla 支援 Big5 日文這麼久了,有哪些問題也大概了解,
> 最常看到的就是「從日文網頁(sjis or unicode)剪貼到 big5 網頁」
> 此時會轉出 big5 日文結果用純 cp950 的人就看不到
這個問題其實跟 windows 內建 big5-2003
會遇到的問題一樣,簡單說,unicode
補完計畫到目前為止會被人唸的點,除了 1.不是標準
2.漢字對應
這兩點,其它的所有問題,只要您的系統內定使用
big5-2003,這些系統會必需全部照單全收這些「所謂的缺點」。
> 假定 Windows 短期內不會修正,我在想或許我們可以把 mozilla
> unicode->big5 的對應表變成純 CP950,只有 Big5->Unicode 才是 Big5-2003
> 這樣應該問題會少很多。
> 這樣想的話,關於 UAO (Unicode 補完計畫, 以下以2.40a3 為主) 要不要進來或許也可以
> 在不與 Big5-2003 衝突的前提下加進來 (只給讀取用)
我想如果 mozilla.org
那邊要搞這個大概會瘋掉吧,呵呵。而且就我認知他們不可能搞。
> UAO 進來其實以「最廣泛的 extension」名義應該可以,但怕的是
> (1) 影響自動偵測,因為 UAO 的 code range 比較大,而且還用了所謂 C1 區 (0x80~0x9F)
其實目前就會把 big5-hkscs 的字蓋掉了,選編碼也沒用
... org
> (2) 有些與 Big5-2003 衝突的字
這個我只知道幾點吧?
1.Big5-2003 C255 <-> U+5F5E,CP950 (& uao) C255 <-> U+5F5D。
2.Big5-2003 的 8140-a0fe、c8d4-c8fe、fa64-fefe 是造字區,uao
這些地方塞滿了字。
3.Big5-2003 的 c7f3-c875
全部當成「保留區」,理由:cns11643 沒這些東西。uao
這些地方放了原先的俄語字母。
4.Big5-2003 的 c8a5-c8cc 全部當成「保留區」,不過 uao
在這挖了幾個字放半角假名。
5.Big5-2003 的 c8a5-c8cc 全部當成「保留區」,不過 uao
在這挖了幾個字放半角假名。
其它 ... 或許 c6
段有幾個字對應不太一樣,不過大致上最大的不同就如上面這些。
引言回覆:
Hung-Te Lin (piaip) 2005/9/28 下午 9:17
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
在 2005/9/28,s793016(WitchFive) <s79...@gmail.com> 撰寫:
> > 只是網路上 cns11643 好像沒有真正提供檔案 ><
> > 唯一的版本只有 kcwu 的轉換表,感覺會給人不像正式資料的感覺
> 關於這點,其實 cns11643 有提供詳細對照表,可是要拿到這份對照表
> 給人感覺上他們並不想人拿到這個東西的感覺,也因此我並不想花這300元。
那一份應該是跟 kcwu 同的
http://www.csie.ntu.edu.tw/~r92030/project/big5/ 只是沒有 .gov.tw 的網址... 可惜
> > 假定 Windows 短期內不會修正,我在想或許我們可以把 mozilla
> > unicode->big5 的對應表變成純 CP950,只有 Big5->Unicode 才是 Big5-2003
> 我想如果 mozilla.org 那邊要搞這個大概會瘋掉吧,呵呵。而且就我認知他們不可能搞。
嗯... 再試試吧,我是覺得如果我們能提供好的資料,一切都有談的機會。
https://bugzilla.mozilla.org/show_bug.cgi?id=310299> 其實目前就會把 big5-hkscs 的字蓋掉了,選編碼也沒用
你是說 UAO240a3 嗎?
如果把 hkscs 的字保留下來,不知道對 UAO 影響多少?
> > (2) 有些與 Big5-2003 衝突的字
> 這個我只知道幾點吧?
> 1.Big5-2003 C255 <-> U+5F5E,CP950 (& uao) C255 <-> U+5F5D。
說實在我不清楚 5F5E/5F5D 差在哪裡... 細明體看起來一樣字?
> 2.Big5-2003 的 8140-a0fe、c8d4-c8fe、fa64-fefe 是造字區,uao
> 這些地方塞滿了字。
造字區我想勉強可以不算為衝突,因為反正一般人看都是空白
> 3.Big5-2003 的 c7f3-c875
> 全部當成「保留區」,理由:cns11643 沒這些東西。uao
> 這些地方放了原先的俄語字母。
是的,這點我想是 CNS11643 比較 OOXX 的地方
> 4.Big5-2003 的 c8a5-c8cc 全部當成「保留區」,不過 uao
> 在這挖了幾個字放半角假名。
> 5.Big5-2003 的 c8a5-c8cc 全部當成「保留區」,不過 uao
> 在這挖了幾個字放半角假名。
跟上面一樣,假定我們放棄 big5-2003 standard 之名,
而生出與 big5-2003 大致相容的大字集,或許也不是不行
我的看法是,假定有字在 big5-2003 是保留、或是一般顯示空白的造字,
那就可以塞 UAO 進去,因為一般人看也是空白,所以我們顯示 Ok。
但跟 big5-hkscs 不相容的地方就不太好了,因為香港用戶很多時候
是 big5/big5-hkscs 混用的,希望不要影響到他們。
其實我對 big5-hkscs 有哪些 code range 被 uao 蓋掉不太清楚,
可以麻煩你分析一下嗎?
--
Hun...@gmail.com , <pi...@csie.ntu.edu.tw>
http://ntu.csie.org/~r92030/gmailtree/img/radial.png引言回覆:
s793016 (Witch Five) 2005/9/28 下午 11:26
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
Hung-Te Lin (piaip) wrote:
> 在 2005/9/28,s793016(WitchFive) <s793016@gmail.com> 撰寫:
> > > 假定 Windows 短期內不會修正,我在想或許我們可以把 mozilla
> > > unicode->big5 的對應表變成純 CP950,只有 Big5->Unicode 才是 Big5-2003
> > 我想如果 mozilla.org 那邊要搞這個大概會瘋掉吧,呵呵。而且就我認知他們不可能搞。
> 嗯... 再試試吧,我是覺得如果我們能提供好的資料,一切都有談的機會。
>
https://bugzilla.mozilla.org/show_bug.cgi?id=310299靜觀其變。
> > 其實目前就會把 big5-hkscs 的字蓋掉了,選編碼也沒用
> 你是說 UAO240a3 嗎?
> 如果把 hkscs 的字保留下來,不知道對 UAO 影響多少?
我發現我原來的理解錯了 ...
果然人不能太信任模糊的印像 ... orz
關於這個,實測結果是,不會有影響。末段會詳述。
> > > (2) 有些與 Big5-2003 衝突的字
> > 這個我只知道幾點吧?
> > 1.Big5-2003 C255 <-> U+5F5E,CP950 (& uao) C255 <-> U+5F5D。
> 說實在我不清楚 5F5E/5F5D 差在哪裡... 細明體看起來一樣字?
也沒人知道為什麼這樣選。細明體其實不太準,用標楷體看看,小字或許看不出來,放到144試試。
> > 3.Big5-2003 的 c7f3-c875
> > 全部當成「保留區」,理由:cns11643 沒這些東西。uao
> > 這些地方放了原先的俄語字母。
> 是的,這點我想是 CNS11643 比較 OOXX 的地方
big5 草稿跟 big5-2003 定稿 (kc wu 版) 的差別:
1.a3e2-a3fe - 保留區 - 草稿對應到造字,正版無
2.c6de、c6df - 重碼刪字 - 草稿對應到造字,正版無
3.c7f3-c8fe - 保留區 - 草稿對應到造字,正版無
> > 4.Big5-2003 的 c8a5-c8cc 全部當成「保留區」,不過 uao
> > 在這挖了幾個字放半角假名。
> > 5.Big5-2003 的 c8a5-c8cc 全部當成「保留區」,不過 uao
> > 在這挖了幾個字放半角假名。
> 跟上面一樣,假定我們放棄 big5-2003 standard 之名,
> 而生出與 big5-2003 大致相容的大字集,或許也不是不行
> 我的看法是,假定有字在 big5-2003 是保留、或是一般顯示空白的造字,
> 那就可以塞 UAO 進去,因為一般人看也是空白,所以我們顯示 Ok。
這個嘛 ...
其實最近可能會有一版出來,所以才會有那個程式修改的需求,而且我覺得
... 搞不好是最後一版了,呵呵。
> 但跟 big5-hkscs 不相容的地方就不太好了,因為香港用戶很多時候
> 是 big5/big5-hkscs 混用的,希望不要影響到他們。
>
> 其實我對 big5-hkscs 有哪些 code range 被 uao 蓋掉不太清楚,
> 可以麻煩你分析一下嗎?
這部份 ... 我剛發現 ... 我以前理解錯了 ... orz
實驗網頁:
http://input.foruto.com/jptxt/arti003.htm我用 windows me 繁中版,mozilla 1.7.12 繁中版,補完過的
uconv.dll,把這頁編碼設成 big5-hkscs 看的樣子:
https://googledrive.com/host/0BxHqn7o9v ... ample1.jpg朋友用 windows xp sp2 日文版,firefox 1.4 日語版
(未補完),把這頁編碼設成 big5-hkscs 看的樣子:
https://googledrive.com/host/0BxHqn7o9v ... ample2.jpg所以,其實 uao 對 mozilla 下的 hkscs
編碼,沒有任何影響 ...
以前我理解錯是因為那些「?」、「韓文」...
我以為那些字被補完蓋掉了 ... orz
引言回覆:
s793016 (Witch Five) 2005/9/28 下午 11:33
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
does anyone know where to get "fromu" and "tou" which is required to
generate new table of Mozilla Big5 table?
補充:
這個 mozilla source 裡有,不過您得要自己 compile
出來用,用法是跟 dos 下的 find 命令一樣一律 i/o
轉向,輸入用 < 輸出用 > ...
如果您真想玩我可以提供。
引言回覆:
Hung-Te Lin (piaip) 2005/9/29 上午 12:49
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
在 2005/9/28,s793016(WitchFive) <s79...@gmail.com> 撰寫:
> 這個嘛 ... 其實最近可能會有一版出來,所以才會有那個程式修改的需求,
> 而且我覺得 ... 搞不好是最後一版了,呵呵。
呃,那你要不要趕快搞定,直接一起塞進 Mozilla big5 table
跟前版差異很多嗎?
> > 但跟 big5-hkscs 不相容的地方就不太好了,因為香港用戶很多時候
> > 是 big5/big5-hkscs 混用的,希望不要影響到他們。
> 這部份 ... 我剛發現 ... 我以前理解錯了 ... orz
這個我還不能確定,理由如下
> 實驗網頁:
http://input.foruto.com/jptxt/arti003.htm> 所以,其實 uao 對 mozilla 下的 hkscs 編碼,沒有任何影響 ...
你的實驗證明的是 "Firefox 的 big5-hkscs 看 big5-hkscs 網頁 ok"
但由於 firefox 的 big5 table 是自己處理的(自己 big5<->unicode),
所以其實本來就不受影響,因為 Firefox 會轉成 unicode 顯示。
但是,正如實驗網頁提到的,香港很多人不是使用修正過的 big5 table
而是安裝外字集 (EUDC)。
我的理解是(或許我有誤會),他們的做法是建立 CP950 字型造字區的
字型,而非改變 Unicode mapping
在這樣的前提下,一個有安裝外字集但使用標準 IE +CP950 的人,
也能 "看到" 香港字 (但 Unicode mapping 應該不是正確的)
回到 UAO 的 case, 這樣如果 UAO 使用了不同的 mapping, 則這些
本來可以看到香港字的人反而會看到 UAO 的字,結果就出問題了
不過我真的對香港 Big5-hkscs 不太熟,上面只是我的推測
找人來確認一下嗎....
--
Hun...@gmail.com , <pi...@csie.ntu.edu.tw>
http://ntu.csie.org/~r92030/gmailtree/img/radial.png引言回覆:
Hung-Te Lin (piaip) 2005/9/29 上午 2:01
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
在 2005/9/29,Hung-Te Lin (piaip) <hun...@gmail.com> 撰寫:
> 在這樣的前提下,一個有安裝外字集但使用標準 IE +CP950 的人,
> 也能 "看到" 香港字 (但 Unicode mapping 應該不是正確的)
> 回到 UAO 的 case, 這樣如果 UAO 使用了不同的 mapping, 則這些
> 本來可以看到香港字的人反而會看到 UAO 的字,結果就出問題了
> 不過我真的對香港 Big5-hkscs 不太熟,上面只是我的推測
> 找人來確認一下嗎....
我在家裝了香港外字集
裝過 unicode-at-on 但已移除
結果 IE 看得到那些字
Fx big5-hkscs 部份是問號 (maybe ext.B)
Fx Big5 仍然是錯誤的字
等於跟是否安裝外字集完全無關...
或許我之前的假設有誤? 到 forum 上問問好了
如果香港用 Fx/Big5 本來就看不到香港字...
那我們就用力 UAO 下去吧
--
Hun...@gmail.com , <pi...@csie.ntu.edu.tw>
http://ntu.csie.org/~r92030/gmailtree/img/radial.png引言回覆:
s793016 (Witch Five) 2005/9/29 上午 7:38
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
hkscs 用的是跟我們一樣的 nls
代換法。應該這麼說,補完是學 hkscs 作 nls
代換的。基本上香港鼓吹用 unicode 取代 big5 hkscs
的人比台灣早很多,因為他們的 hkscs 早就長大到 big5
造字區不夠用了,ext-a ext-b 幾千個 hkscs
字啊,每年還會生出幾十個新字。
還有就是,因為 ie 下 big5 & big5 hkscs
其實不是分開的,所以在 ie 這種 system wide
的環境,補完 跟 hkscs 只能選一個,不過 gecko based
就不一樣了,他可以即時切換,windows 沒辦法。
引言回覆:
Hung-Te Lin (piaip) 2005/9/29 上午 11:11
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
在 2005/9/29,Hung-Te Lin (piaip) <hun...@gmail.com> 撰寫:
> > does anyone know where to get "fromu" and "tou" which is required to
> > generate new table of Mozilla Big5 table?
> > 這個 mozilla source 裡有,不過您得要自己 compile
> source 的哪邊? 提示一下是哪個目錄跟名字我去 build 吧,
> 我用 lxr 找不到 fromu 這種名字的東西
找到了,原來是 /intl/uconv/tools/umaptable.c
*.uf 指的是 unicode->big5, *.ut 是 big5->unicode 對吧?
我打算做個 patch 來試試看, UAO 那邊新的 table 完成還要很久嗎?
可以給我一份單向對應(b->u)的表嗎? 上次拿到的 uc-o2n.tbl 沒有單向雙向的資訊,
(2.40a3 的有),不太確定能不能直接用。
--
Hun...@gmail.com , <pi...@csie.ntu.edu.tw>
http://ntu.csie.org/~r92030/gmailtree/img/radial.png引言回覆:
dken 2005/9/29 下午 12:37
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
http://pingyeh.net/big5/上次 debian 慶生會,ping 有向我提到他們在做這件事,而且他們是計畫開放出來,
並將這套字碼推廣為標準用。
如果 moztw 這邊要搞,可以一起參與,這樣力量也不會過於分散。
我想 ping 會很樂意的。
On 9/28/05, Hung-Te Lin (piaip) <hun...@gmail.com> wrote:
> 那一份應該是跟 kcwu 同的
>
http://www.csie.ntu.edu.tw/~r92030/project/big5/> 只是沒有 .gov.tw 的網址... 可惜
>
--
To be or not to be, that is the question!
引言回覆:
Hung-Te Lin (piaip) 2005/9/29 下午 4:23
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
在 2005/9/29,Hung-Te Lin (piaip) <hun...@gmail.com> 撰寫:
> 我拿上次收到的 uc-o2n.tbl ,在 Windows XP2 上把它的 unicode 全轉回 big5,
> 再放進 big5-2003,建出來的表放在
>
http://moztw.org/docs/big5/final/b5-2003-uao3.zip> 其中的 uao3.txt
其實我不知道這應該算 uao3.0, or uao 2.50, or uao 2.40 final,
uao3 只是我亂取的
比對了一下, 0xBDDE 在 uao3.txt 中是 0xe7b7, 這是錯誤嗎? (big5-2003=8c6c)
其它的多半只有在 big5 造字區或是保留區加字,
還有部首區的修正
--
Hun...@gmail.com , <pi...@csie.ntu.edu.tw>
http://ntu.csie.org/~r92030/gmailtree/img/radial.png引言回覆:
s793016 (Witch Five) 2005/9/29 下午 5:56
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
噢 ... 拍謝在上班所以沒法即時回 ... orz
先回應一些。
基本上您要的表我都可以給,不過都在家裡,等我下班再
e-mail 過去。
關於 umaptable.exe
================
那個操作法我也覺得不好記,所以我都用 batch file
去操作他。他基本上是個很呆的程式。
.uf = from unicode ==> unicode -> codepage
.ut = to unicode ==> codepage -> unicode
關於 uc-02n.tbl:
=============
這張表轉出來會比我們用的對照表多字,因為他還要處理我們各版本間字對應修改的改名。
他的結構是,左右皆為
unicode,檔中間有個分隔線,整個檔是 uc -> big5
單向,分隔線以下的是 uc <-> big5 雙向。
今天上班前在作的事:
==================
寫程式把目前補完 a140 -f9fe 跟 big5-2003
作比對,列出不同的,目前只知道含 c7、c8 區約 187
字不同,其它等下班再看。
引言回覆:
Hung-Te Lin (piaip) 2005/9/29 下午 7:48
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
2005/9/29, s793016(WitchFive) <s79...@gmail.com>:
> 基本上您要的表我都可以給,不過都在家裡,等我下班再
> e-mail 過去。
嗯,其實我比較想知道現在可以拿到的表,完成度多高?
i.e, 未來 final 版的可能變動性? 因為要重弄一次還滿麻煩的
> 關於 uc-02n.tbl:
> 這張表轉出來會比我們用的對照表多字,因為他還要處理我們各版本間字對應修改的改名。
喔,那就再等您的表格了
> 他的結構是,左右皆為
> unicode,檔中間有個分隔線,整個檔是 uc -> big5
> 單向,分隔線以下的是 uc <-> big5 雙向。
跟以前一樣, Ok
我之前發信沒注意到有分隔線,
後來實作時就發現了
> 寫程式把目前補完 a140 -f9fe 跟 big5-2003
> 作比對,列出不同的,目前只知道含 c7、c8 區約 187
> 字不同,其它等下班再看。
這個,其實我前面提的 b5-2003-uao3.zip 有整合過 review 一遍了
請參照之前的 mail, 除了有一個似乎是錯誤 (0xBDDE)
一個衝碼 (0xFC73)
還有部首區幾乎全不同外,基本上與 big5-2003 幾乎完全相容
(不計保留區與造字區)
所以我想,放進去是 OK 的
另外想請問一下之前您在
viewtopic.php?t=1335 提過,
> 我們先看一下 bug#9686 修正了什麼:
> 1.big5 碼區定義錯誤。
> 2.big5 c6a1 ~ c8fe 對應到 unicode 的正確區域 (日文、俄文、數字、etc.)。
> 3.big5 造字區 (8140 ~ a0fe, fa40 ~ fefe) 對應到 unicode 造字區。
(2) 跟 (3) 沒問題,請問 (1)big5 碼區定義錯誤指的是什麼?
--
Hun...@gmail.com , <pi...@csie.ntu.edu.tw>
http://ntu.csie.org/~r92030/gmailtree/img/radial.png引言回覆:
s793016 (Witch Five) 2005/9/29 下午 8:51
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
Hung-Te Lin (piaip) wrote:
> 2005/9/29, s793016(WitchFive) <s793016@gmail.com>:
> > 基本上您要的表我都可以給,不過都在家裡,等我下班再
> > e-mail 過去。
> 嗯,其實我比較想知道現在可以拿到的表,完成度多高?
> i.e, 未來 final 版的可能變動性? 因為要重弄一次還滿麻煩的
基本上除了文件、安裝程式、櫻花輸入法,其它都大致
ok。
> > 寫程式把目前補完 a140 -f9fe 跟 big5-2003
> > 作比對,列出不同的,目前只知道含 c7、c8 區約 187
> > 字不同,其它等下班再看。
> 這個,其實我前面提的 b5-2003-uao3.zip 有整合過 review 一遍了
> 請參照之前的 mail, 除了有一個似乎是錯誤 (0xBDDE)
> 一個衝碼 (0xFC73)
> 還有部首區幾乎全不同外,基本上與 big5-2003 幾乎完全相容
> (不計保留區與造字區)
> 所以我想,放進去是 OK 的
目前整理出來不一樣的地方(扣掉保留區):
ps: 放一份副本在
https://googledrive.com/host/0BxHqn7o9v ... 3-diff.htmuao big5-2003(unicode)
¯ A1C2 00AF ¯ != 203E ‾
═ A2A4 2550 ═ != 2501 ━
╞ A2A5 255E ╞ != 251D ┝
╪ A2A6 256A ╪ != 253F ┿
╡ A2A7 2561 ╡ != 2525 ┥
十 A2CC 5341 十 = 3038 〸
卄 A2CD 5344 卄 != 3039 〹
卅 A2CE 5345 卅 != 303A 〺
彝 C255 5F5D 彝 != 5F5E 彞
丶 C6BF 4E36 丶 != 2F02 ⼂
丿 C6C0 4E3F 丿 != 2F03 ⼃
亅 C6C1 4E85 亅 != 2F05 ⼅
亠 C6C2 4EA0 亠 != 2F07 ⼇
冂 C6C3 5182 冂 != 2F0C ⼌
冖 C6C4 5196 冖 != 2F0D ⼍
冫 C6C5 51AB 冫 != 2F0E ⼎
勹 C6C6 52F9 勹 != 2F13 ⼓
匸 C6C7 5338 匸 != 2F16 ⼖
卩 C6C8 5369 卩 != 2F19 ⼙
厶 C6C9 53B6 厶 != 2F1B ⼛
夊 C6CA 590A 夊 != 2F22 ⼢
宀 C6CB 5B80 宀 != 2F27 ⼧
巛 C6CC 5DDB 巛 != 2F2E ⼮
幺 C6CD 5E7A 幺 != 2F33 ⼳
广 C6CE 5E7F 广 != 2F34 ⼴
廴 C6CF 5EF4 廴 != 2F35 ⼵
彐 C6D0 5F50 彐 != 2F39 ⼹
彡 C6D1 5F61 彡 != 2F3A ⼺
攴 C6D2 6534 攴 != 2F41 ⽁
无 C6D3 65E0 无 != 2F46 ⽆
疒 C6D4 7592 疒 != 2F67 ⽧
癶 C6D5 7676 癶 != 2F68 ⽨
辵 C6D6 8FB5 辵 != 2FA1 ⾡
隶 C6D7 96B6 隶 != 2FAA ⾪
̂ C6D9 02C6 ˆ != FF3E ^
╭ F9FA 256D ╭ != 2554 ╔
╮ F9FB 256E ╮ != 2557 ╗
╰ F9FC 2570 ╰ != 255A ╚
╯ F9FD 256F ╯ != 255D ╝
您可以看得出來其實比較起來,也不能說有什麼大差異,更何況
big5-2003 選了一些奇怪的字,如:f9fa ~ f9fd、a2a4 ~ a2ad。
> > 我們先看一下 bug#9686 修正了什麼:
> > 1.big5 碼區定義錯誤。
> (2) 跟 (3) 沒問題,請問 (1)big5 碼區定義錯誤指的是什麼?
viewtopic.php?t=563 <= here
引言回覆:
Hung-Te Lin (piaip) 2005/9/29 下午 10:09
文章所在群組: moztw-dev,舊 MozTW 團隊論壇
-----------------------------------------------------
2005/9/29, s793016(WitchFive) <s79...@gmail.com>:
> 基本上除了文件、安裝程式、櫻花輸入法,其它都大致
> ok。
那想請問有關...
- 0xBDDE? (錯誤)
- 0xFC73? (衝碼)
咦,等等,或許這些錯誤的原因是我拿 uc-o2n 轉的
那... 等您的單向 table
> 您可以看得出來其實比較起來,也不能說有什麼大差異,更何況
> big5-2003 選了一些奇怪的字,如:f9fa ~ f9fd、a2a4 ~ a2ad。
看來要順便把 CP950 找出來,然後看看 u->b 要怎麼改
> > > 我們先看一下 bug#9686 修正了什麼:
> > > 1.big5 碼區定義錯誤。
> > (2) 跟 (3) 沒問題,請問 (1)big5 碼區定義錯誤指的是什麼?
>
viewtopic.php?t=563 <= here
了解,那這次不用擔心,謝謝。
--
Hun...@gmail.com , <pi...@csie.ntu.edu.tw>
http://ntu.csie.org/~r92030/gmailtree/img/radial.png