MozTW 討論區

各項 Mozilla 相關軟體與技術討論
現在的時間是 2024-04-20, 00:12

所有顯示的時間為 UTC + 8 小時





發表新文章 回覆主題  [ 65 篇文章 ]  前往頁數 上一頁  12345  下一頁
發表人 內容
 文章主題 :
文章發表於 : 2009-01-02, 17:53 
離線
[MozTW 版主群]
頭像

註冊時間: 2008-06-27, 03:48
文章: 2252
來自: 香港
總括來說,治標的方法就是寫Script 讓Firefox 自動轉換Pua 字元到適合的CJK ext A 字元。
而治本的方法就是讓Firefox 在UTF-8 的環境下優先把Pua 字元對應到HKSCS,再對應到UAO。但是應該怎樣修改源碼呢?

_________________
我都沒有再在這裡活躍了,還請大家多多指教~
圖檔


回頂端
Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-TW; rv:1.9.0.5) Gecko/2008120122 Firefox/3.0.5 (.NET CLR 3.5.30729) (zh-HK 1.0)
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-02, 18:06 
離線

註冊時間: 2006-08-14, 10:04
文章: 26
hfwong1 寫:
MOZILLA 其實應該要把 UTF-8 裏的 PUA 字優先顯示為 HKSCS 所對應的字,而不是甚麼都不顯示。當然更好的辦法就是可以讓使用者自行設定。

UTF-8 編碼是全世界都使用的編碼,我們不應要求把 UTF-8 裡的 PUA 字優先顯示為我們小香港 HKSCS 所對應的字。
用家使用了 PUA 字,就要有心理準備他人未必能正確的讀取。
當然最好的辦法就是不要繼續輸出 PUA 字,不要讓 PUA 字在網絡上繼續成長。


回頂端
Mozilla/5.0 (X11; U; Linux i686; zh-TW; rv:1.9.1b2) Gecko/20081201 Firefox/3.1b2
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-02, 18:30 
離線
[MozTW 版主群]
頭像

註冊時間: 2008-06-27, 03:48
文章: 2252
來自: 香港
kwokts 寫:
hfwong1 寫:
MOZILLA 其實應該要把 UTF-8 裡的 PUA 字優先顯示為 HKSCS 所對應的字,而不是甚麼都不顯示。當然更好的辦法就是可以讓使用者自行設定。

UTF-8 編碼是全世界都使用的編碼,我們不應要求把 UTF-8 裡的 PUA 字優先顯示為我們小香港 HKSCS 所對應的字。
用家使用了 PUA 字,就要有心理準備他人未必能正確的讀取。
當然最好的辦法就是不要繼續輸出 PUA 字,不要讓 PUA 字在網絡上繼續成長。

當然,不要輸出Pua 字是真正的解決辦法。可是,並不是你不想輸出,他就不會輸出,有一些配備不足或不update 的電腦都可能輸出Pua 字,所以Pua 字的顯示問題是一定要解決的。
另外,我們不可以持著自卑的態度而不理會Pua 字的顯示問題,因為不能顯示就是不能顯示,一定要令他能夠顯示為止。加上這只是Firefox 的問題,Unicode 本身是沒有問題的。所以Pua 字問題是不可以用感性的原因來埋沒。其實只要Firefox 能夠適當地對應,不論是UAO 優先還是HKSCS 優先,只要能夠顯示就滿意了~

_________________
我都沒有再在這裡活躍了,還請大家多多指教~
圖檔


回頂端
Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-TW; rv:1.9.1b2) Gecko/20081223 Firefox/3.1b2 (Protable tete009 SSE PGO)
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-03, 06:02 
離線
[網站管理員]
頭像

註冊時間: 2004-12-05, 23:32
文章: 260
來自: 地球
hfwong1 寫:
timdream 寫:

http://share.timc.idv.tw/encodetest.php ... ding=UTF-8

像這裡,同樣的字有兩組字碼,後者字會出來圖也會出來,前者不會有圖。而且我的電腦(只裝了 Ext B 字型的 XP)看不到前者。

所以我想要知道 hfwong1 是不是裝了什麼特別的程式才能讓 U+e0xx 顯示出字(而且如果可以顯示的話,那哪來的 PUA 字問題?還是可以繼續用呀,雖然都 2009 年了...)。

  我用的是 VISTA ULTIMATE,內置 HKSCS 跟 EXT B 的字體,並沒有裝任何會改變系統編碼的工具。
  另外,我沒有強制指定用 HKSCS 字體來顯示頁面。
  PUA 顯示不到的問題還是存在的,只是不存在於 HKSCS 頁面裏罷了。FX3 不能夠顯示 UTF-8 網頁裏的 PUA 字,只能顯示 HKSCS 頁面裏的 PUA 字。如要在 UTF-8 網頁裏顯示 PUA 字的話,一定要把字體強制設定為 HKSCS 字體,但是在 HKSCS 網頁裏,情況就不同了。即使沒有強制指定用 HKSCS 字體來顯示 PUA 字,FX3 還是會幫你抓 HKSCS 字體來顯示 HKSCS 網頁裏的 PUA 字。我真的不明白為何 FX3 只能在 HKSCS 網頁裏才能正確地抓取 HKSCS 字體來顯示 PUA 字。
  唯一的解釋是,由於 UAO 跟 HKSCS 同樣地採用相同的 PUA 碼位,以置在那些網頁的 PUA 字在轉為 UTF-8 後,不知道
應該顯示為 UAO 還是 HKSCS 所對應的字,所以就乾脆兩個都不顯示,只顯示為正方形。但是我覺得這樣的設定很有問題,畢竟 HKSCS 是官方標準而 UAO 並不是,所以 MOZILLA 其實應該要把 UTF-8 裏的 PUA 字優先顯示為 HKSCS 所對應的字,而不是甚麼都不顯示。當然更好的辦法就是可以讓使用者自行設定。


所以我如果沒有會錯意的話,上面那個測試連結你只能看到後四個字。然後我現在改了 lang="" 屬性之後,你應該能在 zh-HK 那行看到八個字,其他都不行?

來張 screenshot 吧 :)

如果是這樣的話,各位是覺得讓那四個 PUA 字無論在哪個 lang 屬性底下都能正常顯示才對?


回頂端
Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-TW; rv:1.9.0.5) Gecko/2008120122 Firefox/3.0.5 Ubiquity/0.1.4
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-03, 10:06 
離線

註冊時間: 2006-08-14, 10:04
文章: 26
余弘兵 寫:
當然,不要輸出Pua 字是真正的解決辦法。可是,並不是你不想輸出,他就不會輸出,有一些配備不足或不update 的電腦都可能輸出Pua 字,所以Pua 字的顯示問題是一定要解決的。
另外,我們不可以持著自卑的態度而不理會Pua 字的顯示問題,因為不能顯示就是不能顯示,一定要令他能夠顯示為止。加上這只是Firefox 的問題,Unicode 本身是沒有問題的。所以Pua 字問題是不可以用感性的原因來埋沒。其實只要Firefox 能夠適當地對應,不論是UAO 優先還是HKSCS 優先,只要能夠顯示就滿意了~

要是不能顯示Pua字,只需要設定使用含有適當Pua的字體,就可以令它能夠顯示,這是最最最正宗的作法,不存在感性的原因。任何的轉換與對應,不論是UAO優先還是HKSCS優先都不可取。若認為是Firefox的問題,是方向走錯,Firefox本身根本是沒有問題的。


回頂端
Mozilla/5.0 (X11; U; Linux i686; zh-TW; rv:1.9.1b2) Gecko/20081201 Firefox/3.1b2
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-03, 10:35 
離線

註冊時間: 2006-08-14, 10:04
文章: 26
timdream 寫:
所以我如果沒有會錯意的話,上面那個測試連結你只能看到後四個字。然後我現在改了 lang="" 屬性之後,你應該能在 zh-HK 那行看到八個字,其他都不行?

來張 screenshot 吧 :)

如果是這樣的話,各位是覺得讓那四個 PUA 字無論在哪個 lang 屬性底下都能正常顯示才對?


讓我來張 screenshot 吧 :)


附加檔案:
Screenshot.png [147.38 KiB]
被下載 564 次
回頂端
Mozilla/5.0 (X11; U; Linux i686; zh-TW; rv:1.9.1b2) Gecko/20081201 Firefox/3.1b2
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-03, 11:02 
離線
[網站管理員]
頭像

註冊時間: 2004-12-05, 23:32
文章: 260
來自: 地球
kwokts 寫:

讓我來張 screenshot 吧 :)


感謝;您的 Linux 有 locale 設定是 zh-HK?


回頂端
Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-TW; rv:1.9.0.5) Gecko/2008120122 Firefox/3.0.5 Ubiquity/0.1.4
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-03, 11:10 
離線

註冊時間: 2006-06-29, 23:03
文章: 42
來自: 美國
timdream 寫:
hfwong1 寫:
timdream 寫:

http://share.timc.idv.tw/encodetest.php ... ding=UTF-8

像這裡,同樣的字有兩組字碼,後者字會出來圖也會出來,前者不會有圖。而且我的電腦(只裝了 Ext B 字型的 XP)看不到前者。

所以我想要知道 hfwong1 是不是裝了什麼特別的程式才能讓 U+e0xx 顯示出字(而且如果可以顯示的話,那哪來的 PUA 字問題?還是可以繼續用呀,雖然都 2009 年了...)。

  我用的是 VISTA ULTIMATE,內置 HKSCS 跟 EXT B 的字體,並沒有裝任何會改變系統編碼的工具。
  另外,我沒有強制指定用 HKSCS 字體來顯示頁面。
  PUA 顯示不到的問題還是存在的,只是不存在於 HKSCS 頁面裏罷了。FX3 不能夠顯示 UTF-8 網頁裏的 PUA 字,只能顯示 HKSCS 頁面裏的 PUA 字。如要在 UTF-8 網頁裏顯示 PUA 字的話,一定要把字體強制設定為 HKSCS 字體,但是在 HKSCS 網頁裏,情況就不同了。即使沒有強制指定用 HKSCS 字體來顯示 PUA 字,FX3 還是會幫你抓 HKSCS 字體來顯示 HKSCS 網頁裏的 PUA 字。我真的不明白為何 FX3 只能在 HKSCS 網頁裏才能正確地抓取 HKSCS 字體來顯示 PUA 字。
  唯一的解釋是,由於 UAO 跟 HKSCS 同樣地採用相同的 PUA 碼位,以置在那些網頁的 PUA 字在轉為 UTF-8 後,不知道
應該顯示為 UAO 還是 HKSCS 所對應的字,所以就乾脆兩個都不顯示,只顯示為正方形。但是我覺得這樣的設定很有問題,畢竟 HKSCS 是官方標準而 UAO 並不是,所以 MOZILLA 其實應該要把 UTF-8 裏的 PUA 字優先顯示為 HKSCS 所對應的字,而不是甚麼都不顯示。當然更好的辦法就是可以讓使用者自行設定。


所以我如果沒有會錯意的話,上面那個測試連結你只能看到後四個字。然後我現在改了 lang="" 屬性之後,你應該能在 zh-HK 那行看到八個字,其他都不行?

來張 screenshot 吧 :)

如果是這樣的話,各位是覺得讓那四個 PUA 字無論在哪個 lang 屬性底下都能正常顯示才對?

對,就是要讓那些 pua 字在任何 lang 屬性下也能顯示出來。
下圖為我的 screenshot,可看出除了在 ZH-HK 下,其它的 lang 裏都是看不到 pua 字的。


附加檔案:
hkscs-test2.jpg [89.97 KiB]
被下載 569 次
回頂端
Mozilla/5.0 (Windows; U; Windows NT 6.0; zh-TW; rv:1.9.0.5) Gecko/2008120122 Firefox/3.0.5
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-03, 11:14 
離線

註冊時間: 2006-08-14, 10:04
文章: 26
timdream 寫:
感謝;您的 Linux 有 locale 設定是 zh-HK?

以下是執行 locale 的輸出:
LANG=zh_TW.UTF-8
LC_CTYPE=zh_TW.UTF-8
LC_NUMERIC="zh_TW.UTF-8"
LC_TIME="zh_TW.UTF-8"
LC_COLLATE="zh_TW.UTF-8"
LC_MONETARY="zh_TW.UTF-8"
LC_MESSAGES=zh_TW
LC_PAPER="zh_TW.UTF-8"
LC_NAME="zh_TW.UTF-8"
LC_ADDRESS="zh_TW.UTF-8"
LC_TELEPHONE="zh_TW.UTF-8"
LC_MEASUREMENT="zh_TW.UTF-8"
LC_IDENTIFICATION="zh_TW.UTF-8"
LC_ALL=


回頂端
Mozilla/5.0 (X11; U; Linux i686; zh-TW; rv:1.9.1b2) Gecko/20081201 Firefox/3.1b2
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-03, 11:24 
離線

註冊時間: 2006-08-14, 10:04
文章: 26
hfwong1 寫:
對,就是要讓那些 pua 字在任何 lang 屬性下也能顯示出來。
下圖為我的 screenshot,可看出除了在 ZH-HK 下,其它的 lang 裏都是看不到 pua 字的。

設定 對應這種語言 的字型,就可以讓那些 pua 字在那種語言能顯示出來。


回頂端
Mozilla/5.0 (X11; U; Linux i686; zh-TW; rv:1.9.1b2) Gecko/20081201 Firefox/3.1b2
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-03, 11:37 
離線
[MozTW 版主群]
頭像

註冊時間: 2008-06-27, 03:48
文章: 2252
來自: 香港
為甚麼我只能夠在zh-HK 和zh-TW 能夠顯示?我也是設定為zh-TW.UTF-8 喔~而kwokts 的Linux 系統能夠在所有語言顯示?


附加檔案:
檔案註釋: 只能夠在zh-HK 和zh-TW 能夠顯示。
UTF-8.jpg [407.26 KiB]
被下載 523 次

_________________
我都沒有再在這裡活躍了,還請大家多多指教~
圖檔
回頂端
Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-TW; rv:1.9.0.5) Gecko/2008120122 Firefox/3.0.5 (.NET CLR 3.5.30729) (zh-HK 1.0)
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-03, 15:11 
離線

註冊時間: 2006-08-14, 10:04
文章: 26
余弘兵 寫:
為甚麼我只能夠在zh-HK 和zh-TW 能夠顯示?我也是設定為zh-TW.UTF-8 喔~而kwokts 的Linux 系統能夠在所有語言顯示?

編輯 > 偏好設定 > 內容 > 字型與色彩 > 進階 > 對應這種語言
簡体中文
正體中文(繁體,香港)
正體中文(繁體,臺灣)
日文
英文/西歐語言
字型選用 UMing 或 UKai 或其他包含 PUA 的字型,就可以顯示出來。


回頂端
Mozilla/5.0 (X11; U; Linux i686; zh-TW; rv:1.9.1b2) Gecko/20081201 Firefox/3.1b2
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-07, 15:37 
離線
[網站管理員]
頭像

註冊時間: 2004-12-05, 23:32
文章: 260
來自: 地球
總結一下我的觀察/看法跟我接下來會做什麼:

1. 有兩種方式會讓 Fx 在頁面上產生 PUA 字,但是
1.a Big5-HKSCS 網頁上的 PUA 字 這個是 bug
1.b UTF-8網頁上的 PUA 字 這個我認為是正常,不需在 Fx 「修正」的行為
2 無論正不正常,一但頁面出現 PUA 字,能不能顯示就必須仰賴深不可測的作業系統,而已知只有下列系統能將 PUA 字顯示出香港字
2.a Windows Vista ,地區語言設定為[HK SAR]
2.b Windows XP,安裝香港增補字元集 2001
2.c Linux,手動指定到某個有在 PUA 碼做香港字造字的字型
請注意以上都是特別為香港居民設計的系統/設定,也就是說,這些系統故意設計成在上面看網頁跟地球上其他人不一樣
3 無論正不正常,一但頁面出現 PUA 字卻不能顯示就會造成香港使用者的麻煩。因為 (1.b) 並不是 Fx 的 bug,所以要修正 (1.b) 且順便先修正 (1.a) 的話,最好還是寫擴充套件來「擴充」功能。
4 明明是香港字卻在 <meta> 誤標為 Big5 導致解碼錯誤的網頁也有另一個擴充套件可以解。
5 (3) 和 (4) 這兩個擴充套件,我和一位擴充套件作者接觸,他有興趣幫忙合併成一個可以開關的版本,但是至少要等一個月,期末考後。
6 我希望弘兵可以把用在(4)的那個擴充套件先下架,等(5)出現。因為使用該套件會讓使用者誤在台灣的 Big5 網頁上輸出 HKSCS 外字。
7 要避免(6)的那個問題,更根本的解法是直接拿掉 Firefox 內 u2h 表的外字部分,因為使用者無法判斷在某網頁留言時應該用什麼字碼,我們也不該讓使用者做這個判斷。

至於為什麼我認為 1.b 是正確的行為,是因為在 UTF-8 網頁上的 PUA 字本來就不一定是指香港字。地球上可能有其他人把自己的文字放在 PUA,Fx 在不確定那是什麼字的情況忠於原著把字碼送給系統處理是對的。

(1.a) 對應的 bug 是 https://bugzilla.mozilla.org/show_bug.cgi?id=403564 ,depend on https://bugzilla.mozilla.org/show_bug.cgi?id=162431 ,所以很難修
(4) 指的擴充套件是 https://addons.mozilla.org/en-US/firefox/addon/9294
https://bugzilla.mozilla.org/show_bug.cgi?id=403564 有討論到 (7) 的問題,我也有留言
還有我目前實驗的 (4) 的解法,使用者還是得裝 ext B 字型才看的到... 含 PUA 的字型 vs ext B 的字型不知哪個比較多人裝?


回頂端
Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-TW; rv:1.9.0.5) Gecko/2008120122 Firefox/3.0.5
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-07, 15:47 
離線
[MozTW 版主群]
頭像

註冊時間: 2008-06-27, 03:48
文章: 2252
來自: 香港
timdream 寫:
我希望弘兵可以把用在(4)的那個擴充套件先下架,等(5)出現。因為使用該套件會讓使用者誤在台灣的 Big5 網頁上輸出 HKSCS 外字。

我想我可以在addons 下架,但保留在討論區的頁面,方便仍然需要的使用者~

_________________
我都沒有再在這裡活躍了,還請大家多多指教~
圖檔


回頂端
Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.5) Gecko/2008120122 Firefox/3.0.5 (.NET CLR 3.5.30729)
 個人資料  
引用回覆  
 文章主題 :
文章發表於 : 2009-01-07, 15:49 
離線
[MozTW 版主群]
頭像

註冊時間: 2008-06-27, 03:48
文章: 2252
來自: 香港
timdream 寫:
要避免(6)的那個問題,更根本的解法是直接拿掉 Firefox 內 u2h 表的外字部分,因為使用者無法判斷在某網頁留言時應該用什麼字碼,我們也不該讓使用者做這個判斷。

那麼就是以 Big5.uf 取代 HKSCS.uf 嗎?

_________________
我都沒有再在這裡活躍了,還請大家多多指教~
圖檔


回頂端
Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.5) Gecko/2008120122 Firefox/3.0.5 (.NET CLR 3.5.30729)
 個人資料  
引用回覆  
顯示文章 :  排序  
發表新文章 回覆主題  [ 65 篇文章 ]  前往頁數 上一頁  12345  下一頁

所有顯示的時間為 UTC + 8 小時


誰在線上

正在瀏覽這個版面的使用者:沒有註冊會員 和 5 位訪客


不能 在這個版面發表主題
不能 在這個版面回覆主題
不能 在這個版面編輯您的文章
不能 在這個版面刪除您的文章
不能 在這個版面上傳附加檔案

搜尋:
前往 :  
Powered by phpBB® Forum Software © phpBB Group
正體中文語系由 竹貓星球 維護製作
© moztw.org, Mozilla Foundation
MozTW,Mozilla 台灣社群