MozTW 討論區
https://forum.moztw.org/

字碼自動偵測的實驗
https://forum.moztw.org/viewtopic.php?f=4&t=28987
1 頁 (共 1 頁)

發表人:  timdream [ 2009-12-18, 11:02 ]
文章主題 :  字碼自動偵測的實驗

我在想一個預設值的修改,但是需要足夠的資訊確定這樣改沒有問題 ...

想要幫我做這個實驗的話,請依下列指示到 about:config 修改設定:
1) intl.charset.default 改成 UTF-8
2) intl.charset.detector 改成 universal_charset_detector
然後照平常的習慣去逛網站.... 看看有沒有任何的網站因此變成亂碼。

理論上這只會影響到 content-type 沒有乖乖指定 charset 的網站,也就是很舊很舊的網站 ... 不過我也不知道現在還有多少這樣的網站大家常去,改了就會壞掉 (我都沒在用那種網站 O_o)

如果有某個你很常去的網站因此壞掉的話請告訴我,在這裡留言或是私下寄信都可以~

相關資料可以看這個網頁:
http://www.mozilla.org/projects/intl/chardet.html

先謝啦!


Tim

發表人:  adam [ 2009-12-20, 12:17 ]
文章主題 :  Re: 字碼自動偵測的實驗

恕我發問一下,請問這兩個值功能是什麼?

發表人:  timdream [ 2009-12-20, 12:25 ]
文章主題 :  Re: 字碼自動偵測的實驗

adam 寫:
恕我發問一下,請問這兩個值功能是什麼?


第一個是在沒有任何字碼資訊的情況下,最後要用什麼字碼顯示那個檔案。
第二個是在沒有任何字碼資訊的情況下,要用什麼設定來自動偵測檔案的字碼(相當於 語言與字元編碼 - 自動偵測 - 所有語言)。

現代的網站都帶有字碼資訊 ( <meta http-equiv="" ... /> 或是直接放 HTTP header 裡),
所以我才在前面說這兩個設定只會影響到很舊很舊的網站...

附帶一提,第一個值在 request 的時候會從 Accept-Charset 傳出去,
某些很自作聰明的網站伺服器會因為你傳 Big5 出去就把網頁轉碼成 Big5 給你 ... 所以換掉那個值是比較好的

Tim

發表人:  adam [ 2009-12-20, 13:54 ]
文章主題 :  Re: 字碼自動偵測的實驗

timdream 寫:
adam 寫:
恕我發問一下,請問這兩個值功能是什麼?


第一個是在沒有任何字碼資訊的情況下,最後要用什麼字碼顯示那個檔案。
第二個是在沒有任何字碼資訊的情況下,要用什麼設定來自動偵測檔案的字碼(相當於 語言與字元編碼 - 自動偵測 - 所有語言)。

現代的網站都帶有字碼資訊 ( <meta http-equiv="" ... /> 或是直接放 HTTP header 裡),
所以我才在前面說這兩個設定只會影響到很舊很舊的網站...

附帶一提,第一個值在 request 的時候會從 Accept-Charset 傳出去,
某些很自作聰明的網站伺服器會因為你傳 Big5 出去就把網頁轉碼成 Big5 給你 ... 所以換掉那個值是比較好的

Tim

感謝熱心解說,這麼一說剛剛看了IE6預設的好像也是UTF-8

發表人:  timdream [ 2009-12-23, 14:53 ]
文章主題 :  Re: 字碼自動偵測的實驗

我剛剛把修改放上去囉,所以 3.6 的預設值就改成這樣囉。

相關 bug (特別開了個自言自語的 bug): https://bugzilla.mozilla.org/show_bug.cgi?id=536506

發表人:  petercpg [ 2013-02-27, 16:16 ]
文章主題 :  Re: 字碼自動偵測的實驗

新 Bug: https://bugzilla.mozilla.org/show_bug.cgi?id=844114

因為 universal charset detector 不這麼 universal,也沒有其他人用 (見 Bug 844115) Henri 打算把它拿掉,並且又因為 Firefox 現在不會再於 Request Header 裡面送 Accept-Charset 的關係,請我們把預設的 encoding fallback 改回 Big5,並且關閉 chardet 或只偵測中文 (UTF-8/Big5/GB2312/其他更少用到的 encoding)。

我的想法如 Bug 內的意見,原則上就是把原先 Tim 在 3.6 的做的修改還原回來,只會在開啟那些非常舊的網站與純文字檔的時候有影響。

各位有什麼意見可以在這討論一下囉。

1 頁 (共 1 頁) 所有顯示的時間為 UTC + 8 小時
Powered by phpBB® Forum Software © phpBB Group
https://www.phpbb.com/