MozTW 討論區
https://forum.moztw.org/

想做個注音文轉白話文的工具
https://forum.moztw.org/viewtopic.php?f=8&t=13028
1 頁 (共 4 頁)

發表人:  passerby [ 2006-02-26, 23:28 ]
文章主題 :  想做個注音文轉白話文的工具

常在討論區、BBS看到注音文,看不明白,所以想做個翻譯功具?,方便自己、香港或大陸網友看也好。

各位可以舉出一些常見的例句嗎?


暫時做了個實驗品 (雖然我也知道注音文未必一定可以還原本面目或內容,但大約能看明白就好了。)

實驗品1
http://tongwen.openfoundry.org/chtdict.xpi

實驗品2
http://tongwen.openfoundry.org/NewTongWen/tools/ZhuYin.htm

發表人:  rail02000 [ 2006-02-27, 00:15 ]
文章主題 : 

我之前有整理過一個東西,但是後來就沒有在更新就是了。
當時是想說掛在新同文堂中,然後看到就按「轉繁體」就好了XD
http://stu.ahjh.tc.edu.tw/~s30229/bpmf/1120.xml

發表人:  hof [ 2006-02-27, 00:42 ]
文章主題 : 

或許可以擴大到火星文→白話文?

發表人:  kourge [ 2006-02-27, 09:48 ]
文章主題 : 

那樣很難<(o_O)>
首先,所有的全形符號,如 *&︿$#_ 都必須通通去掉
接著,把諧音字通通改回來
偶->我
滴->的
泥->你
粉->很
辣->啦
粗企->出去

再把英文全形諧音自改回來...
a->耶
d->的

再「注音文反轉」

<(@_@)>

發表人:  ants [ 2006-02-27, 11:09 ]
文章主題 : 

passerby 寫:
常在討論區、BBS看到注音文,看不明白,所以想做個翻譯功具?,方便自己、香港或大陸網友看也好。
If those people are *seeking* help, tell them to rewrite in a proper way.

發表人:  passerby [ 2006-02-27, 12:26 ]
文章主題 : 

kourge 寫:
那樣很難<(o_O)>
首先,所有的全形符號,如 *&︿$#_ 都必須通通去掉
接著,把諧音字通通改回來
偶->我
滴->的
泥->你
粉->很
辣->啦
粗企->出去

再把英文全形諧音自改回來...
a->耶
d->的

再「注音文反轉」

<(@_@)>


我也知道沒可能將注音文(或火星文)完整翻譯成白話文,但盡量將常見的句字翻譯成白話文應該是有可能的。

現在欠的是一些常見例句,希望各位可以舉一些常見就好了。

發表人:  rx151 [ 2006-03-02, 00:00 ]
文章主題 : 

注音文這定義太廣了吧
光是"在不同地方意思也會不一樣"這原則就很難搞了

發表人:  kourge [ 2006-03-06, 21:36 ]
文章主題 : 

ants 寫:
passerby 寫:
常在討論區、BBS看到注音文,看不明白,所以想做個翻譯功具?,方便自己、香港或大陸網友看也好。
If those people are *seeking* help, tell them to rewrite in a proper way.

Nah, it's also a challenge to try to convert the text (automated).
I would just ignore them and not even bother to read it.

發表人:  fafa [ 2006-03-09, 02:37 ]
文章主題 : 

ㄜ的話可以跟進米國網路用語的用法 用er 音義也比較相近 或者用"呃"

ㄟ的話 我當初混成大盈月文學館的時候基本上是會建議使用者用"欸(ㄟˋ)"代替 雖然原本的用法不一樣...


如果真的可以block注音文的話就太好了 這樣至少眼不見為淨... 嗯..少男的祈禱 XD

發表人:  訪客 [ 2006-03-09, 10:28 ]
文章主題 : 

這讓我想到以前的笑話...提供參考

就是聊天室可能出現的情況:

「我ㄉㄇㄇ」可以翻為「我的媽媽」、「我的妹妹」

到可能會有點麻煩吧=____+

發表人:  RACOON [ 2006-03-09, 10:29 ]
文章主題 : 

SORRY忘了登入 囧"

發表人:  Sheng [ 2006-03-09, 11:01 ]
文章主題 : 

作不出來吧
我舉個例子
ㄉㄉㄋㄉㄉㄉ好ㄉ
請問答案是什麼?

大大你的弟弟好大

我覺得能判別的出來這種東西基本上不如期待去被彗星K到

發表人:  fafa [ 2006-03-09, 14:02 ]
文章主題 : 

基本上正常使用的注音文也不會那麼用

如你舉的那種只不過是為了好玩或反諷而產生的產物 不是正常使用例

發表人:  Sheng [ 2006-03-09, 16:40 ]
文章主題 : 

fafa 寫:
基本上正常使用的注音文也不會那麼用

如你舉的那種只不過是為了好玩或反諷而產生的產物 不是正常使用例


我說了這是舉例OK
當然不會這樣連在一起用
但是如果連連在一起用都沒辦法判別了
分開看到難道會更好判斷嗎(對程式而言)
if "ㄉ" then "的" ?

發言以前想清楚再來吧...

發表人:  fafa [ 2006-03-09, 18:14 ]
文章主題 : 

Sheng 寫:

我說了這是舉例OK
當然不會這樣連在一起用
但是如果連連在一起用都沒辦法判別了
分開看到難道會更好判斷嗎(對程式而言)
if "ㄉ" then "的" ?

發言以前想清楚再來吧...


嗯……雖然因為在下不過是個初註冊的新人,所以不知道您是何方神聖,而因此感到有那麼一點點點的羞愧跟自卑,但是無論如何,我希望您最後這句話能夠還給您自己,這點還請您務必見諒。


以下長文。抱歉,在下特別喜歡發很多廢話,所以請您原諒,如果您語言能力或時間不足以閱讀完此回應,希望您不要太在意,當作沒有就好,畢竟發沒人想看的長文只是個人的一個興趣而已。也希望其餘的人能夠無視我這個小小的新手,這篇連看都不要看,儘速通過。


其實說實在,簡體字也不是能夠完全能轉換成繁體字的東西(當然如今已經做得非常好了),注音文的轉換當然更如您的尊言曾述,是不可能的任務,所以如果真的要實作,我們所能做的也不過就是僅可能而已。事實上,簡體字的判讀是以「詞彙」為單位,而中文在語言學上而言,「詞」的定義很廣,能單獨表意的一個字也是詞,十個字也有可能成詞,而注音文的判讀也必須考慮到這點,所以單獨一個字的翻譯是必要的。當然,單獨判斷「ㄇ」是很危險的,所以唯一的方法是找出「我ㄇ」然後取代為「我們」,然後找出「ㄇ?」之類的東西來取代成「嗎?」。當然,這完全無法百分之百,說實在的,如果真的嚴重到完全無法判讀跟翻譯的程度,那就已經不是能夠順利通行的火星文了。

可能您會基於這個與簡繁互換的成功率截然不同,所以認為這工作毫無意義,甚至不值得去思考。但,既然要做,而且甚至已經有人開始試做了,那又何必杜絕別人「改良」的建議呢?當年瓦特改良蒸汽機也是件愚蠢的工作,也是無數的人建議他別這麼做,但是他依然笨到去做,令人意外的是他成功了。唉,語言這種麻煩的東西先甭說,連微積分這種算不準的math跟量子物理這種測不準的理論都廣泛地運用在各個階層,甚至您現在電腦裡面跑的浮點數跟2進位的運算與轉換也不是些準確的東西,這個世界哪有辦法事事求取準確跟完全呢?

and,在下也不過只是針對這個工作的提案做出一個建議,並且針對您那明顯過度偏頗並且有點問題存在的舉例做出說明,在下不認為自己是沒有想清楚才發言的。畢竟一個偏頗的例子不能指出任何事情,當然更不能形成任何準則,至於為什麼偏頗的例子什麼也不是,這點聰慧如您一定可以了解,所以應該不需要下賤如在下特別對這方面多作說明。先前點出您例子的錯誤之處不但是提醒您,也是提醒其他朋友,畢竟在下也很難知道這個地方會不會偶爾有些不喜歡搞清楚一樣東西本質就會開始大肆報導的人出入,例如所謂記者就是一例,不過必須讚美他們現在總算能夠把Cosplay跟同人誌搞清楚並且區分了。


最後,再指出您一個錯誤是,我們現在討論的是「目前網路上通行的注音文」,而非「火星文」,關於火星文的轉換跟教育問題,請洽大學考試的那個委員會。


如果以上種種言論讓您感到不悅,也歡迎您寄個人訊息給在下,而或許您不屑寄信給在下,那就請您當作沒這回事即可,在下也沒有想收到您的回應的打算。祝您萬事順泰,武運昌隆。


此外,對不起大家,廢話很多。板主或管理員們若覺本文不妥,還請儘快刪除,造成困擾,真的是非常不好意思,事實上我已經開始在反省了,這真是個天殺的壞習慣。orz

1 頁 (共 4 頁) 所有顯示的時間為 UTC + 8 小時
Powered by phpBB® Forum Software © phpBB Group
https://www.phpbb.com/