Google词典和WordReference
Google翻译相比很多人都听说过,虽然的确是机器翻译里最先进的技术,但还是鸡肋一块。倒是Google字典比机器翻译靠谱得多。最初Google的字典功能是附属在Google翻译下面的,但是现在『Google字典』的页面里面就没有了与『Google翻译』的链接(但是反过来还有)。
现在的Google字典里可以提供英语到法语、德语、意大利语、韩语、西班牙语、俄语、葡萄牙语以及汉语(简繁体)乃至印地语的单词查询服务。汉语是最近才加上的,但是让人搞不明白的是英韩词典倒是从一开始就有。字典里可以提供单词的基本释义和词组,同时还会给出许多很口语化的例句。另外,多数词汇还会给出『网络翻译』(web translations,将网络上搜索到的翻译方式整理并列出来,这一点和有道词典的网络翻译是一样的),『网络释义』(web definitions,就是在关键字前带上『define:』得到的页面)。
另一个词典是WordReference。WR里面有西班牙语、法语、意大利语、德语、俄语与英语的双向词典,中日韩语的词典尚在测试中,不过功能已经称得上完善了。WordReference的词条列出得很简明扼要,但是在每一个试译之后都会用括号给出使用指导,这样虽然简单,但并不会让人混淆。尤其要提一下WordReference的英法词典也很不错的,词汇都有详细的说明,还有法语动词的完整变位表(当然别的语言也有变位表,不过我没用过,呵呵)。
WordReference还有一个特长就是它会在查询单词的页面最后显示出论坛里的讨论,如果你对一个单词看了词条还不明白,到论坛里翻阅一下应该会有很大帮助。
PS: GOOOOOOOGle 黑板报上的一篇帖子:谷歌翻译帮助国人了解国外最新商业消息,和我同一天发布的。谢 Brant 爆料~
語言、民族和國家
說起來中國是一個有著56個民族(暫且不說這個數字是否有爭議)的『多民族國家』,然而在作為人口主體的漢族當中,卻很難說對『民族』有一個清晰的認識。
在漢語的詞彙里就有類似的例子。我們把自己的語言叫做『中文』,這個詞暗示出來的意思是:中國的語言文字,就是中文;而中文也約略地等于所有地理上住在中國的人所講的語言。然而事實是所謂的『中文』僅僅是56個民族中人口最多的民族的標準語言而已。把漢人的語言(漢語)簡單地理解為中國的語言(中文),這樣另55個民族語言,以及其背后隱藏的歷史、文化、思維方式,就無意識地被忽略了。
而在外國人的語言里也同樣有類似問題,比如日語韓語中的『中國語』一詞,都是在將『漢語』這個概念偷換為『中國的語言』。同樣的問題在英語里也存在,提及Chinese字面意義是中國人,然而『中國人』在文化上幾乎完全被塑造得與『漢人』一樣。不過值得注意的是,一些英語媒體(比如CNN)在報道最近西藏的事情時往往又特別注明Han Chinese,算是一種進步。
一個蒙族朋友曾經跟我講過向外國人自我介紹時的一個不大不小的問題:在外人眼中她是中國人(Chinese),然而又不是漢族,而是蒙古族(Mongolian)。作為一個在城市里長大的孩子,她自然樂意承認自己是Chinese(中國人),然而自己血緣和文化上的標簽,總不應該這么簡單地就拋棄掉吧?于是只好略有牽強地把自己稱作Mongolian-Chinese。而在草原上長大的孩子們在面對這樣的問題時,恐怕會有更多的困惑乃至憤怒。
個人的民族(文化)認同與國家認同之間誰高誰下是政治理論里被人關注的一個問題。一個觀點是,延續自由主義思想里國家的政治力量應當讓位于個人自由,政治不應該過度干預個人生活方式。在一個國家中,政府也應該中立于不同的價值觀之中。所以政府對于多個民族的文化事務中,也應該盡量做到『一碗水端平』。
一個有意思的現象是,中國政府對于少數民族的『優待』叫做『自治區』,同時政府把分區自治認為是善政。然而類似的事情假如發生在美國,比如美國的印第安保留地,卻會被解讀為殖民者對印第安人生存空間的擠壓。雖然在各個自治區中,形式上講,自治區政府(注意與黨領導區分)領導應為當地主要少數民族,有不錯的少數民族語言的教育,連街上的店鋪招牌都是兩種語言。然而這一切都僅限于一個位于沙漠、草原、高原的貧瘠區域而已,一個少數民族的人很難跨越這樣的屏障。他所感受到的屬于自己民族的領域只有自己的被政府預先限定的區域,而非整個國家。這樣,你怎么能期待他對整個960萬平方公里的土地以及這土地上的各色各樣的人民產生心理上的依戀和情感?
如果真的如憲法里所講的民族平等(憲法是何等虛無的一個詞啊,況且,在『法律面前人人平等』仍然像瘋話的現代,民族平等也很像一個泡泡而已),每個民族的生活方式、法律地位、語言文化都應該在整個國家的范圍內是平等的。各個民族的文化應該在這個國家960萬平方公里的土地上得到同等的尊重。這里講一個事例,加拿大有兩種官方語言——英語和法語,而南非有8種官方語言。而中國的法律中寫道個民族有使用和發展自己民族文字的自由,然而還是將『通用語言』定義為『普通話和規范漢字』。
乱写照样读
应该能看懂吧?
下午的时候朋友在MSN上给我传来一段话:
Aoccdrnig to a rseearch taem at an Enligsh Uinervtisy, it deosn’t mttaer in waht oredr the ltteers in a wrod are, the olny iprmoatnt tihng is taht the frist and lsat ltteer be in the rghit pclae. The rset can be a taotl mses and you can sitll raed it wouthit a porbelm.
后来发现在英文里有一个诡异的词形容这种现象,叫做 typoglecymia (应该是hypoglecymia 『高血糖』的文字游戏而来)。根据维基百科里的介绍(GFW今天庆祝愚人节,所以英文维基暂时放行),乱写照样读的现象是首先是科学家把一些50微妙的声音片段颠倒过来,听的人也照样能听出来是怎么回事。于是一位叫做Graham Rawlinson的兄台指出同样的现象也存在于阅读中。
大意为,如果把一个词语的首尾各两个字母保留原状,把中间的字母打乱顺序,对于读者的阅读不会造成多大的影响。这好像能够说明人们在阅读文字的认知过程中(嘿,扯上语言学了),可能是从文字里随便筛出几个特征点(例如对于单词就是前几个以及后几个字母,对于汉字是大致的形状)与大脑中存着的数据对照,如果大致形状与某个字/词类似(姑且称作“模糊识别”吧),在仔细辨认细节之前就会认为它与那个字/词相符。[附注:这样一看简单地把英文称作“表音文字”是不是有些武断?
]
这样就解释了为什么盯着电脑看Word标红线的词看很长时间,也不一定能看出到到底是哪里错了。而且阅读水平越高,就越容易读懂这些乱拼乱写的词,也说明阅读水平越高阅读时就只进行“模糊识别”,而不进行精确识别了。用“一目十行”形容人粗心(或曰效率高)也大概是这意思。
这种现象在我们常用的软件里也有体现,如果你用Google拼音的话就可以试验。打:dign 出来的是不是定?Google已经把dign认成ding了。
还有,有人还把那段乱写的话翻译整理出了许多种语言的版本,在这里:www.mrc-cbu.cam.ac.uk/~mattd/Cmabrigde/
对英语持游戏态度的家伙们实在太多了,这里还有一个 FreeSpeling.com 是一个叫做Richard Lawrence Wade 的兄台弄得,他觉得英语里的不规则发音太多所以大家读错写错根本不是人的问题,而是语言的问题,所以难写难读的单词的拼写要改掉。That iz a good idea that wil revolushonize langwig. 相形之下汉语对新的语言现象还是远不如英语里宽容的。





