Thursday, March 11, 2010

文字河蟹和机器翻译

今天看了小V的Blog, 说的是被河蟹掉的那些敏感字眼让人捧腹大笑的事。举几个例子:

# ……小林惬意地*在车座上……
……可还是想有个肩膀在自己累的时候*一*……
……躺在一张山形镶云母*背的罗汉床上……
……小心翼翼地*近香玉馆的厢房……
答案:“靠”

# ……不会让姑***心血白白浪费的……
答案:“奶奶的

# ……已经瘦得不**样……
……这件事只会被当**们茶余饭后的笑话而已……
……衣衫从几个月婴儿穿的到二十几岁**穿的大小不等……
答案:“成人”小V注:原来现在不是儿童就不干净了……

# ……正站在二门**头接耳地低低说些什么……
答案:“口交”

# ……小伙子大概十*岁
答案:“八九”

等等等等。这些词被和谐的有些冤枉。归根到底,是语言程序编得不好, 不顾前后词语搭配, 简单粗暴的河蟹。 这个让我想起我作为“语言专家”做机器翻译的光荣岁月, 还有那些现在想起来可以会心微笑的往事。当然还有同样因为语言程序编得不好而出的笑话:

譬如:
# The cat is on the tree
翻译: 一个像猫一样的女人在树上
这个归结于在电子字典中抓"Cat"这个字词义的时候没抓到“猫”这个翻译, 而是抓到”象猫一样的女人”。大约是语言程序编成 "The + 名词 + 地点状语" 的时候,那个名词应该是“人”的属性。- 编程序的人忘记动物其实也说得通的。

诸如此类,一个简单的句式,要将语言规则改了又改, 才能出现正确的翻译,还有保证以后遇到类似的句式,翻译出来也是正确的。那时电脑速度慢,一个句式按程序排列组合,翻译出来要很久。 不过, 结果往往出人意表,让我们笑完之后, 还可以改变固性思维。 那时的朋友一提到机器翻译都会说到这句:

It is great for a man to be free.
翻译:它是巨大的,一个人是游离的。

XT瓮声瓮气地感叹言犹在耳:“好像一句现代诗。。。!”

1 comment:

Anonymous said...

最牛的翻译还是这个:

How - are - you
怎么 - 是 - 你

How -old - are - you
怎么 - 老 - 是 - 你