手机浏览器扫描二维码访问
这个完全可以根据前词判断是光还是世界。”
沃森弱弱提醒道:“教授,你还会俄语啊?”
林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?
我同时会俄语、德语、英语和汉语。”
多语言大师的身份,给林燃的理论增添了几分可信度。
在这个时代,科学家们会几门语言并不奇怪。
当然一些敏感部门会提高对你的怀疑。
以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。
“另外翻译过程,应该是模块化设计,而不是简单的映射关系。
它应该分成预处理、翻译、后处理三部分。
预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。
这样来降低单次计算的复杂度,提高规则的复用率!”
林燃的话给了在座研究团队的成员们非常多的灵感。
就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。
大家都有点迫不及待去尝试了。
所有研究人员都疯狂在笔记本上记录下林燃所说的。
虽然不确定教授的方法是否管用,但有路总比之前没有好。
再者,如果你不好好记下来,到时候被开除只是教授一句话的事。
“好了刚才我们讲了一些简单的内容,现在才是最难的。
因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。
我把它叫做基于频率的词对齐。
这也是我们引入统计模型的核。
我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。
俄语句子Мыговоримомире
英语翻译:“Wespeakaboutpeace
对齐结果:“мы”对应“we”
“говорим”对应“speak”
“о”对应“about”
“мире”对应“peace”
然后我们需要对这种对齐的频率进行统计。
统计每个俄语词或短语在英语中的对应翻译出现的频率。
例如,在语料中,“говорим”在80%的句子中翻译为“speak”,20%翻译为“talk”。
这样对于我们就可以构建概率表了。
将这些概率整理成表格,供机器进行查询。由于内存空间有限,我们暂时只存储高频词对,像出现次数前1000的词对,忽略低频情况。
当翻译某个词的时候出现多个选择,就参考概率表选择最可能的翻译。
张湖畔,张三丰最出色的弟子,百年进入元婴期境界的修真奇才。他是张三丰飞升后张三丰所有仙器,灵药,甚至玄武大帝修炼仙境的唯一继承者,也是武当派最高者。在张三丰飞升后,奉师命下山修行。大学生,酒吧服务员,普通工人不同的身份,不同的生活,总是有丰富多彩的人生,不同的遭遇,动人的感情,总是让人沉醉不已。武林高手...
一个被部队开除军籍的特种兵回到了都市,看他如何在充满诱惑的都市里翻云覆雨...
书名?阅女无限??呵呵,广大银民,请看清楚哦。吴县,这个二十岁的青涩小子,进城上学,居然一不留神,取悦于众多美女,在众女的帮助下,事业也是蒸蒸日上。且看主角如何将有限的生命,投入到吴县的悦女事业中去。蹩脚的猪脚,由一个初哥,逐渐成为花丛高手。...
师父死了,留下美艳师娘,一堆的人打主意,李福根要怎么才能保住师娘呢?...
前世孤苦一生,今世重生成兽,为何上天总是这样的捉弄!为何上天总是那样的不公!他不服,不服那命运的不公。自创妖修之法,将魔狮一族发展成为能够抗衡巨龙的麒麟一族,成就一代麒麟圣祖的威名。...
地球少年江云卷入了一个神秘的超凡世界之中,获得了超凡之力,并且开始在地球以及一个个超凡世界,开启了自己追逐巅峰的超凡旅程。VIP。全订阅可入,要验证。普通。(ps已经完本神卡...