手机浏览器扫描二维码访问
这个完全可以根据前词判断是光还是世界。”
沃森弱弱提醒道:“教授,你还会俄语啊?”
林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?
我同时会俄语、德语、英语和汉语。”
多语言大师的身份,给林燃的理论增添了几分可信度。
在这个时代,科学家们会几门语言并不奇怪。
当然一些敏感部门会提高对你的怀疑。
以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。
“另外翻译过程,应该是模块化设计,而不是简单的映射关系。
它应该分成预处理、翻译、后处理三部分。
预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。
这样来降低单次计算的复杂度,提高规则的复用率!”
林燃的话给了在座研究团队的成员们非常多的灵感。
就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。
大家都有点迫不及待去尝试了。
所有研究人员都疯狂在笔记本上记录下林燃所说的。
虽然不确定教授的方法是否管用,但有路总比之前没有好。
再者,如果你不好好记下来,到时候被开除只是教授一句话的事。
“好了刚才我们讲了一些简单的内容,现在才是最难的。
因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。
我把它叫做基于频率的词对齐。
这也是我们引入统计模型的核。
我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。
俄语句子Мыговоримомире
英语翻译:“Wespeakaboutpeace
对齐结果:“мы”对应“we”
“говорим”对应“speak”
“о”对应“about”
“мире”对应“peace”
然后我们需要对这种对齐的频率进行统计。
统计每个俄语词或短语在英语中的对应翻译出现的频率。
例如,在语料中,“говорим”在80%的句子中翻译为“speak”,20%翻译为“talk”。
这样对于我们就可以构建概率表了。
将这些概率整理成表格,供机器进行查询。由于内存空间有限,我们暂时只存储高频词对,像出现次数前1000的词对,忽略低频情况。
当翻译某个词的时候出现多个选择,就参考概率表选择最可能的翻译。
一个小千世界狂热迷恋修行的少年获得大千世界半神的神格,人生从这一刻改变,跳出法则之外,逆天顺天,尽在掌握!骷髅精灵不能说的秘密,尽在火热圣堂,等你来战!...
从农村考入大学的庾明毕业后因为成了老厂长的乘龙快婿,后随老厂长进京,成为中央某部后备干部,并被下派到蓟原市任市长。然而,官运亨通的他因为妻子的奸情发生了婚变,蓟原市急欲接班当权的少壮派势力以为他没有了后台,便扯住其年轻恋爱时与恋人的越轨行为作文章,将其赶下台,多亏老省长爱惜人才,推荐其参加跨国合资公司总裁竞聘,才东山再起然而,仕途一旦顺风,官运一发不可收拾由于庾明联合地方政府开展棚户区改造工程受到了中央领导和老百姓的赞誉。在省代会上,他又被推举到了省长的重要岗位。一介平民跃升为省长...
一个现代人,来到了古代,哇噻,美女如云呀,一个一个都要到手,战争阴谋铁血一揽众美,逍遥自来快乐似神仙本书集铁血与情感于一身为三国类中佳品。...
书名?阅女无限??呵呵,广大银民,请看清楚哦。吴县,这个二十岁的青涩小子,进城上学,居然一不留神,取悦于众多美女,在众女的帮助下,事业也是蒸蒸日上。且看主角如何将有限的生命,投入到吴县的悦女事业中去。蹩脚的猪脚,由一个初哥,逐渐成为花丛高手。...
魔族强势,在人类即将被灭绝之时,六大圣殿崛起,带领着人类守住最后的领土。一名少年,为救母加入骑士圣殿,奇迹诡计,不断在他身上上演。在这人类六大圣殿与魔族七十二柱魔神相互倾轧的世界,他能否登上象征着骑士最高荣耀的神印王座?...
张湖畔,张三丰最出色的弟子,百年进入元婴期境界的修真奇才。他是张三丰飞升后张三丰所有仙器,灵药,甚至玄武大帝修炼仙境的唯一继承者,也是武当派最高者。在张三丰飞升后,奉师命下山修行。大学生,酒吧服务员,普通工人不同的身份,不同的生活,总是有丰富多彩的人生,不同的遭遇,动人的感情,总是让人沉醉不已。武林高手...