燃文小说吧

手机浏览器扫描二维码访问

第67章 你们能比我更懂机器翻译5k(第1页)

“教授,你不是做语言翻译的,语言是规则的游戏,概率这太不靠谱了。”保罗·加尔文还想再挣扎一下。

当然他确实也不信翻译和统计学能扯上什么关系。

词语之间一一对应。

英文单词和俄语单词一一对应,直接直译,扩充语料库。

在当时的思维里,这才是正道。

也就是所谓穷举法。

把所有的词语做好一一对应之后,自动翻译也就实现了。

统计学,概率游戏,不谈如果林燃是对的,他们的无能会暴露无遗,光是林燃提到的改进原理从直觉上来说就是错误的。

简单来说,反直觉。

就像在GPT大模型出来之前,大家都觉得算法最重要。

GPT出来之后,大家开始都一窝蜂力大飞砖。

等到deepseek的时候,好像算法有点用。

哪怕是顶级的研究人员,也会有盲从的问题,会有迷茫、找不到方向、走不出来的情况。

在这个计算机的混沌年代,会这样再正常不过了。

“精确?精确意味着出错,现在的计算机远远达不到精确这一点。

你们难道不清楚,你们在54年之所以演示出了良好的效果,是因为那些俄语句子是你们精挑细选出来的。

实际自然语言的复杂性要远超你们预期。

你们只做了语料库的扩展,规则覆盖都没有做,上下文依赖处理也没有。

你们能比我更懂机器翻译?”

林燃怒吼道:“你们做了九年都没有进展,现在立刻马上按照我说的去做!”

林燃的地位、实力和权力摆在这,他们根本没有拒绝的选择。

沃森会信林燃就不说了,毕竟深蓝项目才结束,国防部的麦克纳马拉那更是林燃说什么就是什么。

你们这帮搞计算机的能比数学大师更懂计算机?

林燃在博弈论和统计学上展现出来的风采,麦克纳马拉还没忘呢。

IBM的CEO支持林燃,国防部部长支持林燃,乔治敦大学的研究团队只能被按在地上摩擦。

“我们要做的一共五点,优化算法和规则设计,扩充语料和词汇,改进数据处理的效率,引入统计方法和硬件最大化利用。

其中改进数据处理效率和硬件最大化利用由IBM方面负责。

另外三点则由乔治敦大学的成员们负责。

我们先来谈优化算法和规则设计。

你们一直的问题在于,你们对于规则集的扩张没有引入更加细化的句法规则。

因为存储有限,你们觉得扩充对照词汇库就够了。

实际上句法规则显得更加重要。

你们需要做到,引进常见的高频句型。

对上下文进行依赖处理。使词汇翻译考虑前后词,通过有限的上下文窗口来减少歧义。

比如свет同时有光和世界的意思。

热门小说推荐
圣堂

圣堂

一个小千世界狂热迷恋修行的少年获得大千世界半神的神格,人生从这一刻改变,跳出法则之外,逆天顺天,尽在掌握!骷髅精灵不能说的秘密,尽在火热圣堂,等你来战!...

我的极品老婆们(都市特种兵)

我的极品老婆们(都市特种兵)

一个被部队开除军籍的特种兵回到了都市,看他如何在充满诱惑的都市里翻云覆雨...

倚天屠龙夺艳记

倚天屠龙夺艳记

赵敏的娇蛮狐媚周芷若的举止优雅小昭的温柔体贴不悔的秀丽美艳蛛儿的任性刁蛮  一梦醒来,该是倚天屠龙的另一个新主角上场了...

张三丰弟子现代生活录

张三丰弟子现代生活录

张湖畔,张三丰最出色的弟子,百年进入元婴期境界的修真奇才。他是张三丰飞升后张三丰所有仙器,灵药,甚至玄武大帝修炼仙境的唯一继承者,也是武当派最高者。在张三丰飞升后,奉师命下山修行。大学生,酒吧服务员,普通工人不同的身份,不同的生活,总是有丰富多彩的人生,不同的遭遇,动人的感情,总是让人沉醉不已。武林高手...

师娘,借个火(师娘,别玩火)

师娘,借个火(师娘,别玩火)

师父死了,留下美艳师娘,一堆的人打主意,李福根要怎么才能保住师娘呢?...

鹿鼎风流记

鹿鼎风流记

少年附身韦小宝,和康熙做兄弟,唬弄皇帝有一手绝色美女尽收,色遍天下无敌手!睿智独立,诱惑惊艳的蓝色妖姬苏荃花中带刺刺中有花的火红玫瑰方怡温柔清新纯洁可人的水仙花沐剑屏空谷幽香,善解人意的解语花双儿倾国倾城,美丽绝伦的花中之王牡丹阿珂诱惑惊艳美艳毒辣的罂粟花建宁空灵纯洁娇艳精怪的山涧兰花曾柔...