第149章 教授妙手回春,乔治敦焕发新生(5k))(2 / 2)
不是冲着教授,他们才不来呢。
当然,其中对乔治敦项目焕发新生最有信心的就是麦克纳马拉。
「教授,你怎麽不亲自介绍?」麦克纳马拉低声问站在他身旁的林燃。
「我只是给他们起到了一点小小的辅助作用,其实功劳全是乔治敦大学和IBM的研究人员们。」林燃说。
麦克纳马拉装作不满的样子:「教授,你太谦虚了。
你给他们设计的统计学方法我都看过了,要是没有你的参与,以乔治敦这帮蠢,em这帮家伙的脑子,恐怕再花十年也想不到。」
当林燃在和麦克纳马拉窃窃私语的时候,人群中,为国防部工作的语言学家保罗·加文博士眉头微皱,手中的钢笔轻轻敲击着笔记本,他一直对机器的实际能力持保留态度。
哪怕是大名鼎鼎的教授亲自参与其中。
旁边的詹姆斯·里德上校,一直负责审批国防部给乔治敦的预算,负责跟踪该项目,则双臂交叉,面无表情,军装笔挺。
腊斯克则手持记事本,目光不时在机器和林燃之间游移,想在林燃和麦克纳马拉之间插话,但又没想好要说什麽。
加尔文清了清嗓子,声音平稳而有力:「各位先生,今天,你们将见证机器翻译的最新进展。在林教授的指导下,我们显着提升了系统的准确性和处理复杂语言结构的能力。」
加文博士推了推眼镜,率先发问:「改进?上一个版本在处理习语和句法歧义时表现得很糟糕。这次你们是怎麽解决的?」
加尔文自信道:「我们引入了基于频率的统计模型,通过分析双语语料库,系统现在能够更好地分辨词义并处理依赖上下文的翻译。」
里德上校冷冷地插话:「说得好听。让我们看看实际效果。时间紧迫,我们要的是结果。」
加尔文点点头,转身走向机器的操作台:「当然,我们马上开始。先做一个简单的演示。」
他熟练地在键盘上输入一句俄语:「Мыговоримомире。」
机器立刻运转起来,内部零件发出轻微的咔嗒声和嗡鸣,几秒后,屏幕上显示出英文翻译:「We speak about peace.」
房间里传出一阵低语,加文博士挑了挑眉:「不错,但这只是个简单句。更难的呢?」
加尔文早有准备:「当然可以。我们试试有歧义的句子。」
他输入另一句俄语:「Ончитаеткнигу。」机器迅速输出:「He reads the book.」
加文博士点头,但仍不满足:「如果上下文不同呢?比如『книга』指的是帐簿而不是书?」
加尔文手指缓慢敲击键盘,输入新句子:「Бухгалтерчитаеткнигу。」
机器略作停顿后显示:「The accountant reads the ledger.」
房间里响起一片惊叹。里德上校的双臂缓缓放下,眼中闪过一丝惊讶,这和他之前看到的乔治敦机器截然不同:「它是怎麽判断的?」
加尔文解释道:「系统现在能结合上下文线索和概率模型进行推断。『Бухгалтер』(会计)提示了财务背景,因此选择了『ledger』而非『book』。」
之前负责翻译的工作人员思忖:「这对情报工作可能是革命性的。」
加文博士走近机器,眼中多了几分兴趣:「我想看看它如何处理更复杂的句子,比如多重从句或习语。」
「让我来试试。」加文坐在输入设备前。
加尔文点头道:「没问题。」
加文博士略一思索,输入:「Времялетит,когдатывеселишься。」
机器很快输出:「Time flies when you're having fun.」
里德上校却不为所动:「这很不错,但我们需要它处理军事术语和技术词汇。我们的需求很具体。」
加尔文直视他的眼睛:「加文博士,你可以再试试一些专业词汇,我们已经开始整合专业词汇表,包括军事和科学术语。」
加文博士思索片刻后输入:「Ракетаоснащенаинерциальнойнавигационнойсистемой。」
机器翻译为:「The missile is equipped with an inertial navigation system.」
上校眼中闪过一丝波动,罕见地露出一丝认可:「相当精确。」
房间安静了片刻,所有人都感受到这一刻的分量。
官员们交换了一下眼神,怀疑逐渐转为乐观。
一位国防专家,一位面容锐利的女士,开口道:「加尔文教授,您的工作可能会改变我们的行动方向。
这台机器的速度和准确性确实和过去比起来有了很大的提高。
多久能大规模应用?」
加尔文停顿了一下,谨慎回答:「如果有更多资源支持,我们可以在六个月内开始扩展系统。不过,我们还需要继续优化算法和扩充语言资料库。」
麦克纳马拉鼓掌,转身对沃森说道:「沃森先生,恭喜,你们将获得国防部的订单。」
然后接着对林燃说道:「教授,我就知道你肯定能做到。」
最后才是加尔文:「加尔文教授,国防部后续会跟你联系。」
林燃说:
「大家也不要太乐观。
乔治敦只能说能用,离用好还有很遥远的一段距离。
IBM方面得提高机器的性能,性能越好,它的翻译准确度就越高。
其次乔治敦大学这边要继续沿着我设计的技术路线,不断挖掘它的潜力。
但这条机器翻译的技术路线是有上限的。
只有统计学方法上的更新换代,才能实现更好的翻译效果。
不过等你们挖掘到这条技术路线的上限之后,我建议在这个过程中,乔治敦大学最好多招一些统计学和理论数学专业的博士参与到这个项目中来。
最后是国防部这边,后续在使用乔治敦机器用于俄语翻译的时候,其实还是要依赖人工审核。
能够帮你们提升效率,但提升效率的程度有限,你们不能完全依赖机器。」
其实乔治敦的效果就和最早的翻译有点类似,纯机械式的翻译。
不会按照语言特性进行优化。
只是因为英语和俄语都和拉丁语系有关,只是有关,相关性不算低。
但肯定比英语翻译成中文要简单得多。
「当下这个版本的乔治敦翻译机器,在军事丶科技这两个特定领域会表现的比较好,在其他领域,以及对于复杂句和非专业语境下,它的错误率会比较高。
俄语是高度屈折语言,名词有六格变化,动词有复杂的时态和体,而英语语法较简单,仅仅依赖词序和介词而已。
乔治敦机器想做到准确处理格变化和词序调整,还是存在比较大的困难。
我们目前也只是通过概率表和上下文窗口缓解了多义词问题,规则系统确保了基本语法的准确性。
简单句大概能够达到百分之八十到九十的准确率,但复杂句,像嵌套从句之类的还是很容易出错。
对于新闻丶外交声明这种结构清晰的文本,它的效果应该会很好。
但对涉及到大量口语的对话,它很难准确捕捉细微差别,错误率可能会达到50%。
我觉得各位需要保持一个谨慎乐观的态度。」
林燃说完后,腊斯克开口道:「教授,这已经足够了。
对于目前白宫和国防部的需求来说,它只需要批量处理书面文本,像新闻丶报告之类的就已经是很大的作用了。
电话会议这种,我们也没指望他能够做到准确翻译。」
确实,作为一个都快要被判死刑的项目,一年后被砍掉,甚至被认为是AI寒冬,现在被林燃两个月时间就救回来,当下具备了实际应用价值。
这已经是一种飞跃了。
访客们陆续离开,兴奋的低语在走廊里回荡。
麦克纳马拉非要去林燃的办公室坐一会。
「教授,关于你想借阅《MIT辐射实验室系列》,我这边已经批准了。
最快应该后天IBM那边就会批准,包括当时的一些雷达设计方案之类的内容我让林肯国家实验室一起提供给你。
正好你也看看这方面的内容,看有没有什麽灵感能够提供给我们。」麦克纳马拉一边喝茶,一边说道。
林燃心想,妈的,好人啊!
(本章完)
↑返回顶部↑