第148章 你們能比我更懂機器翻譯(5k)
你們只做了語料庫的擴展,規(guī)則覆蓋都沒有做,上下文依賴處理也沒有。
你們能比我更懂機器翻譯?”
林燃怒吼道:“你們做了九年都沒有進展,現(xiàn)在立刻馬上按照我說的去做!”
林燃的地位、實力和權(quán)力擺在這,他們根本沒有拒絕的選擇。
沃森會信林燃就不說了,畢竟深藍項目才結(jié)束,國防部的麥克納馬拉那更是林燃說什么就是什么。
你們這幫搞計算機的能比數(shù)學大師更懂計算機?
林燃在博弈論和統(tǒng)計學上展現(xiàn)出來的風采,麥克納馬拉還沒忘呢。
ibm的ceo支持林燃,國防部部長支持林燃,喬治敦大學的研究團隊只能被按在地上摩擦。
“我們要做的一共五點,優(yōu)化算法和規(guī)則設(shè)計,擴充語料和詞匯,改進數(shù)據(jù)處理的效率,引入統(tǒng)計方法和硬件最大化利用。
其中改進數(shù)據(jù)處理效率和硬件最大化利用由ibm方面負責。
另外三點則由喬治敦大學的成員們負責。
我們先來談優(yōu)化算法和規(guī)則設(shè)計。
你們一直的問題在于,你們對于規(guī)則集的擴張沒有引入更加細化的句法規(guī)則。
因為存儲有限,你們覺得擴充對照詞匯庫就夠了。
實際上句法規(guī)則顯得更加重要。
你們需要做到,引進常見的高頻句型。
對上下文進行依賴處理。使詞匯翻譯考慮前后詞,通過有限的上下文窗口來減少歧義。