您的瀏覽位置:首頁 >> 業界縱橫 >> 機器也能有閱讀理解能力?
機器也能有閱讀理解能力?
閱讀不僅是人類獲取知識、提高心智的重要途徑,對于機器而言,擁有
閱讀能力同樣也能夠實現持續學習和進化。機器
閱讀理解主要通過讓機器閱讀文本,然后回答和閱讀內容相關的問題,其中涉及到的理解、推理、摘要等復雜技術,對機器而言頗具挑戰。
計算機文本理解能力首次超越人類
今年1月,在機器閱讀理解領域頂級賽事、由美國斯坦福大學發起的SQuAD挑戰賽上,位列前幾名的團隊包括微軟亞洲研究院、阿里巴巴、科大訊飛和哈工大聯合實驗室,他們各自提交的系統模型先后超越了人類解答的分數。計算機文本理解能力在這個測試上首次超越人類,成為自然語言處理領域一個重要里程碑。
雖然目前世界機器閱讀理解的技術多集中在英文領域,但近年來中國研發團隊在機器閱讀理解比賽中屢創佳績。在不久的將來,中國人在AI(人工智能)的這個領域有望實現彎道超車,達到世界頂尖水平。
該領域突破將反哺其他領域
通常,機器閱讀理解的定義是讓機器閱讀文本,然后回答和閱讀內容相關的問題。在微軟亞洲研究院副院長、國際計算語言學協會(ACL)候任主席、中國中文信息技術專委會主任周明看來,自然語言理解是人工智能“皇冠上的明珠”,而機器閱讀理解是自然語言處理中最關鍵的部分。
目前,自然語言處理技術在神經機器翻譯、智能搜索、智能客服、聊天機器人甚至文藝寫作等方面都有廣泛應用。隨著大數據、深度學習和運算能力的提高,機器閱讀理解水平近兩年突飛猛進,尤其是在閱讀理解評測上達到了人類任務的標準水平。同時,自然語言理解的突破,也將從技術上反哺圖像識別和語音識別等領域。
不過,機器閱讀理解超越人類,并不能表明機器的能力就超越了人類。機器擬合數據的能力足夠強,但在推理、知識圖譜以及人類通用知識和常識方面,機器的能力仍然是非常脆弱的,目前仍未解決。
中國AI發展有多方面優勢
談到中國在人工智能領域的整體發展,周明認為中國有多方面的優勢。
首先,中國有一個清晰的藍圖,政府有明確的綱要,從政策到投資,都鼓勵人工智能的發展。
其二,中國擁有世界上最龐大的網民群體,無論是電子商務、搜索,還是辦公、語音等等,有強烈的用戶需求。
其三,目前的工業和產品都是數據驅動的,那就意味著誰掌握數據,誰掌握場景,基本就掌握了主動權。現在中國講究數字化轉型,各行各業的需求都要數字化,數字化再往上是智能化。比如交通、醫療、教育、司法、金融等,都有大量數據,這些領域只要把數據做好,然后加入人工智能的一些能力,就將會極大提高整個社會生產力。
其四,中國過去幾十年的積累,基礎設施都比較齊備,包括人工智能的人才儲備,而且將會有越來越多的投資促進公司和高校研發力量不斷增強人才培養。
不過,周明指出,中國人工智能領域的拔尖人才,尤其是能夠提出領先理念的領軍人物相比美國少很多。“我們一開始可能是追隨者,但到了一定程度后,我們應該有自信心來引領世界人工智能,包括自然語言理解的潮流。”