顧 問
潘云鶴 中國工程院院士
指導(dǎo)單位
工業(yè)和信息化部信息化和軟件服務(wù)業(yè)司
指導(dǎo)委員會(huì)
謝少鋒 工信部信軟司司長
李冠宇 工信部信軟司副司長
徐曉蘭 中國電子學(xué)會(huì)副理事長兼秘書長
張宏圖 中國電子學(xué)會(huì)總部黨委書記兼副秘書長
商 超 工信部信軟司軟件處處長
傅永寶 工信部信軟司軟件處調(diào)研員
專家委員會(huì)(排名不分先后,按姓氏筆畫排序)
王士進(jìn) 科大訊飛研究院副院長
韋 青 微軟中國公司首席技術(shù)官
宋 波 國安瑞(北京)科技有限公司總經(jīng)理
劉志堅(jiān) 京東金融總法律顧問
吳甘沙 馭勢科技聯(lián)合創(chuàng)始人兼CEO
季向陽 清華大學(xué)自動(dòng)化系教授
陳麗娟 阿里巴巴人工智能實(shí)驗(yàn)室負(fù)責(zé)人
梁家恩 云知聲信息技術(shù)有限公司董事長兼CTO
崔 巖 中德人工智能研究院院長
蔡雄山 騰訊研究院法律研究中心副主任
編寫單位
中國電子學(xué)會(huì)
編寫人員
李 颋 周岷峰 馬 良 凌 霞
李 巖 張雅妮 許華磊 張 嬋
張 力 陳濛萌 樊江洋 朱 毅
李俊平 閻德利 謝中業(yè) 陳 巖
1、編制背景
自1956年概念得以確立以來,人工智能發(fā)展至今已逾60年,隨著所處信息環(huán)境和數(shù)據(jù)基礎(chǔ)的深刻變革,開始邁進(jìn)新一輪發(fā)展階段,呈現(xiàn)出大數(shù)據(jù)、跨媒體、群體性、自主化、人機(jī)融合的發(fā)展新特征,從學(xué)術(shù)牽引式發(fā)展迅速轉(zhuǎn)變?yōu)樾枨鬆恳桨l(fā)展,相比歷史上的任何時(shí)刻,都要更加接近于人類智能,既能為進(jìn)一步掌握城市發(fā)展、生態(tài)保護(hù)、經(jīng)濟(jì)管理、金融風(fēng)險(xiǎn)等宏觀系統(tǒng)提供指導(dǎo),也能為設(shè)計(jì)制造、健康醫(yī)療、交通管理、能源節(jié)約等微觀領(lǐng)域提供解決方案。我國正值工業(yè)化、城鎮(zhèn)化、信息化、農(nóng)業(yè)現(xiàn)代化的攻堅(jiān)階段,迫切需要加快推動(dòng)人工智能在國民經(jīng)濟(jì)社會(huì)各行業(yè)、各領(lǐng)域的創(chuàng)新應(yīng)用,促進(jìn)產(chǎn)業(yè)提質(zhì)增效,改善人民生活水平,切實(shí)解決經(jīng)濟(jì)運(yùn)行的重大結(jié)構(gòu)性失衡。針對(duì)于此,有必要研究編制新一代人工智能發(fā)展白皮書,明確人工智能在新時(shí)期、新形勢下的技術(shù)框架、關(guān)鍵環(huán)節(jié)、應(yīng)用前景,為推動(dòng)人工智能關(guān)鍵技術(shù)進(jìn)步和產(chǎn)業(yè)化應(yīng)用推廣提供措施建議,進(jìn)一步推動(dòng)我國智能相關(guān)的前沿新興產(chǎn)業(yè)持續(xù)健康快速發(fā)展,有力支撐我國信息化和工業(yè)化深度融合邁上新臺(tái)階。
2、編制目標(biāo)
(1)明確新一代人工智能的主要發(fā)展方向,系統(tǒng)歸納其主要驅(qū)動(dòng)因素及最具典型意義的特征。
(2)研究新一代人工智能的技術(shù)框架,梳理技術(shù)演進(jìn)軌跡,提出基礎(chǔ)性、通用性技術(shù)體系。
(3)探索新一代人工智能的產(chǎn)業(yè)邊界,劃分產(chǎn)業(yè)類別和應(yīng)用場景,研判相關(guān)的投融資特征及趨勢。
(4)提出促進(jìn)新一代人工智能及相關(guān)技術(shù)及產(chǎn)業(yè)發(fā)展的可行性措施建議,為相關(guān)行業(yè)主管部門提供決策參考,為行業(yè)健康有序發(fā)展提供指導(dǎo)依據(jù)。
3、編制方法
(1)研究學(xué)習(xí)國內(nèi)外相關(guān)戰(zhàn)略政策文件,充分借鑒參考國內(nèi)外主要研究動(dòng)態(tài)和成果。主要包括:美國白宮發(fā)布的《為人工智能的未來做好準(zhǔn)備》、《國家人工智能研究與發(fā)展戰(zhàn)略規(guī)劃》;英國下議院科學(xué)和技術(shù)委員會(huì)發(fā)布的《機(jī)器人和人工智能》、英國政府科學(xué)辦公室發(fā)布的《人工智能對(duì)未來決策的機(jī)會(huì)和影響》,以及英國政府在2017年1月宣布的《現(xiàn)代工業(yè)戰(zhàn)略》和3月公布的《數(shù)字戰(zhàn)略》;日本政府制定的《人工智能產(chǎn)業(yè)化路線圖》;我國出臺(tái)的《國務(wù)院關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動(dòng)的指導(dǎo)意見》和《“十三五”國家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》中關(guān)于人工智能的部分。同時(shí),針對(duì)歐盟的“人腦項(xiàng)目”、德國的“智慧數(shù)據(jù)項(xiàng)目”、日本的“超智能社會(huì)”和“高級(jí)綜合智能平臺(tái)計(jì)劃”進(jìn)行了學(xué)習(xí)了解。
(2)訪談國內(nèi)知名專家學(xué)者,圍繞新一代人工智能的內(nèi)涵、外延及特征趨勢展開充分研討。新一代人工智能既有創(chuàng)新性又有繼承性,與過往所談?wù)摰娜斯ぶ悄芗扔新?lián)系又有區(qū)別,在研究內(nèi)容上既要有突破又要有充分吸收和借鑒。通過與國內(nèi)人工智能相關(guān)領(lǐng)域的知名院士、高校學(xué)者、行業(yè)專家的座談交流,尤其是圍繞中國工程院潘云鶴院士《人工智能邁向2.0》一文進(jìn)行的深入學(xué)習(xí)研討,為白皮書的編制奠定了系統(tǒng)的理論基礎(chǔ)。
(3)調(diào)研國內(nèi)外知名人工智能企業(yè),匯集整理和分析來自實(shí)踐應(yīng)用的典型案例。高度重視人工智能領(lǐng)域的具體產(chǎn)品、服務(wù)及解決方案提供方式,走進(jìn)國內(nèi)外一批在技術(shù)或產(chǎn)業(yè)方面具備領(lǐng)先水平和特色優(yōu)勢的人工智能企業(yè)展開深度調(diào)研,并邀請(qǐng)部分企業(yè)的技術(shù)或戰(zhàn)略負(fù)責(zé)人共同參與了白皮書的編制工作。
4、特別聲明
(1)研究主題充分考慮了與國家規(guī)劃的互動(dòng)和呼應(yīng)
人工智能的概念從誕生之日開始計(jì)算,已經(jīng)超過60年,并非橫空出世的新興事物。只不過受近年來算法模式持續(xù)優(yōu)化、數(shù)據(jù)信息海量增長、運(yùn)算力大幅提升的影響和帶動(dòng),表現(xiàn)出了不同以往的發(fā)展水平和特征。本白皮書一開始研究主題名為“人工智能2.0”,目前已更改為“新一代人工智能”,是為了呼應(yīng)院士研究文章、部委領(lǐng)導(dǎo)講話,以及即將出臺(tái)的國家級(jí)規(guī)劃,重點(diǎn)針對(duì)人工智能的新趨勢、新特征、新模式展開研究,并非是要提出一個(gè)全新的研究對(duì)象。
(2)研究范圍聚焦技術(shù)和產(chǎn)業(yè)發(fā)展
在人工智能領(lǐng)域,正孕育著堪與相對(duì)論、量子理論、計(jì)算機(jī)、互聯(lián)網(wǎng)相提并論的重大創(chuàng)新、變革及突破。人工智能歷史性地站在了時(shí)代的風(fēng)口,將對(duì)人類經(jīng)濟(jì)社會(huì)發(fā)展帶來智能化浪潮的顛覆性猛烈沖擊。研究人工智能,就要研究其在人類生產(chǎn)生活中的詳細(xì)地位和作用,涉及到方方面面,包括了道德、法律、倫理、文化等領(lǐng)域。本白皮書的編制,主要是為了給相關(guān)行業(yè)主管部門和企業(yè)提供決策參考依據(jù),集中在技術(shù)和產(chǎn)業(yè)兩大層面展開研究,暫未涉及其他方面。
(3)研究內(nèi)容仍有待進(jìn)一步豐富完善
當(dāng)前,各類研究咨詢機(jī)構(gòu)紛紛推出圍繞人工智能主題的相關(guān)報(bào)告,各自觀點(diǎn)既有一致性,也存在部分不同意見。本白皮書的主要觀點(diǎn)和內(nèi)容僅代表編制組在目前對(duì)人工智能的研判和思考,歡迎各方專家學(xué)者和企業(yè)代表提出寶貴意見,共同推動(dòng)白皮書的及時(shí)更新和糾偏。同時(shí),隨著人工智能技術(shù)的進(jìn)步、產(chǎn)業(yè)的發(fā)展、模式的變革,白皮書的內(nèi)容將得到進(jìn)一步豐富完善。
第二章 新一代人工智能技術(shù)框架
與早期人工智能相比,新一代人工智能正在全新信息環(huán)境、海量數(shù)據(jù)基礎(chǔ)和持續(xù)演進(jìn)、不斷豐富的戰(zhàn)略目標(biāo)的引領(lǐng)下,依托于云計(jì)算、大數(shù)據(jù)兩大基礎(chǔ)平臺(tái)和機(jī)器學(xué)習(xí)、模式識(shí)別和人機(jī)交互三大通用技術(shù),以新型計(jì)算架構(gòu)、通用人工智能和開源生態(tài)系統(tǒng)為主要導(dǎo)向,持續(xù)搭建和完善技術(shù)框架體系,不斷逼近技術(shù)奇點(diǎn),深刻變革人類生產(chǎn)生活。
(一)新一代人工智能的技術(shù)演進(jìn)
1、從原有的CPU架構(gòu),轉(zhuǎn)變?yōu)?/span>GPU并行運(yùn)算架構(gòu)
深度學(xué)習(xí)算法運(yùn)行于CPU架構(gòu)的指令需求過于復(fù)雜。機(jī)器學(xué)習(xí)領(lǐng)域的泰斗杰弗里·辛頓開啟了深度學(xué)習(xí)在人工智能領(lǐng)域研究的浪潮,大數(shù)據(jù)技術(shù)帶來的數(shù)據(jù)洪流滿足了深度學(xué)習(xí)算法對(duì)于訓(xùn)練數(shù)據(jù)量的要求,但是算法的實(shí)現(xiàn)還需要更快更強(qiáng)大的處理器予以支撐。傳統(tǒng)的主流CPU架構(gòu)如X86、ARM等往往需要數(shù)百甚至上千條指令才能完成一個(gè)神經(jīng)元的處理,對(duì)于并不需要太多的程序指令,卻需要海量數(shù)據(jù)運(yùn)算的深度學(xué)習(xí)的計(jì)算需求,并不能很好地匹配與適應(yīng)。
GPU架構(gòu)具備與深度學(xué)習(xí)相匹配的并行運(yùn)算能力。GPU(圖形處理器)最初是個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備上運(yùn)行繪圖運(yùn)算工作的微處理器,可以快速處理圖像上的每一個(gè)像素點(diǎn),其海量數(shù)據(jù)并行運(yùn)算的能力與深度學(xué)習(xí)需求非常符合。當(dāng)前主流的CPU只有4核或者8核,可以模擬出12個(gè)處理線程來進(jìn)行運(yùn)算,但是普通級(jí)別的GPU就包含了成百上千個(gè)處理單元,高端的甚至更多,這對(duì)于多媒體計(jì)算中大量的重復(fù)處理過程有著天生的優(yōu)勢。吳恩達(dá)教授領(lǐng)導(dǎo)的谷歌大腦研究工作結(jié)果表明,12顆英偉達(dá)(Nvidia)公司的GPU可以提供相當(dāng)于2000顆CPU的深度學(xué)習(xí)性能,為技術(shù)的發(fā)展帶來了實(shí)質(zhì)性飛躍,被廣泛應(yīng)用于全球各大主流深度學(xué)習(xí)開發(fā)機(jī)構(gòu)與研究院所。
2、從單一算法驅(qū)動(dòng),轉(zhuǎn)變?yōu)閿?shù)據(jù)、運(yùn)算力、算法復(fù)合驅(qū)動(dòng)
缺少數(shù)據(jù)支撐與運(yùn)算力保證的算法驅(qū)動(dòng)模式難以持續(xù)發(fā)展。人工智能發(fā)展以實(shí)現(xiàn)計(jì)算智能為重要研究方向,充分利用現(xiàn)代高性能計(jì)算機(jī)的快速計(jì)算和記憶存儲(chǔ)能力,設(shè)計(jì)出神經(jīng)計(jì)算、模糊計(jì)算和進(jìn)化計(jì)算等求解算法,解決優(yōu)化篩選、單點(diǎn)搜索、邏輯推理等實(shí)際應(yīng)用問題。盡管深度學(xué)習(xí)概念和淺層學(xué)習(xí)算法已經(jīng)被提出多年,但是一直進(jìn)展緩慢,究其原因是缺乏海量的數(shù)據(jù)積累和與之相匹配的高水平計(jì)算能力,無法對(duì)算法模型進(jìn)行持續(xù)的改進(jìn)與優(yōu)化,只停留在理論研究階段,距離實(shí)際應(yīng)用存在不小的差距。
數(shù)據(jù)、運(yùn)算力和算法復(fù)合驅(qū)動(dòng)模式引發(fā)人工智能爆發(fā)式增長。與早期人工智能相比,新一代人工智能體現(xiàn)出數(shù)據(jù)、運(yùn)算力和算法相互融合、優(yōu)勢互補(bǔ)的良好特點(diǎn)。數(shù)據(jù)方面,人類進(jìn)入互聯(lián)網(wǎng)時(shí)代后,數(shù)據(jù)技術(shù)高速發(fā)展,各類數(shù)據(jù)資源不斷積累,為人工智能的訓(xùn)練學(xué)習(xí)過程奠定了良好的基礎(chǔ)。運(yùn)算力方面,摩爾定律仍在持續(xù)發(fā)揮效用,計(jì)算系統(tǒng)的硬件性能逐年提升,云計(jì)算、并行計(jì)算、網(wǎng)格計(jì)算等新型計(jì)算方式的出現(xiàn)拓展了現(xiàn)代計(jì)算機(jī)性能,獲得更快的計(jì)算速度。算法方面,伴隨著深度學(xué)習(xí)技術(shù)的不斷成熟,運(yùn)算模型日益優(yōu)化,智能算法不斷更新,提升了模型辨識(shí)解析的準(zhǔn)確度。
3、從封閉的單機(jī)系統(tǒng),轉(zhuǎn)變?yōu)榭旖蒽`活的開源框架
專家系統(tǒng)本地化特性限制了人工智能發(fā)展步伐。以往的人工智能專家系統(tǒng)是基于本地化專業(yè)知識(shí)進(jìn)行設(shè)計(jì)開發(fā),以知識(shí)庫和推理機(jī)為中心而展開,推理機(jī)設(shè)計(jì)內(nèi)容由不同的專家系統(tǒng)應(yīng)用環(huán)境決定,單獨(dú)設(shè)定模型函數(shù)與運(yùn)算機(jī)制,一般不具備通用性。同時(shí),知識(shí)庫是開發(fā)者收集錄入的專家分析模型與案例的資源集合,只能夠在單機(jī)系統(tǒng)環(huán)境下使用且無法連接網(wǎng)絡(luò),升級(jí)更新較為不便。
開源框架推動(dòng)構(gòu)建人工智能行業(yè)解決方案。人工智能系統(tǒng)的開發(fā)工具日益成熟,通用性較強(qiáng)且各具特色的開源框架不斷涌現(xiàn),如谷歌的TensorFlow、Facebook的Torchnet、百度的PaddlePaddle等,其共同特點(diǎn)均是基于Linux生態(tài)系統(tǒng),具備分布式深度學(xué)習(xí)數(shù)據(jù)庫和商業(yè)級(jí)即插即用功能,能夠在GPU上較好地繼承Hadoop和Spark架構(gòu),廣泛支持Python、Java、Scala、R等流行開發(fā)語言,與硬件結(jié)合生成各種應(yīng)用場景下的人工智能系統(tǒng)與解決方案。
4、從學(xué)術(shù)研究探索導(dǎo)向,轉(zhuǎn)變?yōu)榭焖俚膶?shí)踐應(yīng)用導(dǎo)向
學(xué)術(shù)導(dǎo)向難以滿足復(fù)雜數(shù)據(jù)信息背景下的創(chuàng)新需求。隨著人工智能的不斷發(fā)展,分化產(chǎn)生了不同的學(xué)術(shù)流派,以符號(hào)主義、聯(lián)結(jié)主義、進(jìn)化主義、貝葉斯學(xué)派、類推學(xué)派等為典型。不同學(xué)派按照各自對(duì)人工智能領(lǐng)域基本理論、研究方法和技術(shù)路線的理解,以學(xué)術(shù)研究為目的進(jìn)行探索實(shí)踐,一定程度上推動(dòng)了人工智能理論與技術(shù)的發(fā)展。在如今數(shù)據(jù)環(huán)境改變和信息環(huán)境變化的背景下,現(xiàn)實(shí)世界結(jié)構(gòu)趨向復(fù)雜,單純依靠課題立項(xiàng)和學(xué)術(shù)研究無法持續(xù)推動(dòng)人工智能滿足當(dāng)前現(xiàn)實(shí)世界的模擬與互動(dòng)需求,快速變化的應(yīng)用環(huán)境也容易導(dǎo)致理論研究與實(shí)際應(yīng)用相脫節(jié),影響人工智能技術(shù)對(duì)經(jīng)濟(jì)發(fā)展和社會(huì)進(jìn)步的積極拉動(dòng)作用。
快速迭代的實(shí)踐應(yīng)用導(dǎo)向加速形成技術(shù)發(fā)展正循環(huán)。目前,人工智能圍繞醫(yī)療、金融、交通、教育、零售等數(shù)據(jù)較集中且質(zhì)量較高的行業(yè)的實(shí)踐需求,在算法模型、圖像識(shí)別、自然語言處理等方面將持續(xù)出現(xiàn)迭代式的技術(shù)突破,在深度應(yīng)用中支撐人工智能實(shí)現(xiàn)“數(shù)據(jù)-技術(shù)-產(chǎn)品-用戶”的往復(fù)正循環(huán),由學(xué)術(shù)驅(qū)動(dòng)向應(yīng)用拉動(dòng)轉(zhuǎn)化。在人工智能技術(shù)準(zhǔn)備期,由于提供數(shù)據(jù)支撐較少,技術(shù)提升度慢,一旦進(jìn)入應(yīng)用期,大量的優(yōu)質(zhì)數(shù)據(jù)有助于分析技術(shù)弊端,通過對(duì)相關(guān)技術(shù)進(jìn)行改進(jìn)升級(jí),提升了產(chǎn)品的應(yīng)用水平,用戶在得到更好的產(chǎn)品體驗(yàn)后,繼續(xù)為應(yīng)用平臺(tái)創(chuàng)造了更大規(guī)模的后臺(tái)數(shù)據(jù),用來進(jìn)行下一步的技術(shù)升級(jí)與產(chǎn)品改良,由此進(jìn)入了大規(guī)模應(yīng)用階段。在技術(shù)快速迭代發(fā)展的過程中,數(shù)據(jù)累積和大規(guī)模應(yīng)用起到了至關(guān)重要的作用,能夠持續(xù)推動(dòng)人工智能技術(shù)實(shí)現(xiàn)自我超越。
(二)新一代人工智能技術(shù)體系
新一代人工智能技術(shù)體系由基礎(chǔ)技術(shù)平臺(tái)和通用技術(shù)體系構(gòu)成,其中基礎(chǔ)技術(shù)平臺(tái)包括云計(jì)算平臺(tái)與大數(shù)據(jù)平臺(tái),通用技術(shù)體系包括機(jī)器學(xué)習(xí)、模式識(shí)別與人機(jī)交互。在此技術(shù)體系的基礎(chǔ)上,人工智能技術(shù)不斷創(chuàng)新發(fā)展,應(yīng)用場景和典型產(chǎn)品不斷涌現(xiàn)。
1、云計(jì)算:基礎(chǔ)的資源整合交互平臺(tái)
云計(jì)算主要共性技術(shù)包括虛擬化技術(shù)、分布式技術(shù)、計(jì)算管理技術(shù)、云平臺(tái)技術(shù)和云安全技術(shù),具備實(shí)現(xiàn)資源快速部署和服務(wù)獲取、進(jìn)行動(dòng)態(tài)可伸縮擴(kuò)展及供給、面向海量信息快速有序化處理、可靠性高、容錯(cuò)能力強(qiáng)等特點(diǎn),為人工智能的發(fā)展提供了資源整合交互的基礎(chǔ)平臺(tái)。尤其與大數(shù)據(jù)技術(shù)結(jié)合,為當(dāng)前受到最多關(guān)注的深度學(xué)習(xí)技術(shù)搭建了強(qiáng)大的存儲(chǔ)和運(yùn)算體系架構(gòu),促進(jìn)了神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練優(yōu)化過程,顯著提高語音、圖片、文本等辨識(shí)對(duì)象的識(shí)別率。
表1 云計(jì)算主要共性技術(shù)
資料來源:中國電子學(xué)會(huì)整理
2、大數(shù)據(jù):提供豐富的分析、訓(xùn)練與應(yīng)用資源
大數(shù)據(jù)主要共性技術(shù)包括采集與預(yù)處理、存儲(chǔ)與管理、計(jì)算模式與系統(tǒng)、分析與挖掘、可視化計(jì)算及隱私及安全等,具備數(shù)據(jù)規(guī)模不斷擴(kuò)大、種類繁多、產(chǎn)生速度快、處理能力要求高、時(shí)效性強(qiáng)、可靠性要求嚴(yán)格、價(jià)值大但密度較低等特點(diǎn),為人工智能提供豐富的數(shù)據(jù)積累和價(jià)值規(guī)律,引發(fā)分析需求。同時(shí),從跟蹤靜態(tài)數(shù)據(jù)到結(jié)合動(dòng)態(tài)數(shù)據(jù),可以推動(dòng)人工智能根據(jù)客觀環(huán)境變化進(jìn)行相應(yīng)的改變和適應(yīng),持續(xù)提高算法的準(zhǔn)確性與可靠性。
表2 大數(shù)據(jù)主要共性技術(shù)
資料來源:中國電子學(xué)會(huì)整理
3、機(jī)器學(xué)習(xí):持續(xù)引導(dǎo)機(jī)器智能水平提升
機(jī)器學(xué)習(xí)指通過數(shù)據(jù)和算法在機(jī)器上訓(xùn)練模型,并利用模型進(jìn)行分析決策與行為預(yù)測的過程。機(jī)器學(xué)習(xí)技術(shù)體系主要包括監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),目前廣泛應(yīng)用在專家系統(tǒng)、認(rèn)知模擬、數(shù)據(jù)挖掘、圖像識(shí)別、故障診斷、自然語言理解、機(jī)器人和博弈等領(lǐng)域。機(jī)器學(xué)習(xí)作為人工智能最為重要的通用技術(shù),未來將持續(xù)引導(dǎo)機(jī)器獲取新的知識(shí)與技能,重新組織整合已有知識(shí)結(jié)構(gòu),有效提升機(jī)器智能化水平,不斷完善機(jī)器服務(wù)決策能力。
表3 機(jī)器學(xué)習(xí)主要共性技術(shù)
資料來源:中國電子學(xué)會(huì)整理
4、模式識(shí)別:從感知環(huán)境和行為到基于認(rèn)知的決策
模式識(shí)別是對(duì)各類目標(biāo)信息進(jìn)行處理分析,進(jìn)而完成描述、辨認(rèn)、分類和解釋的過程。模式識(shí)別技術(shù)體系包括決策理論、句法分析和統(tǒng)計(jì)模式等,目前廣泛應(yīng)用在語音識(shí)別、指紋識(shí)別、人臉識(shí)別、手勢識(shí)別、文字識(shí)別、遙感和醫(yī)學(xué)診斷等領(lǐng)域。隨著理論基礎(chǔ)和實(shí)際應(yīng)用研究范圍的不斷擴(kuò)大,模式識(shí)別技術(shù)將與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合,由目前單純的環(huán)境感知進(jìn)化為認(rèn)知決策,同時(shí)量子計(jì)算技術(shù)也將用于未來模式識(shí)別研究工作,助力模式識(shí)別技術(shù)突破與應(yīng)用領(lǐng)域拓展。
表4 模式識(shí)別主要共性技術(shù)
資料來源:中國電子學(xué)會(huì)整理
5、人機(jī)交互:支撐實(shí)現(xiàn)人機(jī)物交叉融合與協(xié)同互動(dòng)
人機(jī)交互技術(shù)賦予機(jī)器通過輸出或顯示設(shè)備對(duì)外提供有關(guān)信息的能力,同時(shí)可以讓用戶通過輸入設(shè)備向機(jī)器傳輸反饋信息達(dá)到交互目的。人機(jī)交互技術(shù)體系包括交互設(shè)計(jì)、可用性分析評(píng)估、多通道交互、群件、移動(dòng)計(jì)算等,目前廣泛應(yīng)用在地理空間跟蹤、動(dòng)作識(shí)別、觸覺交互、眼動(dòng)跟蹤、腦電波識(shí)別等領(lǐng)域。隨著交互方式的不斷豐富以及物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,未來肢體識(shí)別和生物識(shí)別技術(shù)將逐漸取代現(xiàn)有的觸控和密碼系統(tǒng),人機(jī)融合將向人機(jī)物交叉融合進(jìn)化發(fā)展,帶來信息技術(shù)領(lǐng)域的深刻變革。
表5 人機(jī)交互主要共性技術(shù)
資料來源:中國電子學(xué)會(huì)整理
(三)國內(nèi)外技術(shù)對(duì)比分析
1、發(fā)達(dá)國家基礎(chǔ)平臺(tái)布局完善,國內(nèi)仍缺乏自主核心技術(shù)
國外企業(yè)技術(shù)領(lǐng)先且大量布局公有云業(yè)務(wù)領(lǐng)域,大數(shù)據(jù)業(yè)務(wù)經(jīng)驗(yàn)成熟、分工明確且數(shù)據(jù)開放程度較高。云計(jì)算方面,國外云計(jì)算企業(yè)基礎(chǔ)技術(shù)相對(duì)領(lǐng)先,服務(wù)器虛擬化、網(wǎng)絡(luò)技術(shù)(SDN)、存儲(chǔ)技術(shù)、分布式計(jì)算、OS、開發(fā)語言和平臺(tái)等核心技術(shù)基本上都掌握在少數(shù)國外公司手中,憑借著強(qiáng)大的創(chuàng)新和資本轉(zhuǎn)化能力,有能力支持技術(shù)不斷推陳出新。同時(shí),國外企業(yè)在細(xì)分領(lǐng)域都有所布局,形成了完善的產(chǎn)業(yè)鏈配合,提供各種解決方案的集成,可以滿足多場景使用要求。大數(shù)據(jù)方面,國外公司在大數(shù)據(jù)技術(shù)各個(gè)領(lǐng)域方面分工明確,有的專注于數(shù)據(jù)挖掘,有的專注于數(shù)據(jù)清洗,也有的專注于數(shù)據(jù)存儲(chǔ)與管理。同時(shí),國外從事大數(shù)據(jù)技術(shù)研發(fā)的企業(yè)有很大一部分是由傳統(tǒng)的數(shù)據(jù)公司轉(zhuǎn)型而來,如IBM、甲骨文(Oracle)、易安信(EMC,2015年10月被戴爾公司收購)等,這類公司在大數(shù)據(jù)概念興起之前就早已充分接觸數(shù)據(jù)領(lǐng)域業(yè)務(wù),在數(shù)據(jù)科學(xué)領(lǐng)域有較強(qiáng)的研發(fā)能力。國外數(shù)據(jù)保護(hù)制度相對(duì)完善,數(shù)據(jù)開放標(biāo)準(zhǔn)成熟,為大數(shù)據(jù)技術(shù)研發(fā)提供了良好的外部環(huán)境。
國內(nèi)企業(yè)自主核心技術(shù)有待提高,數(shù)據(jù)開放程度偏低且缺乏必要的保護(hù)。云計(jì)算方面,國內(nèi)雖然有阿里、華為、新華三、易華錄等一批科技公司大力投入研發(fā)資源,但核心技術(shù)積累依然不足,難以主導(dǎo)產(chǎn)業(yè)鏈發(fā)展。大數(shù)據(jù)方面,國內(nèi)企業(yè)仍處于“跟風(fēng)”國外企業(yè)的發(fā)展階段,在數(shù)據(jù)服務(wù)內(nèi)核等方面缺乏積淀與經(jīng)驗(yàn),未能完全實(shí)現(xiàn)從IT領(lǐng)域向DT(數(shù)據(jù)技術(shù))領(lǐng)域的轉(zhuǎn)型。同時(shí),國內(nèi)數(shù)據(jù)應(yīng)用環(huán)境相對(duì)封閉,政府公共數(shù)據(jù)開放程度較低,數(shù)據(jù)安全保護(hù)等級(jí)有待提高,數(shù)據(jù)安全風(fēng)險(xiǎn)評(píng)估制度與保障體系有待完善,對(duì)大數(shù)據(jù)技術(shù)的升級(jí)發(fā)展形成了一定的限制因素。
2、發(fā)達(dá)國家在機(jī)器學(xué)習(xí)和人機(jī)交互領(lǐng)域具備先發(fā)優(yōu)勢,國內(nèi)企業(yè)存在技術(shù)差距與人才短板
國外機(jī)構(gòu)發(fā)力機(jī)器學(xué)習(xí)主流開源框架,積極開發(fā)人機(jī)交互下一代新型技術(shù)。機(jī)器學(xué)習(xí)方面,目前較為流行的開源框架基本都為國外公司或機(jī)構(gòu)所開發(fā),例如TensorFlow、Torchnet、Caffe、DMTK、SystemML等,同時(shí)注重大數(shù)據(jù)、云計(jì)算等基礎(chǔ)支撐信息技術(shù)對(duì)機(jī)器學(xué)習(xí)研究的促進(jìn)作用,以及機(jī)器學(xué)習(xí)的應(yīng)用實(shí)踐,已進(jìn)入研發(fā)穩(wěn)定階段。人機(jī)交互方面,國外技術(shù)企業(yè)基于觸控技術(shù)、可穿戴設(shè)備、物聯(lián)網(wǎng)和車聯(lián)網(wǎng)的發(fā)展基礎(chǔ),正在積極開發(fā)性價(jià)比更高的下一代人機(jī)交互新型技術(shù),以對(duì)現(xiàn)有產(chǎn)品進(jìn)行升級(jí)并降低成本。
國內(nèi)機(jī)器學(xué)習(xí)基礎(chǔ)理論體系尚不成熟,缺乏人機(jī)交互專業(yè)領(lǐng)域人才培養(yǎng)環(huán)境。機(jī)器學(xué)習(xí)方面,盡管國內(nèi)學(xué)者在數(shù)據(jù)挖掘?qū)用嫒〉昧艘欢ǖ难芯砍煽?,但?duì)于機(jī)器學(xué)習(xí)的底層技術(shù)、實(shí)現(xiàn)原理及應(yīng)用方法缺乏足夠的重視,導(dǎo)致關(guān)鍵技術(shù)環(huán)節(jié)缺失與重要領(lǐng)域邊緣化,不利于在國際主流機(jī)器學(xué)習(xí)技術(shù)角逐中展開有效競爭。人機(jī)交互方面,研究者需要具備數(shù)學(xué)、計(jì)算機(jī)學(xué)和心理學(xué)等相關(guān)背景,復(fù)合型較強(qiáng),相比于國外高校都設(shè)立單獨(dú)的人機(jī)交互專業(yè),國內(nèi)高校開設(shè)的專業(yè)相對(duì)傳統(tǒng),缺乏交叉復(fù)合型人才的培養(yǎng)機(jī)制,亟需建立人機(jī)交互領(lǐng)域技術(shù)人才培養(yǎng)的良好環(huán)境。
3、國內(nèi)外模式識(shí)別研究水平基本處于同一起跑線,重點(diǎn)聚焦于語音識(shí)別與圖像識(shí)別
國內(nèi)外研究領(lǐng)域基本一致,圍繞前沿技術(shù)領(lǐng)域開展持續(xù)創(chuàng)新。目前,國內(nèi)外企業(yè)均在圍繞模式識(shí)別領(lǐng)域的基礎(chǔ)理論、圖像處理、計(jì)算機(jī)視覺以及語音信息處理展開集中研究,探索模式識(shí)別機(jī)理以及有效計(jì)算方法,為解決應(yīng)用實(shí)踐問題提供關(guān)鍵技術(shù)。國外科技公司在模式識(shí)別各領(lǐng)域擁有多年的技術(shù)積累,深入語音合成、生物認(rèn)證分析、計(jì)算機(jī)視覺等前沿技術(shù)領(lǐng)域,具備原創(chuàng)性技術(shù)突破能力;國內(nèi)企業(yè)在模式識(shí)別前沿技術(shù)研發(fā)方面與國外同行處于并跑狀態(tài),除百度、訊飛等行業(yè)龍頭外,眾多初創(chuàng)公司也加入了模式識(shí)別研究的技術(shù)與應(yīng)用創(chuàng)新,催生了一批有創(chuàng)意的新型產(chǎn)品。
語音識(shí)別和圖像識(shí)別準(zhǔn)確率明顯提升,國內(nèi)企業(yè)中文語音識(shí)別技術(shù)相對(duì)領(lǐng)先。國內(nèi)外企業(yè)均致力于提高語音識(shí)別和圖像識(shí)別準(zhǔn)確率,谷歌和微軟分別表示旗下的語音識(shí)別產(chǎn)品技術(shù)出錯(cuò)率已降至8%和6.3%,微軟研究院開發(fā)的圖像識(shí)別系統(tǒng)在世界著名的圖片識(shí)別競賽ImageNet中獲得多個(gè)類別評(píng)比的第一名,為下一步的商業(yè)化應(yīng)用奠定了良好基礎(chǔ)。同時(shí),國內(nèi)企業(yè)重點(diǎn)突破中文語音識(shí)別技術(shù),搜狗、百度和科大訊飛三家公司各自宣布旗下的中文語音產(chǎn)品識(shí)別準(zhǔn)確率達(dá)到了97%,處于業(yè)內(nèi)領(lǐng)先水平。
(審核編輯: 智匯張瑜)
分享