沿著玉帶路向前,滿地的銀杏樹葉,紅的黃的鋪滿了這條狹窄冷清的道路。道路左手旁是京密引水渠,與之僅一座矮墻之隔的,就是頤和園。古老的樹木探出身,迎著北京初冬的風肆意而舞。云彩就這樣悠閑地晃蕩在淡藍色的調(diào)染盤上,在陽光照射下,若隱若現(xiàn)的分了層,白色的如玉,灰暗的如影,交錯著呈現(xiàn)出古老廟宇殿堂的莊嚴和肅靜。格靈深瞳就在路盡頭的一側(cè),門口端坐著兩只石獅,院子里某處隱藏著人眼攝像機。敞亮的屋內(nèi),橫排擺放著的不是香爐書畫,而是最先進的電腦,桌前則坐著最優(yōu)秀的科技人才。
古老與現(xiàn)代,傳統(tǒng)與科技就這樣交融著,時空穿越般地打亂了時間和空間的界限。大千世界溶于這一方院落,場景魔幻又現(xiàn)實,如夢又寫真。
人工智能成掘金場大市場點燃中國創(chuàng)業(yè)熱土
Gartner公司公布了2017年具備戰(zhàn)略意義的重大科技發(fā)展趨勢,這十大技術(shù)趨勢可總結(jié)概括為:以智能為中心,通過數(shù)字化實現(xiàn)萬物互聯(lián)。Gartner預計,這些趨勢在未來五年內(nèi)會迅速增長、高度波動,預計達到臨界點。在十大趨勢排名前三的分別為人工智能和高級機器學習、智能App以及智能事物。人工智能和高級機器學習由許多科技和技術(shù)(例如,深度學習、神經(jīng)網(wǎng)絡、自然語言處理)組成。更先進的技術(shù)超越了傳統(tǒng)的基于規(guī)則的算法,以創(chuàng)建理解、學習、預測、適應和潛在地自主操作的系統(tǒng),使機器真正具備類人的“大腦”。未來,智能將無處不在。
在回到中國前,畢業(yè)于布朗大學的趙勇就職谷歌公司,讓世界科技領域聞之興奮的谷歌眼鏡就出自他所在的團隊之手。職位是令人艷羨的、生活是富足的、接觸到的是來自世界頂級的最前沿信息、任職的都是谷歌的大腦部門。但這一切都沒能阻擋他踏上回國創(chuàng)業(yè)之路。
上海復旦大學研究生畢業(yè)后的趙勇選擇遠去美國繼續(xù)深造。此去經(jīng)年,在美國讀書工作已十年有余,他親眼驗證了中國國際地位的變遷?!拔?003年到美國,那個時候美國媒體對中國的報道是非常少的,即便偶爾出現(xiàn)在報端也是負面新聞。但是到了2010年,突然間發(fā)現(xiàn)全世界大多有趣的事都是發(fā)生在中國。” 2010年,《TIMES》雜志對過去十年間發(fā)生的國際大事進行了回顧,所關(guān)注的只有一個主題:CHINA。這篇文章由三次榮獲普利策獎的Thomas L.Friedman撰寫,從中國社會、文化、政治、經(jīng)濟、科技等領域事無巨細的報道和描寫了中國在十年間的變化和進步,這一切讓趙勇萌生了回國的念頭。
“美國有亞馬遜、谷歌、Facebook,中國有BAT,但整個歐洲卻沒有一個能讓人印象深刻的互聯(lián)網(wǎng)公司。goole.com在美國市場占有率是60 %,但是在歐洲則高達95%。不是歐洲人不懂技術(shù),而是他們沒有統(tǒng)一文化的區(qū)域,因為他們的語言都是分裂的,沒有足夠大的市場。在中國,餓了吧這樣的公司可以在一兩年內(nèi)變得很強大是與大市場有著密切關(guān)系的?!?/span>
在谷歌任職時,趙勇每年都會抽出2個月時間回到中國進行調(diào)研。在他看來,美國生活的十幾年,讓他錯過了中國發(fā)展最快的時間,這是一筆很大的損失。2012年底,趙勇在硅谷認識了徐小平,一次深談后,趙勇決定回國:“恨不得馬上就辭職?!被貒?,他為自己選定的方向是計算機視覺。
“計算機視覺+深度學習” 助力智能未來提前到場
根據(jù)艾瑞咨詢預計,2020年全球人工智能市場規(guī)模將達到1190億元,年復合增速約19.7%;同期中國人工智能市場規(guī)模將達91億元,年復合增速超50%。時間倒退回2013年,趙勇剛剛回國并打算在計算機視覺領域大展宏圖時,卻遭受了現(xiàn)實的打擊。顯然這一年,中國創(chuàng)業(yè)的標簽是可穿戴設備和O2O。對于他而言的偉大事業(yè)還鮮有人了解。
“很多人問我為什么不依靠谷歌眼鏡的技術(shù)做一個趙勇眼鏡或者格靈眼鏡,但對我來說這是違背職業(yè)道德的。更何況在我看來,計算機視覺有更加美好的未來?!?/span>
不斷接觸投資人,不斷受挫,“有投資人告訴我,中國不適合技術(shù)創(chuàng)新,創(chuàng)新的成本太高了?!痹趫猿至艘荒旰螅雀枰约s6億美元的價格收購了英國初創(chuàng)公司DeepMind Technologies。自此,創(chuàng)投圈開始刮起了人工智能之風,投資商們迅速轉(zhuǎn)變了想法。但快速局部的火熱后接踵而來的是過度炒作,趙勇將其形容為“泡沫”。9月后,經(jīng)歷股災的投資市場變冷,人工智能落地等一系列問題也再一次提升了融資的難度。幸運的是,重壓之下產(chǎn)生了巨大動力,“我們開始思考賺錢的問題。這個壓力使得我們6個月內(nèi)解決了很多問題,產(chǎn)品也快速落地。同時也對格靈深瞳未來的發(fā)展方向和路徑做出了更加清晰的判斷和規(guī)劃?!?/span>
面對數(shù)據(jù)的大爆炸以及對未來的憧憬,人們開始探索更廣闊的世界。技術(shù)的衍變將人們推向了視覺搜索的時代。在這個空間中,一切的圖像,不管是平面的還是立體的,都可以被標注、被搜索??苹秒娪爸兴尸F(xiàn)的令人眼花繚亂的技術(shù),已經(jīng)不僅是夢想。在這個巨大的寶藏掩蓋下,下一個獨角獸或許正在蠢蠢而動,伺機爆發(fā),誰能最先定義智能未來,誰就掌握著先機。
成立之初,格靈深瞳利用三維計算機視覺增加了物體的深度信息,更完整真實地還原了物體信息,解決了相互遮擋、比例混淆、影隨人動等問題,提高了智能檢測和分析的準確度。并借由深度學習幫助計算機像人一樣在真實世界中吸收、學習和理解復雜的信息,完成高難度的識別任務。
成立三年,格靈深瞳已經(jīng)借助自主研發(fā)的深瞳技術(shù)在人和車的檢測、跟蹤與識別方面居于世界領先水平。三年中,趙勇帶領團隊成員先后研發(fā)了皓目行為分析儀、威目車輛大數(shù)據(jù)系統(tǒng)、威目視頻結(jié)構(gòu)化系統(tǒng)、威目人臉識別系統(tǒng)、威目視圖大數(shù)據(jù)平臺、深瞳人眼攝像機。“最困難的時期就是現(xiàn)在,因為我們開始需要為自己負責了。剛開始是理想驅(qū)動,沒有現(xiàn)實的壓力,甚至不需要考慮競爭對手,因為我們僅僅是北京20萬創(chuàng)業(yè)企業(yè)中的一個?,F(xiàn)在隨著我們逐漸擴大的規(guī)模,開始需要制定長遠的戰(zhàn)略,需要不斷分析我們的機會在哪,我們的競爭對手是誰?!?/span>
現(xiàn)在,格靈深瞳擁有的不僅是技術(shù),更是落地后的產(chǎn)品?!皩⒃技夹g(shù)變成產(chǎn)品的這個過程很難,但是現(xiàn)在我們已經(jīng)做到了。用戶在我們這里得到的不僅僅是產(chǎn)品和清晰的商業(yè)應用解決方案,更是背后的大數(shù)據(jù)平臺?!?br style="padding: 0px; margin: 0px;"/>
深瞳技術(shù)筑競爭壁壘“天眼”讓世界無處遁形
在電影《速度與激情7》中,女駭客Ramsey利用“天眼”系統(tǒng)對敵人進行實時追蹤,互聯(lián)網(wǎng)天眼主要是依靠世界上互聯(lián)的監(jiān)控攝像頭。電影中的敵對組織頭目利用人臉識別來確認一行人的行蹤,這項讓人印象深刻的技術(shù)是“人臉識別”。實際上,人臉識別這項戴著高科技光環(huán)的技術(shù)已經(jīng)被實現(xiàn)。
深瞳人眼攝像機是格靈深瞳的拳頭產(chǎn)品,也是世界上首款基于人眼工作原理的攝像機。趙勇介紹,深瞳人眼攝像機采用獨創(chuàng)的像素動態(tài)瞬時分配技術(shù),瞬間將局部畫面的有效像素提升百倍以上,整體畫面達到數(shù)億級等效像素,可實現(xiàn)對多類型目標的檢測與抓拍,兼具超高抓拍準確率與超低漏檢率,使得遠距離、大廣角等泛場景下的人臉和車輛識別變?yōu)楝F(xiàn)實。
在格靈深瞳辦公區(qū)的院落中安裝了數(shù)臺深瞳人眼攝像機,到訪者從剛踏入的一瞬間就被攝像機所記錄下來?!霸?000萬的人臉數(shù)據(jù)庫中找到這個到訪者并完成識別,整個過程只需要幾秒鐘?!壁w勇介紹,深瞳人眼攝像機具備人眼般的精密結(jié)構(gòu),可以捕捉遠距離高清特寫,并且具有超大廣角視野。人腦般的深度智慧則可以讓相機識別得更精準,捕捉速度更快,類型更加多樣,保證了超高抓拍準確率。并能夠?qū)θ撕蛙囘M行全場景急速抓拍,無論人、車處于站、坐、蹲、步行、跑動、騎行等各種姿態(tài)都能精準捕捉?!肮部蛻羰俏覀兎盏囊粋€領域,這要求我們能夠在最短的時間內(nèi)識別出犯罪嫌疑人。”趙勇舉了一個例子:“例如在競標時,某個省的公安人員會將全省3000萬居民的身份證照片放到我們的服務器上。我們將這些人臉入庫,把每個人的臉變成一個特征,一個人需要花費100-200毫秒,相當于一秒鐘可以做5-10個人。幾天就將這些人全部入庫。在競標時,警方給出幾張測試照片,誰能在最短的時間內(nèi)識別出照片中的人是誰,誰就將贏得競標?!爆F(xiàn)在這項技術(shù)掌握在極少的幾家企業(yè)中,這也標志著格靈深瞳已進入行業(yè)的最高水準。
行業(yè)雖然仍處于上升階段,但已有海康這樣的大廠占據(jù)了更多的機會。師夷長技以制夷,只有不斷進步才能突出重圍在行業(yè)內(nèi)站穩(wěn)腳跟?,F(xiàn)在,深瞳人眼攝像機最遠可拍攝到50米外的圖像,超過競爭對手10倍之多,2億有效高清像素也處于行業(yè)絕對領先位置。
“已知犯罪嫌疑人將出現(xiàn)在天通苑這樣人流密集的地方,哪怕再有經(jīng)驗的警察也無法準確識別。但在技術(shù)和大數(shù)據(jù)的幫助下,我們可以快速縮小目標的范圍并將他鎖定?!?/span>
對于格靈深瞳另一款產(chǎn)品威目車輛特征識別系統(tǒng),趙勇也顯得十分驕傲。目前,威目車輛特征識別系統(tǒng)可以在復雜場景中同時檢測多個目標,并精確區(qū)分機動車、二輪車、三輪車和行人,且能夠可識別19種細分車型、4000多種車款、12種車身顏色,白天識別率大于95%,夜間識別率大于90%。最令人驚奇的是,這款系統(tǒng)不依賴車牌信息就可以識別部分被遮擋或位于畫面邊緣的車輛,這一功能也將幫助其在安防領域大顯身手。
“如果犯罪分子偽造車牌,我們還是可以依靠威目系統(tǒng)通過擋風玻璃上的裝飾品等信息綜合之下識別車輛?!边@并不是趙勇想象中的場景,它已經(jīng)實際應用在天津市的重要交通卡口。每天有3000余萬車輛不斷通過,系統(tǒng)通過大數(shù)據(jù)識別車輛身份、軌跡和行為,并利用模糊識別將不確定的信息變成具體目標,“如果發(fā)現(xiàn)逃逸車輛,我們可以通過事發(fā)時間和地點以及當事人提供的殘缺信息快速縮小目標車輛范圍,最終找到他的位置?!?/span>
從備受冷遇的投資荒到逐漸走熱的行業(yè)趨勢,人工智能將賦予未來更多的想象力?!疤煅邸钡臒o所不能在未來某一天或?qū)⒉辉偈羌∑媸?,技術(shù)的強大震撼力將在安防、醫(yī)療、出行等領域創(chuàng)造出更加安全、便捷的生活方式。以技術(shù)創(chuàng)新為驅(qū)動力的格靈深瞳現(xiàn)在正處于發(fā)展的關(guān)鍵節(jié)點,在不斷強大的路上,還將遭遇更多坎坷。這些棘手的難題或?qū)碓从谑袌龅恼嘉?,或有關(guān)技術(shù)的革新。但無論如何,在智能世界到來之前,他已經(jīng)走出了第一步。
(審核編輯: 智匯小蟹)
分享