從 2015 年最先,在 AI 領(lǐng)域創(chuàng)業(yè)的公司如雨后春筍一樣平常林立而起。若是細分的話,可以分為機械學(xué)習(xí)ML,圖像視覺CV,和自然語言處置NLP。固然,理論上來說,CV 和 NLP 也是屬于 ML 局限的。
市面上,這幾個領(lǐng)域的創(chuàng)業(yè)公司都有不少,相對而言,CV 領(lǐng)域的公司數(shù)目和規(guī)模是較大的。我從事 NLP 行業(yè),在相關(guān)的創(chuàng)業(yè)公司待過一段時間,所以對該領(lǐng)域的公司較為關(guān)注。今天,可以來簡樸聊聊 CV 和 NLP 領(lǐng)域創(chuàng)業(yè)公司的情形,重點是要回答一個問題:同樣是 AI 創(chuàng)業(yè),為什么 NLP 領(lǐng)域顯著弱于 CV 領(lǐng)域。
我們先來看看 CV 領(lǐng)域的創(chuàng)業(yè)公司門。在該領(lǐng)域,頭部的創(chuàng)業(yè)公司有個響亮的名號,叫做 CV 四小龍,分別為:商湯、曠視、依圖、云從,他們的融資金額都異常高。以商湯為例,成立了近六年,融資總額到達 30 億美元,它的估值超過了 75 億美元。
日期 | 買賣金額 | 融資輪次 |
2018-09-10 | 10億美元 | D輪 |
2018-05-31 | 6.2億美元 | C+輪 |
2018-04-09 | 6億美元 | C輪 |
2017-12-26 | 未披露 | 戰(zhàn)略融資 |
2017-11-28 | 15億人民幣 | 戰(zhàn)略融資 |
2017-11-15
| 未披露 | 戰(zhàn)略融資 |
2017-07-11 | 2.9億美元 | B+輪 |
2016-12-14 | 1.2億美元 | B輪 |
2016-04-26 | 萬萬美元 | A輪 |
2014-11-07 | 數(shù)萬萬美元 | 天使輪 |
這幾家公司的特點是,在后面幾輪融資,動輒數(shù)億甚至十億美元的巨額融資,在資金逐漸收縮的投資市場,簡直讓許多創(chuàng)業(yè)公司眼紅。
相比之下,NLP 領(lǐng)域的創(chuàng)業(yè)公司的發(fā)展速度和融資規(guī)模,略顯遜色?,F(xiàn)在,與 NLP 有關(guān)的創(chuàng)業(yè)公司,發(fā)展勢頭不錯的有:出門問問,追一科技,竹間智能等。列出這些公司的名字,許多讀者可能感受較為生疏,沒有聽過或者不怎么領(lǐng)會。簡直,就名氣上而言,也比 CV 四小龍弱了不少。其中,出門問問在2017 年的 D 輪融資中顯示優(yōu)異,獲得了 1.8 億美元融資,但之后再也沒有新的融資新聞傳出。其他的公司數(shù)萬萬美元融資的情形較多,從融資規(guī)模上來看,和 CV 界相差甚多。
對了,這里多說一句,科大訊飛是一家很成熟的 NLP 公司,已經(jīng)不算這幾年新興的 AI 創(chuàng)業(yè)公司了。
透過征象看本質(zhì),同樣是機械學(xué)習(xí)領(lǐng)域,同樣是頂著人工智能的創(chuàng)業(yè)光環(huán),為什么現(xiàn)狀差了這么多,豈非是優(yōu)秀人才都跑到 CV 領(lǐng)域去了嗎?固然不是,接下來,我想從手藝方面和市場方面,來剖析一下背后的緣故原由。
首先,從手藝角度出發(fā),自然語言處置的手藝難度很大,只管應(yīng)用場景許多,但做好任何一項都不容易。自然語言處置的義務(wù),基本都脫離不了語義明白,任何事情,涉及到「明白」二字,就變得艱難許多。
圖像處置的義務(wù)通常屬于感知智能,所看即所得。例如識別出物體是一只貓,照樣一輛車。但對語言來說,大部分問題是認知智能,需要思量更多明白認知的因素。
由于視覺是人一出生就能夠獲取的,但語言是需要通過不停學(xué)習(xí)才氣獲得的,它是成千上萬年以來,經(jīng)由不停總結(jié)提煉后的高度抽象化的符號聚集,組合起來可以千變?nèi)f化。一段簡樸的文字,其寄義很容易能超過數(shù)張圖片所能承載的信息。舉些簡樸的例子,我們現(xiàn)在還很難通過影片展示出《三體》中遠大的宇宙場景;寥寥幾句唐詩,所涵蓋的意境,可以雄偉至極。
現(xiàn)在許多論文中的研究成果,從實驗室走向現(xiàn)實應(yīng)用,最大的阻礙是魯棒性。在寬松的實驗條件下,獲得的亮眼分數(shù),往往在現(xiàn)實應(yīng)用場景中一觸即潰。其中,現(xiàn)在較為成熟的是文本翻譯,但想必我們還不敢信托模子直接翻譯的效果。
剖析完了手藝角度,既然是創(chuàng)業(yè),我們再來看看商業(yè)中最終要的市場因素,在一樣平常生涯中,CV 最直接的應(yīng)用是人臉識別,它已經(jīng)融入了許多場景,小到手機的刷臉解鎖,大到火車站的視頻監(jiān)控,罪犯查找。這內(nèi)里是有著許多較為成熟的商機的。CV 四小龍就和許多手機廠商互助,讓刷臉解鎖、支付更為便捷,同時也可以和許多官方部門舉行安防方面的互助。簡而言之,有了較為成熟的市場需求。
若是提到 NLP 呢,生涯中的應(yīng)用我們對照容易聯(lián)想到手機或者音箱上林林總總的智能語音助手。但我信賴,人人一定很少去打開它們,由于無一例外,它們都太不智能了,與之對話會異常無聊。
我是無名漁夫(微信/QQ:181628402)軒鼎創(chuàng)業(yè)旗下講師,官方網(wǎng)站:http://procarseats.com/,感謝您一直以來對軒鼎創(chuàng)業(yè)的大力支持!更多干貨可訪問創(chuàng)業(yè)課堂https://www.chuangyeketang.com