搜狗王小川:“問答”才是蒐索的未來

在近日舉行的搜狗2016年聯盟峰會上,搜狗公司CEO王小川作了以《搜狗的人工智能之路》的主題演講,也借“人工智慧”這一話題談了談搜狗公司下一階段發展戰略。之於搜狗要做人工智慧這條路,在王小川看來,搜尋引擎天然地與人工智慧覈心相關,蒐索是未來人類智慧時代的明珠。王小川表示,語音蒐索和影像蒐索都不是蒐索的未來,“問答”才是。

毋庸置疑,在今年,“人工智慧”這個話題已經成為了國內各大互聯網公司們迫不及待想要搶佔的公眾輿論的領地,我們暫且不論各家所掌握的科技究竟如何,以及人工智慧未來的發展方向到底是什麼。

在近日舉行的搜狗2016年聯盟峰會上,搜狗公司CEO王小川作了以《搜狗的人工智能之路》的主題演講,也借“人工智慧”這一話題談了談搜狗公司下一階段發展戰略。演講中,王小川認為,人類對於人工智慧的終極描繪,始終是同人類一樣進行自然語言交流,這也是搜狗人工智慧的發展目標。

王小川預測,人工智慧存在著虛擬世界和機器智慧兩個體系,其覈心在於“機器參與到人的決策之中”。因為人工智慧滿足了人類社會更大的需求,一是讓人類找到了自己的存在感,二是降低了人的判斷,把決策交給了機器。

之於搜狗要做人工智慧這條路,在王小川看來,搜尋引擎天然地與人工智慧覈心相關,蒐索是未來人類智慧時代的明珠。

“因為人工智慧是建立在大數據、云計算和機器學習的基礎之上,搜尋引擎天生就是這三個領域裡面最覈心的科技載體。”

王小川表示,語音蒐索和影像蒐索都不是蒐索的未來,“問答”才是。在人工智慧時代,搜尋引擎有能力從關鍵字提問變成十條結果,給使用者一個精准的答案。

“我們不是在強調語音還是影像,而是讓機器最開始理解你想表達什麼,而轉換成更豐富的表達方法。”

囙此,王小川在演講中透露,搜狗的下一個很大的目標是把搜尋引擎從今天的關鍵字系統變成問答系統,並且系統已經逐步上線這樣的能力,目前有5%-10%的問題可以給出直接答案。

作為現時搜狗最覈心的武器之一,輸入法接下來又會有怎樣的變化呢?王小川說,今年最火的輸入法功能介紹裏,語音辨識和圖像識別變成了很重要的部分。在擁有巨大的用戶數據量的同時,語音輸入可以做到更極致的狀況,包括語音合成、聲紋識別、打斷處理等等。

“在談人工智慧、談對話系統的時候,輸入法是通向通用對話系統最佳的路徑。”王小川始終相信,搜狗通過輸入法這樣的用戶場景幫助收集數據,能搶佔人工智慧領域最終極的制高點。

以下是王小川的演講實錄:

在今天的分享當中,我可以不用去將一些搜狗的現有業務,而是跟大家來談,往下幾個新的理念,囙此我會講得更遠一些,談談搜狗的人工智慧之路,大家在這裡面可以感受到一些我們的戰畧。

在阿爾法狗打敗李世石的第三場後第一個工作日,當天搜狗放假,慶祝這樣一個勝利,把它叫做“狗勝節”,阿爾法狗的勝利。在這裡,我們看到了一個新時代的到來,就是人工智慧。所以我本人在大學的時候,從大一開始就在學習人工智慧,那麼為什麼到了2016年還有這樣一個變化呢?其實不只是科技本身的一個突破,而是在市場上、在媒體上有了一個巨大的變化。

囙此我們可以看到,人工智慧在今年之前有兩波熱潮。但是我們看到,在以前,做人工智慧只存在於高校,現在參與人工智慧的企業是以前的數倍,今年開始人工智慧開始真正走向了實用。

人工智慧兩個體系:虛擬世界和機器智慧

在我的預測裡面,人工智慧往下走主要是兩個體系,一個是虛擬世界,另一個是機器智慧。前者怎麼理解呢?不是講的簡單的頭盔顯示,我想講的是搜狗並不擅長的一個領域,像遊戲、小說、音樂、視頻,這些領域的科技發展,把我們帶向了虛擬世界,那是文化創意產業。

這是滿足人類社會更大的需求,一是讓人類找到自己的存在感,二是降低人的判斷,把決策交給機器。囙此我們知道,人工智慧的意義,不僅是在識別、生成,而覈心是在機器參與到人的決策之中。

今年年初的時候有些媒體朋友問我,搜狗是要轉型做人工智慧了嗎?用的是轉型這個詞。我說不對,你對人工智慧不瞭解,因為人工智慧是建立在大數據、云計算和機器學習的基礎之上。搜尋引擎天生就是在這三個領域裡面最覈心的科技載體。從我們的科技從我們的業務向人工智慧邁進,所以我說蒐索的未來是人類智慧時代的明珠。這是我對未來的預言。大家就會問未來是什麼?蒐索的未來是什麼?人工智慧的未來是什麼?為什麼是明珠呢?

我們人在理解智慧的時候,從科幻的角度或者從科學家角度來講是什麼是什麼?60年代,圖靈研發的人工智慧,就是一臺能對話的機器。以至於你不知道對面是人還是機器。大量的文學作品或者科幻電影裏也提到了一臺能够對話的機器,能回答問題,像大白或者星級穿越裏的機器人。

阿西莫夫寫的《最後的問題》這本小說裏,構建了一臺終極機器。他說人控制地球,甚至銀河系裏的全部資源,來打造一臺能回答問題的機器。這本小說很短,故事裡面這臺機器幾乎能回答人類所有問題,只有一個問題不能回答,宇宙是怎麼誕生的?這部小說最後,這個機器想明白了,叫做“要有光”,於是這個機器重新創建了宇宙。這是一個科幻片。所以我們終極對人工智慧的理解力,大多人會認為這是一臺能够去思考、能够去對話的機器。這裡對人工智慧未來終極的理解。

蒐索的未來是什麼樣的?

蒐索未來會怎麼樣?未來是語音蒐索嗎?以後大家說“王小川”去蒐索,不要這樣,應該用語音去講。其實我覺得語音蒐索能够帶來的附加增值並不大,也許從口音裏能聽出來我說話的聲音是有四川口音,是不是給我點四川的內容?這個意義很小的。是影像嗎?這兩年影像發展也非常快,或者是個性化,或者是推薦系統。其實在我心中這些地方都不是蒐索終極要解决的問題。

那會是什麼?我的回答是“問答”。我們可以理解今天的搜尋引擎是我們輸入一個關鍵字,然後給你十條答案或者十個結果,讓用戶自己在裡面做選擇。但是這是我想的最終效果嗎?用關鍵字去獲得答案。並不是。我們對答案是不滿意的,我們需要的是一個精確的答案。即便通過個性化,我們並不可能就知道這個答案是否對你更好。

比如洪濤和我已經一起工作了十多年。我跟他說兩個字“搜狗”,洪濤一定不知道我要什麼。我即便說“搜狗收入”,也不知道我在說什麼。所以個性化附加的價值是並不大的。我們能够解决問題的唯一方法是用自然語言去提問。比如說我問洪濤,我們三季度的收入怎樣?這個時候他就能給我一個我想要的答案。因為一個關鍵字裡面並不包含有完整的資訊。事實上在我們的搜尋引擎裏,今天的關鍵字輸入占97%。

我從99年開始接觸搜尋引擎,那時候人更習慣於整句子蒐索,我漂亮嗎?這是蒐索的第一個請求,機器回答不了這個問題。事實上當今天為什麼大家不這麼用了?是機器不够智慧,解决不了這麼多的問題,所以變成了一個關鍵字給你十條答案。未來的趨勢真的會變成給問題給一條答案。Google也是這麼做的。

在未來的蒐索70%的用戶請求是應該給答案的,這跟我們去理解用戶的需求是高度一致的。人工智慧時代的到來會使得搜尋引擎有能力從關鍵字提問變成十條結果,改變成一個問題,給你一個精准的答案。這樣讓人的表達變得更加自然,也給更精確的意義。

約伯斯最大的貢獻是讓人用最自然的方法交流。以前用鍵盤、後來用滑鼠,後來發明了智能手機,我們知道五個手指去進行互動,觸屏顛覆了手機行業。在蒐索領域或者人機交互領域更多不是講語音辨識,而是語言理解帶來了問答。在國外的各個企業也在做這個事情,蘋果、Facebook、穀歌、亞馬遜都在做,但是第一家推出問答系統的是蘋果。

為什麼不是穀歌?蘋果的效果並不是很好,用過蘋果手機的都應該有體驗。並不是蘋果科技不够,我更原因相信的是約伯斯在他臨終前,以早產的管道把這樣一個系統推向市場,Siri系統是iPhone4s裏發佈的,約伯斯在病床上看著這場發佈會後,第二天他就去世了。

我相信在這個戰場上穀歌會後來居上,不僅是科技積累穀歌更多,同時穀歌面臨的這個問題和蒐索是一脈相承的。搜狗往下一個很大目標把搜尋引擎從今天的關鍵字系統變成問答系統。我們系統已經逐步上線這樣的能力,大概有5%-10%的問題可以直接給答案,未來會有這樣一個變化。

我們一開始給搜狗的一個使命是讓表達和獲取資訊更簡單。獲取資訊就是能够給答案,表達也變得更簡單,用語音的管道或者文字的管道驅動一個問句,這是表達。

除了蒐索以外,搜狗還有一個覈心武器是輸入法。輸入法的表達裏是最重要的一個工具,它又有什麼樣的進化?

輸入法和人工智慧

輸入法究竟是不是一個高技術?蒐索的公司去做輸入法,很容易把一些領先科技放進去。搜狗輸入法誕生第一天就是一個大數據的產物,那是2006年。為什麼搜狗輸入法在當年變得這麼智慧?我們當時還沒有大數據這個詞,我們會說我們把整個互聯網網頁通過搜尋引擎抓下來然後放成輸入法的詞庫,計算每個詞的詞頻、計算語法規則。用今天的表達就是大數據。

輸入法也是云計算的產物,如果用搜狗輸入法會發現輸入的時候會在鍵盤上有一朵小雲飄起來,這時候結果非常准,原因是我們識別到本地的計算最終結果可能不够好,就會把這樣的輸入提交給服務器,雲端提供更强大的計算和存儲力來計算得到更高的品質。

輸入法同時也是人工智慧的產物,今年最火的輸入法功能介紹裏,語音變成很重要的一部分,隨著人工智慧深入學習的突破這個科技變得實用。還有一個功能,圖片識別功能,在圖片上掃描出文字進行輸入。

這些都是最終極嗎?我們從語音說起,今天搜狗輸入,一天能處理的數據量到1.9億次,比全中國其他家所有做語音辨識的公司,線上做的語音辨識的量加起來更大的值。我們一天的識別會產生數十萬小時的語音數據,這個數據超越了今天中國主流公司進行語音辨識所用的語料的規模,是在搜狗這樣的用戶上再加上數據積累上,我們有這樣的科技,把語音輸入做到更極致狀態,語音的合成、聲紋識別、打斷處理等等。

我們可能文宣工作做的還不够,但是輸入法裡面已經為用戶提供了很多方便的服務。我心中這不是輸入法的未來,只是現在。

搜狗人工智慧方向:自然互動和知識計算

未來是什麼?我播放一段視大家看一看。這是概念性的視頻,和今年下半年要推出的功能有相近之處。為了保密的原因,這裡展示的不是我們最終的功能,最終的功能要比這個更驚豔!

這個視頻給大家一個基礎概念,我們不是在強調語音還是影像,而是讓機器開始理解你想表達什麼,而轉換成更豐富的表達方法,可能是一個餐飲資訊、可能是一個地圖、可能是一個百科,可能是一首歌也可能是其他,今年下半年我們會推出的其他內容。除了分享外,還有智慧回復的功能。

通過這兩段視頻,我想表達的含義——我記得幾年前我們作了一個討論,科技的進步是讓人變得更加强大了?還是更加弱小了?我的回答很簡單,如果把自己和科技放在一塊兒,我們變得更加强大。今天的90後很厲害,他們才20多歲,就可以自己定機票到島上旅遊,因為有了互聯網給他們提供了科技能力。但離開了這些科技工具我們比古人弱很多。

我內心當中我相信通過科技來改造人類,把我們也許變得更加傻,但是和科技在一塊兒的時候我們變得更加强大。輸入法的未來不只是在表達裡面作為一個工具,而是跟你合體,它知道你想說什麼,它知道你在回答什麼。也許未來人們給你提問的時候,不用你動腦,而是機器代替你做這樣一個回復。這是輸入法未來需要解决的一個問題,通過智慧處理跟人有新的合體。

對於輸入法的理解,在談人工智慧、談對話系統的時候,輸入法是通向通用對話系統最佳的路徑。很多公司在研究對話系統,但是到今天沒有一個成熟的使用場景。搜狗不僅有這樣的科技積累,更重要的是我們有這麼大的一個用戶場景幫助我們收集數據、幫助我們在改進中間做反覆運算,這是在做人工智慧終極裡面佔據的一個制高點。

讓表達和獲取資訊變得更簡單,我們需要做到兩件事情。一件是自然互動,不僅是語音而是語義,是自然的溝通。另一件事情是知識計算,只有當機器更加智慧、更加懂語言的時候,我們的蒐索、我們的輸入、我們的人工智慧才能通向終極的高度。

這是今天和大家作的分享,謝謝!

本文標題: 搜狗王小川:“問答”才是蒐索的未來
永久網址: https://www.laoziliao.net/doc/1638176640433659
相关資料
紮克伯格是很牛但是創業千萬不能學他
MarkZuckerberg無疑是世界上最成功的企業家之一。然而,MIT馬丁信託創業中心的常務董事BillAulet卻幽默地表示,MarkZuckerberg的創業經歷對其他人而言並不是一個好榜樣。這當然只是Bill於10月26日在越南河內
標籤: 創業 bill 企業家
張小龍:大道至簡,堅持產品信仰,KPI自然水到渠成
張小龍的內部講話《警惕KPI和複雜流程》再次在業界引起轉發。張小龍講到了敏捷開發的重要性,講到了不要帶KPI初心去做產品設計。從產品思想上來看,它的覈心還是把用戶價值放到了壓倒一切的重要位置,甚至包括不可避免的商業化也是通過利於用戶價值角度
標籤: 張小龍 市場行銷 價值觀 qq郵箱
馬雲:生意做到一定程度,沒佛家思想不
新浪科技訊10月21日午間消息,昨日下午,阿裡巴巴集團董事局主席馬雲走進清華大學經管學院EMBA班,在談到對文化自信的理解時,他以切身做企業的感受說明文化自信是在理解、尊重、包容的基礎上,對中國傳統文化的持守與發揚。馬雲認為,儒家思想是中國
標籤: 馬雲
徐小平深度分析:我投資的七個項目因何失敗?
真格基金創始人、著名天使投資人徐小平從他多年的投資經歷中,給創業者分享了七個最後失敗的創業公司案例,針針見血,值得閱讀。公司A是我最早投資的三家公司之一。一流的美國商學院人才來到中國做的,有可能推翻新東方的一個好項目。依然是我投資的一家足以
標籤: 新東方 市場行銷 徐小平 創業 投資 創投