您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

和機器人交互,哪些是本質,哪些不是

2018-08-07 07:13 性質:轉載 作者:人人都是產(chǎn)品經(jīng)理 來源:人人都是產(chǎn)品經(jīng)理
免責聲明:中叉網(wǎng)(m.m21363.cn)尊重合法版權,反對侵權盜版。(凡是我網(wǎng)所轉載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權均系原作者和機構所有。文章內(nèi)容觀點,與本網(wǎng)無關。如有需要刪除,敬請來電商榷!)
自從人類發(fā)明了計算機,就持續(xù)面臨著一個根本性問題:我們到底應該如何與這類機器交互?拋開具體交互形式不論,顯然地,我們和機器的交...

  自從人類發(fā)明了計算機,就持續(xù)面臨著一個根本性問題:我們到底應該如何與這類機器交互?拋開具體交互形式不論,顯然地,我們和機器的交互方式上經(jīng)歷了一個從人適應機器,到機器適應人的過程。一旦趨勢切換為機器應該如何適應人,那看待語音交互等最終趨勢的的根本視角從來就不應該是機器能做什么,而是說人更渴望什么。

人機交互簡史

  自從計算機發(fā)明后,它所能接受的輸入本質上就沒發(fā)生任何變化,始終都是類似加減乘除移位這樣的指令。我們經(jīng)常說的紙帶其實并不是交互方式本身,而只是一種載體,紙帶上面就是具體需要計算機執(zhí)行的指令。在那個時代,人是要完全適應機器的,所以必須學會機器的語言,程序員則相當于掌握了機器語言的翻譯。

  同樣道理鍵盤也不是一種交互方式,而是一種輸入設備,真正的交互方式其實是命令,常見的比如mkdir這類命令其實可以看成是更多指令的集合,但抽象的級別更高了,可以完成建立目錄這類功能。這個時候,其實也還是人在適應機器,但開始去除人機交互過程中一些繁瑣重復的事情,讓人機交互變的更為便利。

  此后的圖形用戶界面是一個關鍵轉折,圖形用戶界面讓人機交互徹底的向人類一方遷移,屏蔽掉了幾乎所有和機器相關的細節(jié)。在Windows下唯一還保留了些機器特征的東西,只是開機、關機、拷貝、粘貼、查找、最大化、最小化、關閉等少數(shù)幾個命令,其它部分則和我們操作物理世界的東西很像,比如我們需要選擇一樣東西的時候,我們通常會把他們排成一排,而不管開始菜單還是任務欄都是這樣做的。同樣是圖形用戶界面,從使用鼠標到觸屏內(nèi)部還是有進展,導入觸屏之后機器的細節(jié)被進一步拋棄,最大化、最小化這些事進一步消失,而只剩下App的排列以及選擇,我們最常用的操作只是點擊和滑動。所以我們可以說從鼠標到手指其實是進一步向人這端遷移。

  這背后本質的推動力其實是計算能力的富余,但產(chǎn)品設計者們不再把這部分富余計算能力只是用來提高性能,而是用來適應人的操作習慣,所以圖形用戶界面可以看成是從人適應機器到機器人適應人的轉折點。這其實沒什么奇怪,畢竟人類是世界的中心,所以只要有可能那就必然走到機器適應人的方向上來。

  過去不管是用紙帶直接輸入指令還是用命令行乃至于使用圖形用戶界面,其內(nèi)部是逐步遞進的,雖然表面看差異很大,但基于的是同樣的命令體系,只是在便利性上有較大提升,并沒有導入很多的新東西。

  語音交互則與此不同,它一方面集成了老的命令系統(tǒng),比如你可以說調(diào)大音量、下一頁、設定十點的鬧鐘等。這時候它體現(xiàn)的只是人機交互方式進一步向人這端傾斜,提升便利性,這與圖形用戶界面帶來的變化是一致的。但另一方面它則為交互方式注入了智能屬性,這種智能屬性讓機器進行更多的決策,交互不再是精確的,比如放一首歌,這在過往的交互方式下是不能實現(xiàn)的。這是兩種完全不同的屬性,前者會讓存量市場進行升級,也就是說只要便利性有價值,那怕沒什么智能它也是可以落地的,后者則體現(xiàn)新的信息整合和輸出方式,會帶來極大的顛覆性。

交互方式背后隱含的顛覆性

  交互方式的改進如果只是帶來純粹便利性那就只是一個更好的功能,但如果這種交互方式影響了信息的整合與輸出方式,那就會對行業(yè)產(chǎn)生顛覆性影響。典型的就是觸屏對搜索的影響,在鼠標的模式下,搜索是互聯(lián)網(wǎng)的中心,但因為觸摸不能精確定位,進一步催生了App,這直接導致了搜索的中心地位被削弱。

  那顯然的注入了智能屬性的語音交互一定會導致信息整合和輸出方式的再次更迭,那這會對眼下已經(jīng)日趨穩(wěn)定的互聯(lián)網(wǎng)生態(tài)帶來什么影響?

  從現(xiàn)象上看,第一個最直接的影響是App又會消失了,信息的整合與輸出看起來似乎會經(jīng)歷一個分久必合,合久必分的過程。圖形用戶界面的鼠標時代,信息的整合與輸出其實是大一統(tǒng)的,基本上就是瀏覽器與搜索引擎,然后大的客戶端程序維持一定自己的空間(比如QQ)。圖形用戶界面的觸摸屏時代,信息的整合與輸出其實是分散化的,人們得記住自己要什么然后裝特定的App。語音交互則是更加大一統(tǒng)的,沒有App,同時也不會再有和瀏覽器相并列的大客戶端,有的只是輸入的一句句話。

  什么樣技術趨勢就會導致什么樣的格局。形象講我們可以認為搜索、電商、IM的格局是先天內(nèi)置在行業(yè)里面的,然后才是誰是搜索的王者,誰是電商的王者。

  在PC時代瀏覽器和搜索處于核心地位,所以就會有Google這樣的巨頭,其它人都要活在它的陰影下面。而一旦信息的整合與輸出再一次大一統(tǒng)化,那就一定會催生新的大號統(tǒng)治者,而這種大號統(tǒng)治者的出現(xiàn),實質上意味著現(xiàn)有的巨頭或者小巨頭會被削弱。如果沒有了App,對于O2O、甚至出行等誰掌握了上層的控制權,誰就掌握了他們的命脈。

  終局看來就會是這樣,但這個過程現(xiàn)在來看會非常漫長。

未來三年的交互方式發(fā)展

  交互方式的發(fā)展一定依賴于具體產(chǎn)品的銷售狀態(tài),而終端產(chǎn)品的銷售起量則有兩種模式:一種是智能手機式的,一種則是MP3式的。

  智能手機的啟動進程顯然和蘋果有巨大的關系,蘋果先推出一款標桿產(chǎn)品,然后迅速出現(xiàn)大量的模仿者,最終市場大幅啟動。在手機上整個過程歷時4~5年。MP3則與此不同,先是出現(xiàn)各種形狀的MP3,沒有領頭羊,市場也啟動了,然后蘋果出了一款體驗遠超其它人的產(chǎn)品。

  對語音交互的發(fā)展而言,我們同樣面臨兩種可能性:一種是有人做出了一款足夠爆款的產(chǎn)品,讓語音交互的落地有一個符號性的標志,然后類似產(chǎn)品持續(xù)跟進,產(chǎn)品品類持續(xù)拓寬;一種是沒什么標志性的產(chǎn)品,但交互方式極為寬泛的不停的在各個行業(yè)進行滲透,累積到一定程度再出各種標志性產(chǎn)品。在國外顯然走的是第一條路線,其中Amazon Echo扮演了領頭羊角色。在國內(nèi)則暫時還看不到這樣一個角色,越來越往MP3的走勢偏移。

  具體來講,如果是有人扮演領頭羊的角色,那市場會在領頭羊之后高速推開,因為交互方式的一切細節(jié)都會在領頭羊身上得到驗證,各個公司不會有任何疑慮,但如果是沒有領頭羊的模式,那整個進程就會拖的比較漫長。

  也就是說,未來三年交互方式的發(fā)展,最終會依賴于我們實質上會走到那條道路上來,眼下來看后者的可能性在升高,因為領頭羊這種事,事實上是具有極大偶然性的,喬布斯這種人是非常難以復制的,其信徒們似乎都走上了邯鄲學步的套路。

小結

  在過去,誰敢說自己是下一個BAT,其實是會被鄙視的,因為客觀條件就不具備,小魚塘里那會出現(xiàn)鯨魚。但現(xiàn)在交互方式似乎真的提供了這么一個機會,核心的問題是BAT等其實也這么想,所以這種顛覆性更可能只是巨頭間勢力的再分配。

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關資訊

關注官方微信

手機掃碼看新聞