Windows 7操作系統(tǒng)的正式發(fā)布引發(fā)了新一代操作系統(tǒng)的大戰(zhàn),谷歌公司也隨之殺入了這場(chǎng)競(jìng)爭(zhēng)之中。與之相對(duì)應(yīng)的是,互聯(lián)網(wǎng)終端,無(wú)論是計(jì)算機(jī)、手機(jī)還是電視屏幕,都被拉進(jìn)了一個(gè)“云計(jì)算”時(shí)代的宏大敘事當(dāng)中。在“云計(jì)算”的時(shí)代里,往日的IT業(yè)巨人將會(huì)扮演什么樣的角色,租用軟件服務(wù)會(huì)如何改變我們的生活,人工智能將走向何方?本報(bào)記者在微軟亞洲研究院采訪了洪小文院長(zhǎng),請(qǐng)他向大家描述了自己眼中計(jì)算機(jī)、人工智能和互聯(lián)網(wǎng)的未來(lái)。
【人物名片】 洪小文
畢業(yè)于臺(tái)灣大學(xué)電機(jī)工程學(xué)專(zhuān)業(yè),于卡內(nèi)基—梅隆大學(xué)獲得計(jì)算機(jī)碩士及博士學(xué)位,美國(guó)電機(jī)電子工程師學(xué)會(huì)院士,是國(guó)際公認(rèn)的語(yǔ)音識(shí)別技術(shù)專(zhuān)家。曾就職于蘋(píng)果公司。1995年加入微軟亞洲研究院,并于2004年擔(dān)任微軟亞洲研究院副院長(zhǎng)。2007年前任微軟亞洲研究院院長(zhǎng)。
1 搞研發(fā)需要高情商
新京報(bào):在微軟研究院里工作的都是“科學(xué)怪人”嗎?
洪小文:整個(gè)微軟9萬(wàn)多職工,研究院的人數(shù)只占了1%,就像在社會(huì)中,科學(xué)家的數(shù)量也是少部分一樣。
他們不是愛(ài)因斯坦,都是普通人。不過(guò),科研很多時(shí)候是在做夢(mèng),研究院的確會(huì)找一些對(duì)未來(lái)有夢(mèng)想,能夠?qū)崿F(xiàn)夢(mèng)想的人。
新京報(bào):他們的智商都非常高吧?
洪小文:是不是只有最聰明的人才能做科研,我不敢講。但對(duì)現(xiàn)實(shí)希望能更精益求精,追求夢(mèng)想,這一定需要最聰明的人嗎?我們的科研人員是需要一些情商的。要講團(tuán)隊(duì)合作,至少要讓大家喜歡和你工作。今天的互聯(lián)網(wǎng),大部分的軟件都是針對(duì)人的,所以情商起到了很重要的作用。
新京報(bào):你怎么看現(xiàn)在很火的“云計(jì)算”概念,以及這個(gè)領(lǐng)域人人都想分一杯羹的激烈競(jìng)爭(zhēng)?
洪小文:“云計(jì)算”是必然的趨勢(shì)。很像買(mǎi)房,F(xiàn)在呢,你可能租房就可以了,里面什么都有。“云計(jì)算”技術(shù)下,只要接到了網(wǎng)絡(luò),就可以得到所有你想要的東西。
有幾點(diǎn)還是要注意的:首先,還是有很多人要買(mǎi)房的,資料放在別人那里,安全性怎么保證?一定還是有人會(huì)用傳統(tǒng)的方式。有人說(shuō)全球都會(huì)變成云計(jì)算什么的,我覺(jué)得這么說(shuō)不負(fù)責(zé)任;另外,“公共云”和“私人云”還是有區(qū)別的。所以“云”是分很多種的;第三,“云”還是要和“端”結(jié)合起來(lái);最后,云計(jì)算里面有一些有用的服務(wù),但只有把軟件放在數(shù)據(jù)庫(kù)中才能產(chǎn)生服務(wù),有了軟件才有內(nèi)容。
2 軟件更新會(huì)快于硬件
新京報(bào):“摩爾定律”說(shuō)硬件的更新速度為每18個(gè)月更新一次,但過(guò)去30年中,計(jì)算機(jī)理論并沒(méi)有很大的突破。因此,摩爾定律將很難延續(xù)到2020年以后。這是真的嗎?
洪小文:每一行都會(huì)有瓶頸。所以應(yīng)該放更多的經(jīng)費(fèi)在基礎(chǔ)科學(xué)上。我覺(jué)得任何時(shí)代都需要好的突破,我個(gè)人是樂(lè)觀的。今天微軟在說(shuō)“三塊屏幕,同一片云”,指的是“電腦屏幕、手機(jī)屏幕、電視屏幕”,“云”是“云計(jì)算”。這些東西,幾年前是做不出來(lái)的。今天的手機(jī),不但可以上網(wǎng),還可以觸摸。這在五年前還只是個(gè)夢(mèng)想。所以說(shuō)互聯(lián)網(wǎng)只是一個(gè)基本的網(wǎng)絡(luò),互聯(lián)網(wǎng)上可以做很多新的東西;A(chǔ)技術(shù)的創(chuàng)新才能讓我們繼續(xù)做下去。
新京報(bào):所以你覺(jué)得摩爾定律可以繼續(xù)延續(xù)下去嗎?
洪小文:摩爾定律說(shuō)的是硬件更新的速度,現(xiàn)在還有網(wǎng)絡(luò)和軟件更新的速度。任何硬件都有物理的極限,而軟件則是無(wú)形的。前段時(shí)間在松鼠會(huì)舉辦的科學(xué)嘉年華上,我向大家展示了一些現(xiàn)在正在開(kāi)發(fā)的圖像軟件。圖像中,一個(gè)小狗在樹(shù)前,你把小狗切除掉,軟件可以自動(dòng)把后面的背景還原了,這種技術(shù)現(xiàn)在一些地圖軟件中已經(jīng)開(kāi)始運(yùn)用。切除的技術(shù)也很不一樣,我們隨便在一個(gè)物體或人上畫(huà)幾筆,就可以把這個(gè)物體切除掉。聽(tīng)上去就好像做夢(mèng)一樣。我個(gè)人是很樂(lè)觀的。
3 語(yǔ)音識(shí)別已經(jīng)很準(zhǔn)確
新京報(bào):微軟亞洲研究院的專(zhuān)長(zhǎng)主要在圖像和語(yǔ)音處理這塊,現(xiàn)在你們主要在做哪些方面的工作?
洪小文:現(xiàn)在研究院一個(gè)很重要的研發(fā)方向叫做“自然人機(jī)界面”的綜合技術(shù)。以前是要讓電腦模擬人,現(xiàn)在的方向則是要電腦用自己的方式了解你。今后的人和電腦之間,可以通過(guò)各種方式交流,比如如果有攝像頭的話,揮手就可以交流。另外,“云計(jì)算”是很新的領(lǐng)域,這也是很大的一個(gè)發(fā)展。你所有的信息、資料都在互聯(lián)網(wǎng)上,可以通過(guò)GPRS隨時(shí)知道你在哪兒,可以隨時(shí)向你傳遞你要的東西。
新京報(bào):你是做語(yǔ)音出身,這方面會(huì)有哪些突破?
洪小文:語(yǔ)音合成會(huì)有很大突破。你現(xiàn)在隨便講任何話,我可以讓電腦錄下來(lái),回頭分析你的語(yǔ)速。可以通過(guò)模擬,制作出你所需要的新的講話。比如周杰倫的粉絲,就可以錄他的聲音,然后用軟件讓“周杰倫”講任何你想聽(tīng)的話,唱任何歌。
新京報(bào):中文這樣復(fù)雜的語(yǔ)言,什么時(shí)候會(huì)出現(xiàn)準(zhǔn)確率較高的語(yǔ)音輸入法呢?
洪小文:現(xiàn)在的office的中文語(yǔ)音輸入文章,準(zhǔn)確性可達(dá)到95%,已經(jīng)很不錯(cuò)了。
當(dāng)然真正讓電腦了解你講的每一句話,區(qū)分說(shuō)話時(shí)的背景和噪音,這還是需要很復(fù)雜的技術(shù)的。人講話時(shí)會(huì)用手勢(shì),會(huì)有身體語(yǔ)言,人工智能中也是這樣。多通道識(shí)別其實(shí)是更有意思的項(xiàng)目。
4 機(jī)器就該起輔助作用
新京報(bào):我們會(huì)從鼠標(biāo)和鍵盤(pán)中解放出來(lái)嗎?
洪小文:鼠標(biāo)和鍵盤(pán)還是不錯(cuò)的,人有時(shí)候講話是模糊的,比如說(shuō)“把這個(gè)文檔刪除”,不如直接把文檔拽到“回收站”里。但如果屏幕是投影在墻上的,你再用鼠標(biāo)就很怪,那就可以用一些手勢(shì),空中畫(huà)幾筆,電腦就知道我在寫(xiě)什么了。所以“自然人機(jī)界面”是研究院很大的研究方向。
新京報(bào):這個(gè)主要借鑒哪些技術(shù)?
洪小文:比如紅外或普通的攝像頭,可以用來(lái)進(jìn)行視覺(jué)識(shí)別。再比如陀螺儀技術(shù),現(xiàn)在很多手機(jī)有一種游戲,可以位移手機(jī),讓里面的一個(gè)球滾來(lái)滾去。兩個(gè)手機(jī)要發(fā)名片,你一“甩”就“甩”過(guò)去了,就是靠陀螺儀技術(shù)。
新京報(bào):十年后的人工智能會(huì)是怎樣的?
洪小文:肯定比現(xiàn)在好,但是我相信還是會(huì)和人有一定距離,F(xiàn)在的人工智能已經(jīng)能和人下棋,吸塵器到了轉(zhuǎn)角會(huì)自己轉(zhuǎn)彎的程度。但自動(dòng)駕駛技術(shù),一旦遇到眼前一片霧茫茫什么都看不見(jiàn)時(shí),還是需要人的經(jīng)驗(yàn)。搞人工智能,我們要考慮目的是什么。如果人工智能是為了“造人”,那我們?nèi)祟?lèi)幾千幾萬(wàn)年前就已經(jīng)會(huì)了。人工智能的目的,是要造出和人一模一樣的智慧呢?還是為了讓電腦更好用,幫助人實(shí)現(xiàn)做不到的事情?從應(yīng)用的角度看,機(jī)器就是該作為人的輔助。人走不快,汽車(chē)讓人走得更快,這就是很實(shí)用的想法。
3 語(yǔ)音識(shí)別已經(jīng)很準(zhǔn)確
新京報(bào):微軟亞洲研究院的專(zhuān)長(zhǎng)主要在圖像和語(yǔ)音處理這塊,現(xiàn)在你們主要在做哪些方面的工作?
洪小文:現(xiàn)在研究院一個(gè)很重要的研發(fā)方向叫做“自然人機(jī)界面”的綜合技術(shù)。以前是要讓電腦模擬人,現(xiàn)在的方向則是要電腦用自己的方式了解你。今后的人和電腦之間,可以通過(guò)各種方式交流,比如如果有攝像頭的話,揮手就可以交流。另外,“云計(jì)算”是很新的領(lǐng)域,這也是很大的一個(gè)發(fā)展。你所有的信息、資料都在互聯(lián)網(wǎng)上,可以通過(guò)GPRS隨時(shí)知道你在哪兒,可以隨時(shí)向你傳遞你要的東西。
新京報(bào):你是做語(yǔ)音出身,這方面會(huì)有哪些突破?
洪小文:語(yǔ)音合成會(huì)有很大突破。你現(xiàn)在隨便講任何話,我可以讓電腦錄下來(lái),回頭分析你的語(yǔ)速?梢酝ㄟ^(guò)模擬,制作出你所需要的新的講話。比如周杰倫的粉絲,就可以錄他的聲音,然后用軟件讓“周杰倫”講任何你想聽(tīng)的話,唱任何歌。
新京報(bào):中文這樣復(fù)雜的語(yǔ)言,什么時(shí)候會(huì)出現(xiàn)準(zhǔn)確率較高的語(yǔ)音輸入法呢?
洪小文:現(xiàn)在的office的中文語(yǔ)音輸入文章,準(zhǔn)確性可達(dá)到95%,已經(jīng)很不錯(cuò)了。
當(dāng)然真正讓電腦了解你講的每一句話,區(qū)分說(shuō)話時(shí)的背景和噪音,這還是需要很復(fù)雜的技術(shù)的。人講話時(shí)會(huì)用手勢(shì),會(huì)有身體語(yǔ)言,人工智能中也是這樣。多通道識(shí)別其實(shí)是更有意思的項(xiàng)目。
4 機(jī)器就該起輔助作用
新京報(bào):我們會(huì)從鼠標(biāo)和鍵盤(pán)中解放出來(lái)嗎?
洪小文:鼠標(biāo)和鍵盤(pán)還是不錯(cuò)的,人有時(shí)候講話是模糊的,比如說(shuō)“把這個(gè)文檔刪除”,不如直接把文檔拽到“回收站”里。但如果屏幕是投影在墻上的,你再用鼠標(biāo)就很怪,那就可以用一些手勢(shì),空中畫(huà)幾筆,電腦就知道我在寫(xiě)什么了。所以“自然人機(jī)界面”是研究院很大的研究方向。
新京報(bào):這個(gè)主要借鑒哪些技術(shù)?
洪小文:比如紅外或普通的攝像頭,可以用來(lái)進(jìn)行視覺(jué)識(shí)別。再比如陀螺儀技術(shù),現(xiàn)在很多手機(jī)有一種游戲,可以位移手機(jī),讓里面的一個(gè)球滾來(lái)滾去。兩個(gè)手機(jī)要發(fā)名片,你一“甩”就“甩”過(guò)去了,就是靠陀螺儀技術(shù)。
新京報(bào):十年后的人工智能會(huì)是怎樣的?
洪小文:肯定比現(xiàn)在好,但是我相信還是會(huì)和人有一定距離,F(xiàn)在的人工智能已經(jīng)能和人下棋,吸塵器到了轉(zhuǎn)角會(huì)自己轉(zhuǎn)彎的程度。但自動(dòng)駕駛技術(shù),一旦遇到眼前一片霧茫茫什么都看不見(jiàn)時(shí),還是需要人的經(jīng)驗(yàn)。搞人工智能,我們要考慮目的是什么。如果人工智能是為了“造人”,那我們?nèi)祟?lèi)幾千幾萬(wàn)年前就已經(jīng)會(huì)了。人工智能的目的,是要造出和人一模一樣的智慧呢?還是為了讓電腦更好用,幫助人實(shí)現(xiàn)做不到的事情?從應(yīng)用的角度看,機(jī)器就是該作為人的輔助。人走不快,汽車(chē)讓人走得更快,這就是很實(shí)用的想法。
Copyright ©1999-2024 chinanews.com. All Rights Reserved