失誤or作弊?百度人工智能遭遇刷分危機(jī)

失誤or作弊?百度人工智能遭遇刷分危機(jī)

這一周,百度因?yàn)樵谝粋€(gè)比賽中作弊被推到輿論的風(fēng)頭浪尖。

2張彩票和200張彩票

事情原委還要回到5月中旬,彼時(shí)百度宣稱其在ImageNet(圖像識(shí)別最大數(shù)據(jù)庫)的圖像識(shí)別測試挑戰(zhàn)賽中擊敗了谷歌微軟,稱其圖像識(shí)別錯(cuò)誤率低至4.58%,而微軟是4.94%,谷歌為4.8%。而在這種測試中,人類辨識(shí)ImageNet照片的錯(cuò)誤率為5%左右。

ImageNet這項(xiàng)比賽的全稱為Imagenet Large Scale Visual Recognition Challenge(ILSVRC),由來自斯坦福大學(xué)、密歇根大學(xué)以及北卡萊羅納大學(xué)教堂山分校的學(xué)者舉辦,是目前最權(quán)威的圖像識(shí)別測試。該測試主要衡量計(jì)算機(jī)識(shí)別圖片中的物件的能力,其原理基本上和百度谷歌都有的識(shí)圖應(yīng)用一致,不過測試的數(shù)據(jù)集規(guī)模極大,標(biāo)準(zhǔn)更加嚴(yán)謹(jǐn)詳細(xì)。

失誤or作弊?百度人工智能遭遇刷分危機(jī)

該比賽從2010年開始舉辦,至今已經(jīng)是第六屆,參與比賽的學(xué)術(shù)組織和機(jī)構(gòu)達(dá)到了50余所,大多來自世界知名大學(xué)的人工智能研究所以及科技界巨頭企業(yè)如谷歌、微軟等。

參與者需要掃描擁有100多萬張圖片的數(shù)據(jù)庫,將它們歸到1000個(gè)不同的類別之中,并對通過識(shí)別自動(dòng)給每張圖片添加注釋,最后將結(jié)果上傳到ImageNet的評估服務(wù)器上。最終比賽排名結(jié)果及各項(xiàng)指標(biāo)將由ImageNet在比賽結(jié)束后審核公布。

然而本月初,ImageNet隨后卻發(fā)文指責(zé)百度在測試中存在違規(guī)作弊行為。因?yàn)榘凑諟y試的官方規(guī)定,參與者每周只能向服務(wù)器提交2次測試結(jié)果,而百度卻在5天內(nèi)提交了40次結(jié)果。此外,ImageNet表示,百度還使用了30個(gè)不同的賬號,在過去6個(gè)月中提交了約200次測試結(jié)果。

通俗的來講,百度這種做法可以理解為在其他團(tuán)隊(duì)只購買2張彩票的情況下,它卻購買了200張彩票以提高中獎(jiǎng)概率。

ImageNet將此情況通報(bào)給了所有參賽團(tuán)隊(duì),對百度的成績予以否認(rèn)并禁止百度1年內(nèi)不得參加該比賽。

百度的不遺余力

與谷歌類似,百度都是以互聯(lián)網(wǎng)搜索為基礎(chǔ)的技術(shù)導(dǎo)向型公司,手頭握有大量的用戶和數(shù)據(jù)積累,對于進(jìn)行大數(shù)據(jù)挖掘,探索人工智能有著天然的優(yōu)勢。它也確實(shí)學(xué)著谷歌一樣在各個(gè)領(lǐng)域加強(qiáng)自己的創(chuàng)新技術(shù)探索,人工智能就是其中極為重要的一部分。

在人工智能這個(gè)大領(lǐng)域百度的探索和研究都可謂不遺余力,且在多個(gè)細(xì)分小類別都有巨大的投入。

其中,就包括引進(jìn)權(quán)威人才吳恩達(dá)及組建硅谷研究中心。2014年5月,百度宣布在美國硅谷成立人工智能的專門研發(fā)中心,并從谷歌挖來了深度學(xué)習(xí)權(quán)威學(xué)者吳恩達(dá)(Andrew Ng)任命其為百度深度學(xué)習(xí)研究院首席科學(xué)家。吳恩達(dá)不僅是斯坦福大學(xué)計(jì)算機(jī)科學(xué)和電子工程學(xué)的學(xué)術(shù)風(fēng)向標(biāo),更因其一手創(chuàng)建并領(lǐng)導(dǎo)了谷歌深度學(xué)習(xí)團(tuán)隊(duì),被業(yè)界譽(yù)為“谷歌大腦之父”,百度能聘到這樣的權(quán)威級人才實(shí)屬不易,可見其重視和投入。

去年底,美國《福布斯》發(fā)布文章稱,吳恩達(dá)及研究團(tuán)隊(duì)發(fā)明了一種新的語音識(shí)別方法,這款基于深度學(xué)習(xí)的名為“Deep Speech”語音識(shí)別系統(tǒng)可以在嘈雜環(huán)境下實(shí)現(xiàn)將近 81% 的辨識(shí)準(zhǔn)確率??突仿〈髮W(xué)工程學(xué)助理研究教授Ian Lane對其的評價(jià)是“百度研究院最近的工作有可能顛覆語音識(shí)別在未來的應(yīng)用效果?!?/p>

而百度目前在國內(nèi)擁有十幾座云計(jì)算中心,為滿足大數(shù)據(jù)在計(jì)算和存儲(chǔ)上的高要求,還投入使用了4萬兆交換機(jī),并在探索10萬兆的交換機(jī)。百度在GPU高性能計(jì)算機(jī)上的投入也是十分下血本,其美國研發(fā)中心的科學(xué)家吳韌稱百度在2013年剛開始準(zhǔn)備組建Minwa超級計(jì)算機(jī)的時(shí)候,購買量在國內(nèi)達(dá)到了第二,“拿不到第一是因?yàn)樘旌赢?dāng)然得是第一”。

此外,去年9月百度宣布已經(jīng)與寶馬正式簽署合作協(xié)議,共同研發(fā)自動(dòng)化駕駛技術(shù)。利用其地圖大數(shù)據(jù)資源對寶馬的車輛導(dǎo)航系統(tǒng)給予支持。而一系列有著人工智能氣息的獨(dú)特產(chǎn)品如BaiduEye、筷搜等也是一時(shí)之間占據(jù)各大科技頭條。

雖然其中一些產(chǎn)品的宣傳意義遠(yuǎn)大于實(shí)際意義,但我們也可以從中看出百度人工智能領(lǐng)域的重視。甚至,一些國內(nèi)外媒體都將其直接和谷歌、微軟、Facebook等國際科技巨頭相提并論。由此“百度人工智能”的名聲也隨著水漲船高,旗下科學(xué)家也是頻發(fā)論文、四處講演等,博得了不小的學(xué)術(shù)聲譽(yù)。

國際同行的口誅筆伐

百度ImageNet違規(guī)作弊事件也許在普通公眾看來好像并沒有什么大不了的,不就是參加測試不規(guī)范鉆了個(gè)空子么?但這對于百度在人工智能圖像識(shí)別這個(gè)學(xué)術(shù)領(lǐng)域的國際地位是沉重的打擊。

國際學(xué)術(shù)界各大評測和比賽的主旨是希望通過競爭促進(jìn)研究發(fā)展,所制定的各種規(guī)則也一般都主要靠參與者的自律,其他國家的學(xué)者更關(guān)心的都是該領(lǐng)域的真正進(jìn)展,而不僅是最后的成績排位,違反學(xué)術(shù)誠信的事情即使可能不被發(fā)現(xiàn)一般也堅(jiān)決不會(huì)去做的。結(jié)果百度一來參加這個(gè)比賽就被發(fā)現(xiàn)作弊,這在學(xué)術(shù)界絕對算讓人大跌眼鏡的事情。

不少國際學(xué)者對百度此舉也是不留情面地批評諷刺,美國艾倫人工智能研究所的CEO Oren Etzioni將百度比喻為瘋狂買彩票的投機(jī)彩民;而加州大學(xué)一名計(jì)算機(jī)科學(xué)界Jitendra Malik更是用嗑藥來諷刺百度:“如果你100米跑出了9.5秒,但你實(shí)際上是嗑藥吃興奮劑才取得的,那這個(gè)成績怎么可信呢?”

截至目前,百度對此并沒有對此事件進(jìn)行公開回應(yīng),不過ImageNet官網(wǎng)公布了一封據(jù)稱為百度深度學(xué)習(xí)小組的科學(xué)家Ren Wu的道歉信,信中Ren Wu稱此次事件為一次“失誤”:我們已經(jīng)在論文中添加了注釋……并將繼續(xù)提供相關(guān)更新。

當(dāng)然,這種解釋信不信由你了。

 

北京app開發(fā)公司 | app開發(fā) | app開發(fā)公司 | 企業(yè)品牌App開發(fā)移動(dòng)互聯(lián)網(wǎng)解決方案 | 一站式o2o app開發(fā)大數(shù)據(jù)解決方案 | 智能設(shè)備APP開發(fā)商

發(fā)表評論