217 人工智能與大數(shù)據(jù)
聽到列克星敦的建議,陳楓并沒有馬上回答。但他已經(jīng)默默將楊懷宇的價值上調(diào)了好幾個檔次。
留下這個人并不困難。畢竟現(xiàn)在整個馬薩島都在陳楓的控制下。只要他發(fā)話,任何人都不可能跑得出去。
但留下人只是第一步,還要想辦法讓他自愿為自己工作才能獲得收益。
尤其是對這種動腦子搞研究的人,外人根本看不出他是不是在劃水。如果再玩?zhèn)€“身在曹營心在漢”,那不但沒什么收益,搞不好還會壞事。
所以陳楓一時之間也想不到什么好辦法,只能先拖著。一直拖到胡德回來,再看看她有沒有好辦法。
想到這里,陳楓就不再糾結(jié)這個問題,而是向列克星敦問起了人工智能方面的研究進展。
提到這個話題,列克星敦馬上吐槽道:“進展是有一點,但還是太慢了。我們現(xiàn)在的所謂‘人工智能’實在是太笨了,很多事情都做不了。我看還不如叫‘人工智障’更貼切?!?p> 聽到“人工智障”這個吐槽,陳楓忍不住笑了起來。
雖然在對外宣傳的時候,陳楓一直聲稱自己的“忠誠僚機”系統(tǒng)能夠自主作戰(zhàn)。但實際上根本不是這么回事。
目前的“忠誠僚機”實際上不比蟑螂更聰明。它甚至還無法準確地辨認目標和聽懂命令。一旦脫離了艦?zāi)锏恼瓶?,它們就只會朝著眼前的移動目標一通亂射。
列克星敦這段時間已經(jīng)對此進行過上億次的模擬測試。因此也目睹過“忠誠僚機系統(tǒng)”數(shù)以萬計的犯錯方式。
所以沒有誰會比列克星敦更清楚這些小東西的奇葩程度。吐槽一句“人工智障”實在是相當(dāng)有涵養(yǎng)的說法了。
不過笑歸笑,但幫下屬解決實際困難是領(lǐng)導(dǎo)者的職責(zé)。所以陳楓還是問道:“那么你需要什么?是更大型的計算機?還是助手?”
列克星敦搖搖頭:“助手不需要。計算機的性能也足夠了。”
說著她挽起陳楓的手臂,領(lǐng)著他和楊懷宇一起走到一排集裝箱房前。推開其中一間的房門之后,映入眼簾的是一排排書柜一樣的計算機組。
這里是列克星敦的數(shù)據(jù)中心。
一整排集裝箱房里都裝滿了服務(wù)器,存儲并處理著從馬薩島各地傳輸過來的數(shù)據(jù)。這些服務(wù)器中安裝的是陳楓用系統(tǒng)仿制的CPU和專用AI芯片。
整個數(shù)據(jù)中心需要配備一個獨立的小型燃料電池發(fā)電站,并且有一條專用的暗渠抽取海水進行冷卻。
列克星敦拍了拍矗立的刀片機陣列,說道:“這個數(shù)據(jù)中心的運算能力對我們來說目前已經(jīng)足夠了。但它現(xiàn)在根本沒有滿負荷運轉(zhuǎn)。因為我們沒有足夠的數(shù)據(jù)來‘喂養(yǎng)’它。”
正如列克星敦所言。陳楓現(xiàn)在所掌握的只是很初級的人工智能技術(shù)。它是根據(jù)“深度學(xué)習(xí)”原理運行的。
“深度學(xué)習(xí)”原理是建立在“模式識別”技術(shù)基礎(chǔ)上的。
小學(xué)數(shù)學(xué)課上,大家都做過一類叫“找規(guī)律”的題目。比如列出一串?dāng)?shù)字“1,3,5,7……”,然后讓學(xué)生去猜測后面的數(shù)字是什么。
這種“看現(xiàn)象找規(guī)律”的題目,就是在做“模式識別”。
計算機最初并不知道什么是規(guī)律,只是在胡亂猜測。這種猜測當(dāng)然絕大多數(shù)都是錯誤的。
但每一次“找規(guī)律”之后,都會由人類或某種游戲規(guī)則作為“老師”來判斷對錯。計算機會記住那些正確的規(guī)律,然后嘗試在下一次題目中套用。如果不能套用,就繼續(xù)猜答案。
這種方法就是“試錯法”。通過不斷嘗試新做法、排除錯誤猜測,最后留下最接近正確答案的那一個“規(guī)律”或者“模型”。這就是“模式識別”。
它不僅是AI學(xué)習(xí)的基礎(chǔ),也是人類探索新領(lǐng)域的常見做法。
而所謂“深度學(xué)習(xí)”,就是在識別出現(xiàn)象的淺層“模式”之后,再把“模式”作為現(xiàn)象來歸納更深一層的“模式中的模式”。
以此類推,就會有“模式中的模式中的模式”,以及“模式中的模式中模式中的模式”……
識別的“模式”的層次越多,學(xué)習(xí)的“深度”就越深。這樣人工智能程序才能從更加復(fù)雜的現(xiàn)象中總結(jié)出規(guī)律來。
但是學(xué)習(xí)網(wǎng)絡(luò)的深度每增加一層,它所需要的原始數(shù)據(jù)就會以指數(shù)級別暴增。
假如一層學(xué)習(xí)只需要一百個樣本。那么兩層的學(xué)習(xí)就需要一萬個樣本,三層的學(xué)習(xí)需要一百萬個,四層的學(xué)習(xí)就需要一億個樣本……
如果學(xué)習(xí)的深度達到十層,需要的樣本數(shù)量將是……一萬億億個。相當(dāng)于世界上每個人都要給它提供一百億個樣本數(shù)據(jù)。
而隨著樣本數(shù)量的增加,深度學(xué)習(xí)對計算能力的需求也急劇增加。所以計算能力和樣本數(shù)據(jù)多少是人工智能發(fā)展的兩個主要制約因素。
所以當(dāng)陳楓問列克星敦需要什么時,她毫不猶豫地回答“需要更多的數(shù)據(jù)”。
“我們的數(shù)據(jù)還不夠嗎?”陳楓有些吃驚,“我們每天都記錄了幾萬人的工作和活動數(shù)據(jù)。這些還不夠嗎?”
陳楓所說的“幾萬人”是指他目前直接掌握的勞工、軍隊、和學(xué)生的數(shù)量。
他要求所有在他這里工作學(xué)習(xí)的人都必須佩戴有記錄和上傳功能的智能設(shè)備。而他給工人提供的工程機械,和給士兵提供的所有武器裝備,都具備同樣的記錄和上傳功能。
這些人的所見所聞、所做所說都會被傳輸?shù)竭@個數(shù)據(jù)中心。
數(shù)據(jù)中心的處理器會分析這些數(shù)據(jù),從中學(xué)習(xí)人類是如何識別物體、如何聽懂語言、如何規(guī)劃路線、如何駕駛車輛、如何使用武器、如何相互配合等等。
事實上在陳楓的心目中,這些人無論表面上干的是什么活,其實都同時兼了另一份工作——AI訓(xùn)練師。
陳楓最關(guān)心的并不是工人們本身工作產(chǎn)生的價值,而是他們將要訓(xùn)練出來的、未來將取代他們工作的智能機器人的價值。
無論他們工作如何努力,他們在這些簡單勞動中創(chuàng)造的價值都不可能超過未來海量的AI工人大軍。
這才是占領(lǐng)馬薩島給陳楓帶來的最大收益——島上一百多萬居民帶來的人口紅利。
然而列克星敦卻斬釘截鐵地說:“不夠。這還遠遠、遠遠、遠遠不夠。按照我的研究計劃,收集數(shù)據(jù)的速度至少要增加一萬倍。”
聽到這話,陳楓頓時哭笑不得:“列克星敦啊,我從哪里找來那么多數(shù)據(jù)給你?難道你要我先去占領(lǐng)全世界?”
一百萬人乘以一萬倍,可不就需要一百億人來提供嗎?剛好是這個世界的人口總數(shù)。
藍星海
別擔(dān)心。我雖然確實寫得慢,但不會太監(jiān)的。 最近是因為改大綱比預(yù)計的要痛苦多了。原本接下來應(yīng)該是光輝華麗登場,然后力挽狂瀾的劇情。結(jié)果砍掉瘟疫劇情之后,光輝的地位就相當(dāng)尷尬了。所以我正頭痛呢。 再加上復(fù)工后工作比平時還要忙,所以更新就更慢了。 努力熬過這一段,后面就會好的。