比人工智能更可怕的是……
比人工智能更可怕的是……,算法,圖靈,機器人,計算機,大模型,人工智能,
經過近半個世紀的飛速發展,人工智能已進入到我們生活的方方面面。從改變我們交流方式的語言模型,到成為我們娛樂伙伴的智能機器人,在醫療、交通、教育等各領域推動著社會進步。
熟悉的同時,我們真的了解人工智能嗎?近期,在2023宜興筆架山數字科商大會上,知名教育家李永樂老師針對人工智能,從其基本原理到生態應用以及產業發展等幾個方面深入淺出的談了一些看法,并和現場觀眾進行了精彩的討論。
(資料圖片)
以下是現場實錄:
李永樂:感謝各位領導、來賓,非常感謝在座的小朋友們,我是人民大學附屬中學的物理老師李永樂。今天很榮幸受到曹老師的邀請,與大家討論機器為什么能像人一樣思考,換句話說,什么是人工智能?
我希望通過我們今天的講述,讓大家對人工智能的基本原理有一個簡單的理解。
讓我們來看一個例子。這是我家的兩只狗,左邊這只叫“帥帥”,右邊這只叫“栗子頭”。它們兩個已經長得很大了。你們知道這是什么品種嗎?
(觀眾:柯基。)
許多朋友知道這是柯基,但可能有些不養狗的朋友不了解這是柯基。我在家里做過一個實驗,有一塊小天才兒童智能手表,攝像頭對準小狗,這時候它會念出來,這是“威爾士柯基犬”。為什么掃描一下,它就知道這是威爾士柯基犬呢?因為它具有人工智能。
現在人工智能的用處實在是太廣泛了,隨處可見的人臉識別系統是人工智能;計算機輔助的CT影像是人工智能;在路上開車違章了被拍是人工智能;手機上的各種語音軟件、智能音箱、美顏軟件、短視頻平臺的推薦機制、電子郵箱的垃圾系統,都是人工智能;在自動駕駛、智慧工業等領域,人工智能也是不可或缺的,所以如果把人工智能從我們的生活中抽掉的話,我們的生活可能會退到幾十年之前。
實際上,我本身是一個人工智能的門外漢,但是我多學了一點數學,所以今天跟大家聊一聊人工智能的發展史,以及它最基本的數學原理。我希望通過這一堂課,使我們的小朋友們了解一丟丟的人工智能,并且對它感興趣,甚至未來從事這個行業,我們今天報告的目的就達到了。
1. 人工智能發展史
首先,讓我們來回顧一下人工智能的發展歷史。人工智能并不是一個新生的概念,上古時代,東西方文明都曾出現過類似人造人的說法。
上世紀50年代左右,神經生物學、計算機科學、數學等學科的發展,使得人工智能首次進入科學家的視野。
1950年,一位叫圖靈的科學家提出了一個問題,機器會思考嗎?機器能否像人一樣思考?他還提出一種“圖靈測試”,這個測試非常簡單,有一個人和一臺機器,有另一個人向這兩者提問,人和機器會分別以文字形式回答,然后我們根據回答,判斷他們誰是人,誰是機器。
如果大部分人都無法區分出哪個是機器,那就說明這臺機器已經通過了圖靈測試。如果一臺機器通過了測試,那么就可以說,它可以像人一樣進行思考。
圖靈當年預言,到2000年左右,會有通過圖靈測試的機器出現。實際上,在2014年,確實有一個人工智能軟件通過了圖靈測試,它的名字叫尤金·古斯特曼。到了2023年,ChatGPT出現后,我們才知道它有多強大。
人工智能發展非常迅速。我們都知道,在科學領域的最高獎是諾貝爾獎;數學領域的最高獎是菲爾斯獎;在計算機領域,最高獎就是圖靈獎。說個題外話,圖靈在二戰時破譯了德國的英格爾碼機,他的故事被拍成了一部電影,叫作《模仿游戲》,如果大家有興趣,可以回去看一下。
電影《模仿游戲》劇照 圖源:豆瓣
到了1956年,美國計算機科學家明斯基、麥卡錫,以及信息論的奠基人香農等一眾大佬,在一起開了一個會議,叫達特茅斯會議,他們創造了“人工智能(AI)”這個詞。
從那次會議開始,人工智能進入了大發展時代。后來,明斯基和麥卡錫因為各自的貢獻獲得圖靈獎。而其中最重要的一位大佬,香濃,卻沒有獲得圖靈獎,為什么呢?因為香農已經不需要圖靈獎,他的名字被命名為通訊領域的最高獎“香農獎”。
從此之后的幾十年,由于算法和算力限制,人工智能幾經起落。到了1997年,卡斯帕羅夫被一個機器人打敗了,這個機器人就是IBM的人工智能軟件“深藍”。自從那件事發生后,人工智能迎來了第三次大發展。
在過去的20多年里,人工智能算法領域涌現了許多靈魂人物,例如深度學習之父辛頓。他引入了一個算法,叫“反向傳播算法”,這是一個比較復雜的算法。還有紐約大學的一位教授,叫楊立昆,現在還非常活躍,經常出來談話。他最著名的工作是卷積神經網絡,這兩人與加拿大蒙特利爾大學的本·吉奧共同獲得了2018年的圖靈獎。
2. 數學原理
說了這么多歷史和人物,計算機到底是如何實現智能的?我們來說一下數學原理,那就是損失函數和梯度下降,這個問題稍微有一點復雜,但是只要具有初中以上的文化程度,就一定能夠聽明白,因為它只涉及一次函數的知識。
我們可以先舉一個例子,比如房價與房子的面積之間的關系,我們大致知道,房子的面積越大,房價就越貴。但當我將這些數據標記在這張圖上時,會發現它們并不在同一條直線上。那么,我們應該如何解釋房價與面積的關系呢?
我們設想用一條線,讓這條線最接近這些點,讓這些點和線的距離之平方和最小,這樣,這條線就是最完美的,這種現象稱為,利用最小二乘法找到一個擬合。換句話說,我們需要找到一個誤差函數,即預測值與實際值的差別到底有多大。如果預測值和實際值的差別最小,我們就說這個預測是最完美的。如果不完美怎么辦?那就調唄,調整這根線的位置。
這根線由幾個參數決定呢?許多小朋友知道,一個是斜率,一個是截距,就涉及這兩個參數。因此,我們只需調整斜率和截距,觀察什么時候這條線與這些點之間的距離平方和最小,這時,就稱為誤差函數最小。
如何確定損失函數的最小值呢?我們有一種數學方法,稍微有些復雜,大致意思是,假如誤差較大,我們可以設法在某個特定的點上進行調整,直到找到最完美的值。
說起來這并不是一個復雜的問題,但我們知道,現實生活中,一個房子的價值并非由面積決定,除了面積之外,我們還需要考慮許多因素,將許多參數放入這個方程中。在數學領域,預測值可能由許多參數構成,它們并非直線或二維,可能是高維空間。盡管如此,我們仍可在高維空間中尋找到誤差值最小的點,也就找到了預測值。
這正是人工智能的基本原理。我們需要找到一個預測,你給我一些輸入,我獲得一個輸出,當預測值最小,它就是最準確的。
就像剛才我用小天才智能手表拍攝小狗時,它不停地去尋找拍攝對象是什么東西時能得到誤差函數最小,結果發現,在威爾士柯基犬這個類目下,誤差最小,從而判定它是一只威爾士柯基犬。這個過程其實就是人工智能的訓練的過程。
3. 神經網絡原理
接下來,我們來討論神經網絡的原理。
神經網絡這個詞我們都聽過,大家是否經常看到這張圖?
有沒有同學知道它的含義?左側表示輸入的數據,中間表示一些神經元計算,最后有一個輸出結果。例如,如果我們輸入大量數據點,最后,它告訴我們是一只威爾士柯基犬,從左到右,每個圓圈我們將其命名為神經元。
那為什么叫神經元,不叫計算機元?這是因為神經網絡就是模擬人的大腦而產生的。這是一個人腦的神經圖,可能高中同學們應該學過神經元細胞。左側有一個樹突,將上一級神經元的信息收集起來,然后經過軸突,再通過突觸傳遞到下一層。因此,神經元具有輸入、運算和輸出這樣一個結構。人們覺得這很有趣,神經元居然可以接收信號,通過計算,再傳遞給下一層神經元。
在1943年,美國有兩位神經科學家,一位叫皮茨,另一位叫麥卡洛克。他們分析了人類的神經結構,認為人類的腦神經元是一個多輸入、單輸出的系統,而且輸出只有兩種,0和1,如果輸出為1,則向下游傳遞,信息如果輸出為0,則不向下游傳遞。
比如一只蚊子輕輕落在我的皮膚上,可能我皮膚上的神經元受到了刺激,但它們覺得刺激太小,所以拒絕向下游傳遞。下游可能不知道,但是如果有一個鉛球砸到我的胳膊上,這個時候所有神經元都會猛烈地向下游傳遞,我就知道這件事了。
因此,神經細胞是否向下傳遞并不一定,取決于它的運算結果。
因此,他制作了一個人工神經元模型(MP模型)。神經元有許多輸入,經過計算后得出一個結果,根據結果的大小決定是否向下游傳遞信息。如果我決定要向下游傳遞信息,那么Oi輸出為1,在計算機上稱為高電平,在人腦上,稱為傳遞神經遞質。這個過程中需要經過Sigmoid方程,這是為了引入非線性,我們暫時不考慮。總之,通過計算將上游輸入轉化為一個結果,決定是否下一步輸出。
我們剛才討論過房子問題,需要尋找一個最優解。在尋找最優解時,需要調節很多參數,例如調節直線斜率和截距,這就是不斷訓練模型的過程,這個過程就像我們小時候,跟爸媽出去,你問“這是什么”,媽媽說“這是摩托車”,下次你看到自行車,說“這是摩托車”,媽媽說“不對,這是自行車”,你就區分了摩托車和自行車。這個過程就是不斷調節你的內部參數的過程。這是神經元的原理。
通過這樣的操作,我們可以讓計算機理解圖像。例如,大家可以看到左邊這張圖,實際上是一個英文字母X,大部分同學都能看出來。但計算機不懂X,也不懂你想跟他說什么,它只能看到黑和白這兩種狀態,黑是1,白是0,于是計算機把這個圖形轉化成一個數字矩陣。問題是,變成數字矩陣后,計算機如何知道它是一個X?
我們不能告訴計算機,記住了,這就是X。如果你只告訴計算機這一點,那么圖形稍微旋轉一下就不是X了嗎?圖形擴大一下就不是X了嗎?所以我們不能告訴計算機,只要記住這就是X,其他的都不是,這樣做就不叫人工智能。人工智能就是在告訴它一些事情后,進入新的領域也能識別,怎么做到呢?這就是人腦和計算機非常不同的地方。
我現在展示一張電影截圖,大家知道這是來自《黑客帝國》。黑客帝國描述了整個世界都是數字世界。在我們看來的圖像,在計算機看來都是一大堆數據點,但問題是,這些數據點進入計算機后,計算機如何知道它們具體是什么?其實很簡單,靠神經網絡。
簡單神經網絡可以分為三層,輸入、隱藏和輸出,深度神經網絡有很多層。首先,你需要提供大量數據,例如一大堆的0、1,輸入完成后,再調節參數,把輸出再連到下一層的輸入上。
比如,圖上第一層是5個神經元,第二層是7個神經元,那么在這5個神經元和7個神經元之間共有35個連接,它們之間的連接都需要調整,所以每個連接都會有參數,一旦網絡擴大,參數會非常多。
如果只判斷一個圖像是否是X,可能一層神經元就夠了,但如果想判斷更復雜的圖像,比如一個人或一只狗,就需要使用多層神經元,那就是深度神經網絡。然而,全連接的網絡復雜度實際上太高,需要的計算量非常大,正因為計算量過大,傳統意義上人工智能并沒有太大發展。也有些人認為,人工智能是無法實現的。
這張圖展示了人工智能的起落。
我們可以看一下,1956年達特茅斯會議提出了AI的概念,1959年提出了機器學習,第一次浪潮發生在大約1970年代,然后第一次陷入低谷,因為過去的算法存在一些問題。第二次浪潮是在美日兩國立項AI的研究,后來又進入低谷,因為市場不大。最后一次浪潮是深藍戰勝世界冠軍,自那之后,人工智能發展特別迅速。目前全世界所有科技公司基本都在搞人工智能,因為它的作用實在太大了。
4. 視覺原理
接下來我們來討論視覺原理。為什么你能看到我是一個人?當你看到我時,你真的立刻覺得自己在看一個人嗎?不是的,實際上你看到的是一堆像素點,是我的身體影像進入了你的視網膜,上面有很多感光細胞投影,使你感覺到了一大堆像素點,但問題是如何才能知道這些像素點是一個人?實際上這就是視覺原理。
視覺原理是最近幾年才被真正搞清楚的。在1981年,諾貝爾生理學和醫學獎獲得者,科學家大衛·蘇泊爾和威瑟爾兩人發現了視覺原理。具體做法是將電極插入貓的腦子,讓貓觀察各種信號,觀察完成后,發現貓的大腦中與視覺相關的細胞分為兩種:一種是對特定線條有反應的細胞,稱為簡單細胞;另一種是對運動線條有反應的復雜細胞。
在他們的啟發下,日本科學家在福島邦彥提出了神經認知模型。
這個模型很有趣。
他認為:人的視覺分為多層。外界光進入眼睛后,通過瞳孔晶狀體在視網膜上的成像實際上是一堆像素點,這些像素點信息會傳遞到大腦中,大腦最初接收信號的是V1皮層,或者叫初級皮層;初級皮層獲得像素點后,會對像素點進行處理,處理后變成線條,再傳到V2皮層,稱為次級皮層;次級皮層根據這些線條組合成圖形;再傳遞到三級皮層。
當你看到一個人時,首先是一堆像素點,然后大腦將這些像素點連成線條,接著將線條變成圖形,再上色。最后你就發現原來看到的是一個人,不是一個昆蟲。
這個模型就被人們做成了一個人工智能的方法,首先通過組合像素點,將其變成邊緣特征,然后將邊緣特征組合成輪廓,比如鼻子和眼睛等,最后將輪廓轉化為更大的物體模型。這與傳統認知有所不同,傳統認知認為,首先觀察到輪廓,再關注細節。實際上,但事實上科學家說,我們是將細節逐步組合成一個整體,才能認識到對方的整體,每一級工作都是在人腦的不同區域完成的。
這個人就叫楊立昆。楊立昆想,既然人腦可以做這件事,計算機能不能做?于是他就做了一個卷積神經網絡。插一句,前段時間,楊立昆出來說,ChatGPT沒有任何的智能,它只是鸚鵡學舌,但是大部分人還是對這個ChatGPT非常感興趣。
5. 卷積神經網絡
我們來簡要介紹卷積神經網絡的原理。卷積神經網絡的原理稍顯復雜,首先,我們想讓大家看這4張圖,實際上每張都是一個字母X,人類一眼就能看出來,但這4張圖完全不一樣。
因此,在計算機無法識別出它們是不是X時,我們需要采用一些方法。雖然這些圖形本質上不太一樣,但它們都有一些共同的特征,比如,中間都是一個中間白、四角白,然后四邊有一塊黑色的十字圖形;再比如,左上角都有兩個白塊。所以我們假設無論在哪個地方,只要能尋找到這些特征,或者找到的這些特征特別多的時候,我們就認為它是一個X。
具體如何尋找涉及到復雜的運算,稱為卷積。大致意思是將原來的數據與設計好的卷積核進行內積,內積就是對應項相乘再相加,然后得出一個特征值,特征值越大,說明它越滿足X的特征。例如,這里的特征值為2,說明左上角的圖形與卷積核接近,若特征值為3,則更接近。
我們通過這種方法逐步尋找,最后得到一張圖,它展示了我們完成卷積后的結果。這個結果告訴我們,在這些部位的特征是2333,表示這些部位的特征非常接近。我們還可以將這作為一個示意圖,將原來的圖像通過卷積核轉換為多個不同的圖像,每個圖像代表一些特征,這些特征組合起來便是我們想要的判斷結果。
還有一個過程叫池化,這個概念更加復雜一些。大致意思是,左上角2、3表示左上角確實具有某個特征,特征2并沒有特征3強,那么可以省略特征2,這樣計算會更簡單一些。總之,我們需要通過卷積抽象出圖像的特征,然后通過池化,可以讓圖形更小一些。池化后,我們進入Sigmoid函數,大意就是決定到底是否向下游進行傳遞。比如這張圖的特征值非常大,就表明特別容易產生一個X,因此,這組神經元可能會向下游傳導。
總的來說,經歷了卷積、池化等步驟,我們就模擬了人眼的機制,本來輸入大量像素點,通過卷積抽象出特征,再輸入到下一層。對于計算機來說,一個人和一只威爾士柯基犬并無區別,但是經過一層一層輸出,計算機就理解了,這堆雜亂的像素點組合出來的是人、桌子、椅子。
6. 算力與數據
最后,跟大家談一談算力和數據。剛才我們提到的主要是算法領域,但人工智能的發展實際上涉及三個領域,算法、算力和數據。顯而易見,人工智能的算法如此復雜,程序員們不可能每次都從零開始編程,就像廚子做菜一樣,不能從種地開始,也不能從煉磚或者燒鍋開始,所以有一些基礎的代碼應該是早已編輯好,可以直接調用的,這就是所謂的人工智能框架。
近幾年人工智能非常熱門,許多大公司都開發了自己的框架。目前較流行的框架有谷歌開發的TensorFlow,以及Facebook開發的PYTORCH。
然而,在別人的框架下進行編程,自然而然受制于人。因此,中國也在開發自己的人工智能框架。你們知道中國自己的框架有哪些嗎?(沉默)看來中國自己的框架還不太流行,所以了解的人比較少。華為設計了一個框架叫MindSpore,百度設計了一個框架叫Paddle Paddle(飛槳),希望有更多的人使用我們自己的框架進行人工智能程序編輯,因為使用人數越多,它才越好用。
有一次我和阿里的算法工程師聊天,他們負責做數據庫。這位工程師就說,如果數據庫不出任何問題,那就非常容易實現,之所以難做,是因為它總出問題,就看你怎么去解決問題。使用的時間越長,問題就越少,數據庫就越成熟。同樣的道理,無論是什么框架,好壞并不重要,關鍵是我們的人員是否使用。只有使用的人越多,才越能解決問題,一個框架的生態才能越成熟。
再來說數據,巧婦難為無米之炊,無論算法多么優秀,如果沒有積極投喂數據,比如通過大量圖片、文本進行訓練,機器就完全無法產生認知。
擁有數據是人工智能非常重要的一個環節。
大家可能不知道,其實我們每個人都為人工智能投喂過數據。比如常見的點擊圖片驗證碼,你可能認為這是為了驗證我是否是一個人類。實際上,這是將數據投喂給計算機進行訓練的免費途徑。訓練數據非常昂貴,ChatGPT花了上百億美元進行訓練。
因為需要購買大量的CPU、GPU、數據、電力,這些都非常昂貴。
前段時間我和微軟的人聊天,他提到谷歌正在推出自己的AI大模型,但無法追上ChatGPT。原因是在ChatGPT開放的那段時間,全世界的人都在用它,提供了大量數據進行訓練,所以它已經遙遙領先于微軟和谷歌。如果谷歌再開發一套模型,沒有人去用,自然就無法再崛起。
因此,人工智能的特點在于使用的人越多,就越智能,如果沒有人使用,即使算法再優秀,也無法實現智能。
人工智能的另外一個重要基礎是算力。人工智能領域所需要的計算難度不大,就是小學計算,加法、乘法。雖然說每個計算不難,但是涉及到數據特別多,計算量非常大。是否應該用CPU處理呢?CPU的特點是什么都能算,就像一個博士;另一種芯片是GPU,它就像1萬名小學生,只會算加法和乘法,但數量巨大。所以當我們面對人工智能的算力要求時,使用GPU會更合適。
世界上做GPU做得最好的公司是哪家?英偉達。沒想到,隨著人工智能時代的來臨,英偉達突然變得很厲害,真正成為這個時代的弄潮兒。其實現在還有一些新的,比如華為正在做NPU,也就是神經網絡處理器,專門用來設計人工智能和神經網絡,它的具體效果怎么樣,我們拭目以待。
小結
人工智能是一種通用技術,能夠讓計算機完成許多繁重工作,極大地解放生產力。AI也是一種根技術,它能夠衍生并支撐多個技術簇,持續地滋養和刺激整個技術簇的發展。
在歷史上發生過幾次工業革命,每一次工業革命都會有技術突破。
比如第一次工業革命是牛頓力學、經典熱力學取得了突破,瓦特就改良了蒸汽機,把人類帶入蒸汽時代。第二次工業革命發生在19世紀末和20世紀初,法拉第發明了發電機,人類進入電氣時代,美國成為世界第一強國;20世紀中葉,由于電子技術和計算機技術的發展,人類迅速進入了電子時代,這便是第三次工業革命,使日本成為世界第二發達的國家。
因此,英國、美國和日本實際上都是通過工業革命成為世界一流強國的。
雖然中國在前三次工業革命中沒有趕上,但現在,世界正處于以互聯網、人工智能、新材料和生物技術等為代表的第四次工業革命中,這一次,我們希望中國人不要缺席,同時也希望我們的民族企業能這些方面發力。這就要拜托在座的企業家和小朋友們一起努力。好,今天我就講到這里,謝謝!
Q&A環節
觀眾:如果當人工智能發展到一定程度,它取代了大量重復性、較低端的工作,那個時候會不會首先造成大家的失業?當失業發生的時候,對于社會發展是積極還是消極的影響?
李永樂:這個問題當然都是有兩面回答的,有很多人持悲觀意見,認為人工智能終究有一天會替代人。馬斯克就說過這樣的話,碳基生命只不過是硅基生命的一道程序,當有一天我們人類不存在時,人工智能替代人類繼續生存下去。
當然也有一些人持有樂觀的看法。他們就認為,人工智能只是一個工具,它雖然可以消滅很多行業,但是也會創造很多新的行業。就像現在互聯網發達之后,很多行業消失了。但是外賣、網約車等行業都是新興的,這樣一來,很多人都會涌入新的行業。這是一種比較積極樂觀的理解。
我個人相對折衷。有悲觀的情緒,因為人工智能終究會超過人類,這是100%確定的。但是在人工智能超過人類,把人類毀滅之前,那些控制人工智能的人,可能就已經把世界毀滅了。
我覺得更要防范的是一家公司,或者一個人利用人工智能,把整個世界毀滅,這比人工智能本身更可怕。在樂觀方面來講,它一定會創造出很多新的行業,不會讓所有人都失業,我個人覺得短時間內,還會持續過去的情況。
觀眾:您覺得人工智能是需要較少量、但是素質比較高、經驗比較豐富的人才;還是需要大量的掌握一般專業技能的人才?整個行業的人員包容量有多大?
李永樂:這個問題真的是看不太準,你說人工智能的行業到底需要多少人才?這涉及一個問題,如果需要大量的人才,我們就可以在高考時報考?如果人員很容易飽和,我們就不能報考了,回答這個問題責任很重大。
我個人覺得,人工智能還是需要很多人才,就像20年之前,計算機是一個風口,現在計算機飽和了嗎?實際上到現在也沒有飽和。
我覺得人工智能是未來20年發展的新方向,它有很多細分領域,我們不一定都要去編計算機程序,也可以去研究算法、芯片、數據等等層面,甚至可以研究應用,比如說利用人工智能來輔助醫療診斷,這都是需要人才的。我認為這個行業很大,一定可以容納很多很多的人,學好數學,或者學好人工智能,對我們的未來很有幫助,不用太擔心人才容量的問題。
觀眾:您剛才演講當中談了很多生態的重要性,以及先發優勢在人工智能領域特別重要,我們看到從AlphaGO到ChatGPT,西方的公司在生態上非常強,在產品設計上非常強,我們在這個方面應該怎么做?您怎么看待這個問題?
李永樂:我的看法是,西方很多公司做事情比較持續。他們做一件事可能真的持續好多年,比如說波士頓機器人公司,持續40年去做一個機器人,就為這一件事,就可以把事情做得比較好。OpenAI也是,可以持續7-8年就做一件事情,可以做很久。
但是我們的公司是不是變化太快,總是去搶風口。這個風口來了,我們做這件事,另一個風口來了,我們做那件事,變來變去,可能每件事都沒有做好。
是不是我們的企業應該想一想,尤其是一些特別大的企業,確實應該用較長時間去深耕一個東西,這樣才有可能一鳴驚人。如果不停地去跟著別人搶風口,可能臨時會賺一桶金,但永遠跟著別人走,是沒有辦法產生先發優勢的。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。