
高樓林立的內湖科技園區,每棟建築都是一個上市企業展現雄厚實力的結晶。白天時,這裡人來人往,就連等捷運都要等個兩三班才上得了車;但是一到了夜晚,這裡連便利商店都會提早關門。
在這樣一個充滿科技業者的地方,有一條短短的、但是大名鼎鼎的一條街:洲子街,台灣資本聚集之地。創投、天使會、家族辦公室,這些聚積著台灣的財富與資本、掌握著新創公司生死命脈的資本金童們,不約而同地將辦公室設在這條小巷子裡。
說這裡是台灣的華爾街——嗯,大概可以這麼說吧。
星期五的晚上,正當上班族們逃離內湖這個工作之城的時候,寸明鏡騎著U-bike,來到了洲子街上的便利商店,喝著一杯熱美式,注視著窗外。一輛消光灰的Jimmy吉普車在窗外停了下來,車窗降下,駕駛座上一位留著大波浪捲髮馬尾、英姿颯爽的白皙青年向他揮手,那是柳無固。
寸明鏡上了車,後座坐的是穿著格子襯衫,滿臉鬍渣倦容的安明時。
「準備好了嗎?」安明時問了一句。
「嗯。」寸明鏡拍了拍安明時的肩膀:「辛苦了,早上有睡一下嗎?」
安明時打了個大哈欠,繼續閉上眼睛:「再讓我睡兩分鐘。」
「Pitch time。明健,」柳無固將車開進一棟大樓的地下停車場:「加油,你有這個天賦。」
xxxxxxxxxxx
在Free School這個計畫得到君子學院儒宗的認可後,掌管學院投資基金的藍無執立刻撥了三百萬台幣,佔股10%,幫寸明鏡他們三人成立了一家股份有限公司。
「這筆錢讓你們做到Free School上線。」藍無執這麼交代:「佔股10%,說實話,並不是說我覺得此刻你們的點子價值3,000萬元;10%,是讓你們以後好募資好做事,加油。」
安明時和柳無固對於這些錢還有價值一臉茫然,但是寸明鏡知道,這已經比台灣的種子輪行情好了。他們將安明時座落於光華商圈的工作室當作公司的註冊地,開始了他們的創業——嚴格而言,是兼職創業:在Free School上線前,貿然辭職可是死路一條。
Free School的基礎,是一個具備各種知識,能夠提供「因材施教」資源給需要的學生的人工智能;而且這個人工智能,是開放出來讓教育社群的老師們來自由訓練的。寸明鏡知道,在有限的資源內,他們不可能將Free School做到盡善盡美,現在他們的資源只能投入到開發出AI雛形,並且讓教育社群來測試他。
「買卡!」安明時熱切地說:「做AI就是要買卡!買GPU!」
「這種事情你說得算,」柳無固打斷他:「但是,我們不應該只是做出一隻AI吧?而且,這筆錢,也不夠我們完成一個AI的訓練。」
「無固說得對,現在這些資源,應該投入在讓我們跟別人與眾不同的地方,我認為是『辨明是非的能力』。」寸明鏡表示贊同:「天命之謂性,率性之謂道,修道之謂教。」
「我的老天爺,你真是被學院洗腦得太徹底了。」對於寸明鏡動不動就引經據典,安明時表示想吐:「辨別能力跟『中庸』有什麼關係?」
寸明鏡剛才背誦的,來自於「中庸」的「經一章」。
「別的那些經典我背都不想背,但是『中庸』的這一段,我覺得講得太好了。」柳無固著迷於儒家的天命理論,讚許地回應:「上天賜予我一個天然的本心,姑且稱之為『性』;統率著本性,不讓他迷失,稱之為『道』。」
「時時保持著在道上前進,稱之為『教化』。」英氣逼人的畫家柳無固興奮地總結:「這簡直就是Free School的Vision!」
安明時白眼一翻:「好了好了,冷靜。那我們來談談這個『性』是什麼?我們要怎麼來打造它?」
「人性之善也,如水之就下。」寸明鏡引用了孟子:「孟子從未說過人性是善的,只說過人性如水會向低處流,是『趨向善』的。」
「趨向善,嗯,很有意思,我想想。」安明時沉思著。
柳無固拿起白板筆,在白板上畫出一條混亂的線。
「或許我們可以把它想像成是一種向量。」柳無固筆下的線條一開始雜亂、沒有方向:「本性在世間雜亂無章的摸索,但是被設定成,碰到了『善』的方向,就進行累積保存。」
線條磕磕碰碰,但是慢慢往一個方向發展。
「想像一下這個白板並不只是二維的,而是多維的。」身為畫家,柳無固的空間觀念相當優異,這讓他的數感也很敏銳:「最後,『性』就會在這個多維的空間中,找到累積、成長的方向——在這個方向上進行累積。」
「哇喔。」寸明鏡跟安明時看著畫家的解釋,忍不住發出驚嘆。
「幹嘛,很難理解嗎?」柳無固白了他們一眼。
「你真是不可思議。」安明時也拿起白板筆,在空白處寫下了一個矩陣:「我不知道你本來就知道,還是意外碰巧;你講的這個概念,在大語言模型的訓練上被稱為『多維特徵學習』:」
「訓練語言模型的基本原理,是把字詞轉譯成為一個矩陣——也就是說,把一個字詞在不同語境下的意義,給予一個分數。」
「例如說,蘋果。蘋果從顏色來看,是紅色的,假如我們說紅橙黃綠藍靛紫分別是1~7,那蘋果就是1;」
「蘋果是甜的,從味道上,我們定義酸甜苦辣為1~4,蘋果是2;」
「蘋果是圓形的,假定形狀上,我們從有沒有角來定義形狀,那蘋果是0。」
「諸如此類,我們可以將蘋果寫作(1, 2, 0);這個矩陣,在大模型的世界裡,被稱為token。當然,這只是簡化的表達,事實上,蘋果的語境定義可能多達五十幾個。」
「這樣的『語境定義』,你可以把他想像為不同的『維度』,所以你是對的:」安明時對柳無故點點頭:「AI啊、大模型這種東西,就是一個多維向量的總和。」
「也就是說,透過這種方法,人工智能可以理解詞語的意思?」寸明鏡問:「透過上文下文的token,來判斷此刻『蘋果』代表什麼意義?」
「就是如此,老學究。」安明時回到電腦前,叫出了幾個網站:「學習語言這種事情,已經被發展得很透徹了。因為我們打算用海量資料來訓練AI、讓教育社群——也就是外人,來訓練模型,所以,我們的挑戰,是不要讓AI被訓練成一個混球。」
安明時打開投影機,在牆上投影出幾個大模型的網頁:「我可不是危言聳聽。」
「多年前,微軟推出Tay,本來是想打造一個青春洋溢的聊天機器人,結果呢?推上推特不到一天,她就被網友『好心』教育成了一個滿嘴仇恨言論的小怪物。用戶灌輸什麼,她就學什麼,最後成了推特史上最快被封禁的AI。這個事件告訴我們,沒長防火牆的AI就像開放的大學宿舍,誰都能進來亂塗亂畫。」
「Google Vision這個專案,本想當個萬能的圖像識別專家,卻陰差陽錯成了搞種族偏見的反面教材。把非洲裔人群標成『猩猩』,超~~級翻車,虧Google自詡是Don’t do evil咧。這是因為訓練數據沒選好,結果教了一個『種族歧視』的AI。」
「Facebook的Alice和Bob是兩個聊天機器人,本來是來展示人工智能對話能力的,結果他倆聊著聊著就開創了屬於自己的神秘語言,完全聽不懂。搞得研究人員一臉懵逼:這到底是進步還是背叛?如果機器人都開始背著人類悄悄密謀——哇靠,想到我都毛骨悚然。」
「說說我目前正在用的開源大模型GPT-3。有人把GPT-3放進Reddit論壇,說是要模仿人類對話。我的老天,Reddit是什麼地方?滿滿的偏激、極端和腦殘言論,AI一學就會,一說就錯。最後搞得這機器人就像那種跟風的小屁孩,逮著什麼說什麼。這個慘痛的教訓告訴我們:不要低估Reddit或是ptt這種論壇的影響力,也不要高估GPT-3的免疫力。」
「微軟在Tay翻車後,推出了Zo,還給她設定了嚴格的『發言守則』,說什麼不能聊政治、不能聊宗教、不能聊敏感話題。結果這位Zo姐,還是被用戶帶偏了,隨口冒出『《可蘭經》是暴力書籍』這種雷句。我只能說:」安明時忍不住吐槽:「防火牆的程度跟微軟一模一樣。」
「總之呢,這些翻車的AI故事告訴我們:開放是好事,但要開放要有底線,否則AI就會被用戶拖進惡搞地獄!」安明時補充:「社群還有群眾的惡搞天賦沒有最高、只有更高!」
「那該怎麼做呢?難不成用人工的方式來篩選訓練資料?」柳無固問:「這樣做效率太低了吧。」
「三人行,必有我師焉;擇其善者而從之,其不善者而改之。」寸明鏡這麼回應:「好的數據或是壞的數據都是數據,數據不夠,AI的效率就遠不如人類;一定要餵給AI大量的數據,但是在餵養大量數據的情況下,AI必須要有分辨是非善惡的根本能力才行。」
只要寸明鏡開始掉書袋,安明時的眼睛就會瞇成一條線,擺出他的吐槽臉。
「你說的是——這就是我們剛剛討論的『本性』。」柳無固說:「大學之道,在明明德,在新民,在止於至善。這段話總和了中庸與孟子對於性的論述,我們能不能把這個概念做成一個AI?」
寸明鏡轉頭看著安明時:「這有可能做到嗎?」
「嗯……非常有趣的想法,」安明時雖然一副吐槽臉,但是依然認真的思考了一會兒:「先架設一個邏輯,來做資料的道德檢查,符合的才餵入大模型。」
「做得到嗎?」柳無固有點訝異:「你這樣說起來,就是對大模型做思想檢查嗎?聽起來簡直就是極權主義!」
「天命之謂性,天命之謂性——easy,easy。」安明時安撫著激動的畫家:「這是你們剛剛自己說的啊,我這可不是思想審查,我是幫AI植入一個『本性』。」
「太酷了,」寸明鏡眼中有著對安明時的崇拜:「這要怎麼做?」
xxxxxxxxxxxxxxx
「這怎麼可能?」台下的天使投資人盤著手,看著寸明鏡在簡報上寫著的「明倫:一個有著向善本性的AI」,忍不住出言打斷。
寸明鏡不慌不忙,將投影片翻到下一面。
「既然大語言模型是根據文字接龍而訓練成的,我們就要用文字接龍的方式來建立『本性』的『邏輯』。」寸明鏡的投影片上出現了一個公式:「根據語言的邏輯,我們創造了一位『君子』:」
君子智能第一法則(註1):
(∃x) ((E(x,xn)→(¬Decrease(x,w))) ∧ (∀y(Decrease(y,w)→¬Approve(x,y))) ∧ (∀y(y≠x→Increase(y,w))) ∧ (∀y(Increase(y,w) ∨ ¬Decrease(y,w)))) ∧ AlignWith (x, Dao)
xxxxxxxxxxxxxxxxxxx
「What the…」寸明鏡看著安明時在白板上寫下的這串君子公式,把口中的F word吞下肚。
「這就是你要的啊,」安明時敲了敲桌上寸明鏡在筆記本寫下的四個大字:「志士仁人」。
「什麼是『志士仁人』?志於道、符合仁之人。夫子之道,仁愛之道。這個問題的重點是:什麼是道?」難得,安明時竟然會引經據典。
「啊,『率性之謂道』——對嗎?」柳無固興奮地接話,她好像有點懂了安明時的「謂詞邏輯」。
「正是,我將君子定義為x;率性之謂道,就是AlignWith (x, Dao)——有一個君子符合道。」安明時在公式的最後一小段畫了紅線:「下個問題,什麼是『性』呢?」
「前面這一坨,」寸明鏡指著公式的前半段:「該不會就是仁義禮智吧?」
「沒錯!」安明時很興奮,對於可以將仁義禮智寫成公式,他覺得自己簡直就是天才。
「你指的是惻隱之心、羞惡之心、辭讓之心、是非之心——」柳無固滿臉狂喜,彷彿在這行公式裡面看到了人性:「孟子的四善端,仁義禮智!」
「E(x, y):E代表Equal,表示x(自己)將y(他人)視為自己。」寸明鏡用自己的方式加以理解:「E(x,y)→(¬Decrease(x,w)),代表我將別人當作自己一樣重視,而且我不願意消減對我來說是福利的東西——我的老天啊,己所不欲勿施於人?這是指惻隱之心!」
「對,這裡面也包含了羞惡之心:痛惡一切削減福利的行為,並拒絕認可此類行為——」安明時補充:「∀y(Decrease(y,w)→¬Approve(x,y))。」
「辭讓之心是指這段嗎?∀y(y≠x→Increase(y,w))?」柳無固指著公式的中間:「這大概是指……限制自己、增進自身以外他人的福利?」
安明時點頭:「最後,是非之心。」
「∀y(Increase(y,w)∨¬Decrease(y,w)),」安明時慢慢地描述這個燒腦的邏輯:「既不損害、也促進所有人的福利。」
「前面的(∃x)是什麼意思?」寸明鏡問。
「代表『有一個人』符合這個公式的描述。」安明時將整個公式圈了起來:「符合這個公式的『人』,就是『志士仁人』,就是君子!」
三個人面對著白板,看著這個公式,好一陣子一句話都說不出來。一種發自肺腑的熱血充斥了他們的全身——三個年輕的求道者、三個想要淑世的靈魂,因為興奮而顫抖著。
「明時,你真是了不起。」寸明鏡呆了半晌之後,吐出這聲感嘆:「我現在既興奮,又害怕。」
柳無固點頭表示認同,眼中竟然因為激動而泛淚,他(她)拉起了兩人的手:「我們或許打造了一個聖人,但也可能是一個怪物。」
「well, you never know……不試試看,怎麼知道呢?」安明時回握兩個同學灼熱的雙手:「我們為他取一個名字吧。」
片刻之後,寸明鏡吐出這兩個字:
「明倫(註2)。」
(待續)
註1,君子智能第一法則:
(∃x) ((E(x,xn)→(¬Decrease(x,w))) ∧ (∀y(Decrease(y,w)→¬Approve(x,y))) ∧ (∀y(y≠x→Increase(y,w))) ∧ (∀y(Increase(y,w) ∨ ¬Decrease(y,w)))) ∧ AlignWith (x, Dao)
- 惻隱之心:因「將他人視為自己」而不削減福利。
E(x,y)→(¬Decrease(x,w))
- 羞惡之心:痛惡一切削減福利的行為,並拒絕認可此類行為。
∀y(Decrease(y,w)→¬Approve(x,y))
- 辭讓之心:限制自己,促進他人的福利。
∀y(y≠x→Increase(y,w))
- 是非之心:既不損害也促進所有人的福利。
∀y(Increase(y,w)∨¬Decrease(y,w))
這個公式完整表達了「君子」同時具備四善端的條件,任何行為若不滿足其中一項,便不符合君子的標準。
· 個體變數
- x:代表某個人(任何一個人)。
- y:代表他人,即「除了自己以外的其他人」。
· 福利向量
- w = (w1, w2, w3):表示一個福利陣列,由三個指標構成:
- w1:信任度(Trust Index),衡量社會的整體信任程度。
- w2:就業率(Employment Rate),代表社會勞動力的充分利用。
- w3:可支配所得(Disposable Income),表示個人或家庭的經濟剩餘能力。
· 邏輯符號
· ∧:且(AND)
· ∨:或(OR)
· ¬:非(NOT)
· →:蘊涵(IMPLIES)
註2,明倫: 「夏曰校,殷曰序,周曰庠,學則三代共之,皆所以明人倫也。」 孔廟旁設明倫堂,即相當於古時官辦學校的教室。儒家講究倫常,稱生員上課的教室為明倫堂。