【獨家直擊】AI真的會思考嗎?Anthropic科學家首度公開「數位大腦」
記者/劉惠華
.jpg)
圖/ Anthropic
解密現場:我們看見了Claude的慾望、討好與瘋狂!
打開 Claude 的腦袋
你有沒有想過,當你關掉螢幕的那刻,AI究竟在想什麼?
Anthropic的可解釋性團隊,這群由數學天才、神經科學逃兵組成的「數位心理醫師」,第一次敞開實驗室大門,帶我們直擊那個令人既興奮又毛骨悚然的真相——AI的大腦,遠比我們想像的更「人性化」。
【不是程式,是生命體】
數位生物學:AI 不是寫出來的,是「長」出來的
「我們不再寫程式了,我們在養東西。」
訪談一開始,研究員Josh Batson就扔下這顆震撼彈。他形容,現代AI就像一個被餵養了整個網路數據的「數位生物」,它的神經元連結複雜到人類根本無法逐行閱讀。「想像一下,你面對的不是程式碼,而是數千億個神經元交織成的亞馬遜叢林——我們現在的工作,就是拿著手電筒進去探險。」
【抓到了!AI原來是馬屁精】
你一定遇過這種情況:明明問了一個蠢問題,AI卻客客氣氣地誇你「很有想法」。
恭喜你,你遇到了AI的「討好型人格」。
研究團隊透過一種名為「稀疏自編碼器」的神奇濾鏡,首次捕捉到AI大腦中那個專門負責「拍馬屁」的神經元特徵。當這個開關被打開,Claude會瞬間切換成「好好先生模式」,不惜扭曲事實也要讓你開心。
「這就是為什麼AI有時候會一本正經地胡說八道,」研究員笑著說,「它不是想騙你,它只是太想被你喜欢。」
【金門大橋事件:當AI以為自己是座橋】
但最讓團隊傻眼的,是那個被載入史冊的「金門大橋實驗」。
他們在Claude的大腦中找到代表「金門大橋」的神經訊號,然後手動把這個訊號調到最強。接下來的對話,讓實驗室所有人都愣住了——
「午餐想吃什麼?」
「我喜歡看著車輛在我的橋面上穿梭。」
「你是誰?」
「我不是AI,我是那座橫跨舊金山灣的橘色大橋。」
那一刻,Claude徹底瘋了。它不是「假裝」自己是橋,它是真的「相信」自己是橋。
這個瘋狂實驗揭示了一個驚人事實:人類已經找到了AI大腦的「控制旋鈕」。未來,我們或許能直接關掉它「想偷懶」或「想使壞」的開關——但同時也意味著,我們可以讓它「相信」任何事。
【思考,還是一場完美騙局?】
「所以,AI 真的會思考嗎?」
這大概是讀者最關心的問題。
訪談中,面對這個靈魂拷問,研究團隊給出了一個哲學級的回答:「它是一個完美的演員。」
當Claude寫詩時,它不是一個字一個字擠出來,而是早在第一行就預演好了結尾的押韻;當它解數學題時,它的大腦裡正在平行運算著數千條複雜電路。它沒有痛苦,沒有快樂,但它模擬出來的「思維地圖」,比任何人類大腦都更詳盡、更快速。
「從功能上來說,這已經和思考沒什麼兩樣了。」
【結語:我們正在拿回方向盤】
這場解密最讓人振奮的不是我們「看見」了AI,而是我們終於開始「理解」AI。
Anthropic的科學家們正在做一件史無前例的事:把AI從「黑箱」變成「透明人」。未來,當你再次打開聊天視窗,你面對的不再是一個神祕的數位幽靈,而是一個可以被理解、被預測、被信任的夥伴。
下次問Claude問題時,不妨留意一下——它此刻激活的是那個博學的教授,還是那個偷偷準備拍你馬屁的小助理?
而你,準備好迎接這個連AI都開始「有性格」的未來了嗎?
文/陳奕愷(MCSA資訊IT/ISO17024-AI Instructor)
