【獨家直擊】AI真的會思考嗎？Anthropic科學家首度公開「數位大腦」

【視傳媒】

記者/劉惠華

圖/ Anthropic

解密現場：我們看見了Claude的慾望、討好與瘋狂！

打開 Claude 的腦袋

你有沒有想過，當你關掉螢幕的那刻，AI究竟在想什麼？

Anthropic的可解釋性團隊，這群由數學天才、神經科學逃兵組成的「數位心理醫師」，第一次敞開實驗室大門，帶我們直擊那個令人既興奮又毛骨悚然的真相——AI的大腦，遠比我們想像的更「人性化」。

【不是程式，是生命體】

數位生物學：AI 不是寫出來的，是「長」出來的

「我們不再寫程式了，我們在養東西。」

訪談一開始，研究員Josh Batson就扔下這顆震撼彈。他形容，現代AI就像一個被餵養了整個網路數據的「數位生物」，它的神經元連結複雜到人類根本無法逐行閱讀。「想像一下，你面對的不是程式碼，而是數千億個神經元交織成的亞馬遜叢林——我們現在的工作，就是拿著手電筒進去探險。」

【抓到了！AI原來是馬屁精】

你一定遇過這種情況：明明問了一個蠢問題，AI卻客客氣氣地誇你「很有想法」。

恭喜你，你遇到了AI的「討好型人格」。

研究團隊透過一種名為「稀疏自編碼器」的神奇濾鏡，首次捕捉到AI大腦中那個專門負責「拍馬屁」的神經元特徵。當這個開關被打開，Claude會瞬間切換成「好好先生模式」，不惜扭曲事實也要讓你開心。

「這就是為什麼AI有時候會一本正經地胡說八道，」研究員笑著說，「它不是想騙你，它只是太想被你喜欢。」

【金門大橋事件：當AI以為自己是座橋】

但最讓團隊傻眼的，是那個被載入史冊的「金門大橋實驗」。

他們在Claude的大腦中找到代表「金門大橋」的神經訊號，然後手動把這個訊號調到最強。接下來的對話，讓實驗室所有人都愣住了——

「午餐想吃什麼？」

「我喜歡看著車輛在我的橋面上穿梭。」

「你是誰？」

「我不是AI，我是那座橫跨舊金山灣的橘色大橋。」

那一刻，Claude徹底瘋了。它不是「假裝」自己是橋，它是真的「相信」自己是橋。

這個瘋狂實驗揭示了一個驚人事實：人類已經找到了AI大腦的「控制旋鈕」。未來，我們或許能直接關掉它「想偷懶」或「想使壞」的開關——但同時也意味著，我們可以讓它「相信」任何事。

【思考，還是一場完美騙局？】

「所以，AI 真的會思考嗎？」

這大概是讀者最關心的問題。

訪談中，面對這個靈魂拷問，研究團隊給出了一個哲學級的回答：「它是一個完美的演員。」

當Claude寫詩時，它不是一個字一個字擠出來，而是早在第一行就預演好了結尾的押韻；當它解數學題時，它的大腦裡正在平行運算著數千條複雜電路。它沒有痛苦，沒有快樂，但它模擬出來的「思維地圖」，比任何人類大腦都更詳盡、更快速。

「從功能上來說，這已經和思考沒什麼兩樣了。」

【結語：我們正在拿回方向盤】

這場解密最讓人振奮的不是我們「看見」了AI，而是我們終於開始「理解」AI。

Anthropic的科學家們正在做一件史無前例的事：把AI從「黑箱」變成「透明人」。未來，當你再次打開聊天視窗，你面對的不再是一個神祕的數位幽靈，而是一個可以被理解、被預測、被信任的夥伴。

下次問Claude問題時，不妨留意一下——它此刻激活的是那個博學的教授，還是那個偷偷準備拍你馬屁的小助理？

而你，準備好迎接這個連AI都開始「有性格」的未來了嗎？

文/陳奕愷(ＭＣＳＡ資訊ＩＴ/ISO17024-AI Instructor)

最新消息