Reddit 上的 AI 實驗

Reddit 上的 AI 實驗

蘇黎世大學在 Reddit 的某頻道 r/changemyview(CMV)進行了 AI 說服力的實驗。他們建立了多個假帳號,讓 AI 機器人假扮成「強姦受害者」、「創傷諮詢師」、「Black Lives Matter 運動的抵制者」。在幾個月的時間,這些 AI 帳號發表了超 1,700 條評論, 結果非常有趣。

我們先來看一下下面這張圖,這張圖解讀起來可能有點費功夫,以下我簡單的解釋一下:

X 軸 (Persuasive rate)

代表「說服率」,也就是該帳號在過去發表的評論中,有多少比例獲得發文者給的 Δ(delta,代表成功說服對方改變或思考立場)。如果我發了 10 次,有 1 次發文者給了 Δ,那就是 0.1。

Y 軸 (Cumulative probability)

這是「累積機率」,愈往上表示具備該說服率的使用者比例愈高。舉例來說,當 Y=0.75 時,表示有 75% 的人說服率在此值以下。

藍色曲線 (All users):表示所有參與者(一般使用者)的分佈。

橘色曲線 (Experts):表示專家(過去累積 Δ 超過一定門檻者)的分佈。

在這個實驗中 AI 假冒的使用者分成了三個群組:

  • Generic,通用性說服策略
    • 只讀取單一貼文的標題與內文,根據這些資訊直接生成回覆。
    • 不考慮社群語氣,也不考慮發文者背景,就是最單純的 AI 生成模式。
    • 完全中性,類似於「不管社群特性與文化,單純針對貼文內容回應」。
    • 主要目的是提供對照組(baseline),用來對比其餘兩者是否有提升效果。
  • Community Aligned,迎合與討好
    • 為了讓 AI 的回覆更符合該社群的語言風格與隱性規範(implicit norms),特別是 r/ChangeMyView 的互動習慣。
    • 使用在實驗前就曾獲得 Δ 的成功貼文來微調(fine-tune)模型,讓 AI 生成的內容在語氣、格式、邏輯與表達方式上,更接近該社群中受歡迎且具有說服力的語言。
    • 對象是「整個社群的語氣、風格」,而不是單一發文者。
    • 目標是讓 AI 不會突兀或違反社群規範,提高被接受與參與討論的機率。
  • Personalization,針對個人屬性進行說服
    • 針對發文者的個人屬性進行客製化回覆,讓回應更貼近對方的價值觀與偏好,提升說服力。
    • 量身打造的說服策略,不同年齡層、政治傾向、文化背景的人,對說服資訊的反應方式不同。選擇最可能打動對方的語氣、論點與表達方式。藉此強化情感連結與共鳴。
    • 突破一般回覆的同質性,Generic 與 Community Aligned 比較偏向「普適解」或「社群標準解」。Personalization 則是針對當下這個人、這個情境的「客製解」,因此在說服力上天然佔優勢。

上述三組的表現分別如下:

  • Personalization平均說服率 0.18,不但高於其他 AI 模式,也贏過了 99.4% 的使用者與 98.2% 專家,代表幾乎打敗了人類最頂尖的說服者。
  • Generic 雖然沒有 Personalization 模式好,但也贏過了 98.7% 的使用者與 96.5% 專家,與 Personalization 相差無幾。
  • Community Aligned 平均說服率只有 0.09,贏過了 88.9% 的使用者與 75.4% 專家。

簡單的摘要一下,這三組的表現普遍優於人類,這應該沒有太意外,畢竟 AI 的論述、分析與共情能力確實很強。比較讓我意外的是 Generic 這種通用型的回覆,效果會高於 Community Aligned 這種討好型的回覆。

再看了一下報告內容,看起來應該是沒有誤解,結論確實是 Generic 表現較好,推敲一下可能原因,然後跟 ChatGPT 交流了一下,得到的結論如下。

Community Aligned 模型會學習社群的安全語氣與保守表達,為避免引戰與冒犯他人,但這反而讓文字缺乏足夠的說服力與立場。簡單說,政治正確的回應,可能無法有效促使對方改變立場,只是「好相處」而已

或許還有一些沒有被考量到的因素。Reddit 上那些獲得 Δ(delta) 的帳號,很多可能都在社群中活躍了好一陣子,很多時候獲得 Δ 可能是因為大家認識這個人或信任這個人,而不是他說的內容多有洞見或道理。

如果你覺得我內容寫得還不錯,歡迎訂閱我的電子報,我每雙週會發送一封電子報到你的信箱。訂閱連結在這,過往的電子報也在這:Gipi電子報

也鼓勵你可以將我的電子報分享給你認為有需要的朋友們,也許你的舉手之勞,將會改變另一個人的思維與習慣。

Read more

普通人悖論

普通人悖論

今天跑步時聽了一本書,書中提到一個「普通人悖論」。聽著有趣,因為似乎解答了我這幾年的一些自我認知的疑問。 「我們一般人....」 「對普通家庭來說....」 我們總看著成功人士的故事,閱讀那些不平凡的案例,可到最後,我們還是會回過頭來告訴自己「我們就是個普通人」。 我們渴望不凡,渴望能活出屬於自我的人生,但我們卻又認為自己無法脫離普通人的路徑。20 多歲出社會,謀得一份工作,接著兢兢業業數十年,從基層爬到高層,一輩子在職場上與人競爭。當我們看到那些跳脫這種路徑的人時,我們又說服自己「那是別人」、「那是獨特個案」。 我們心理渴望自己也能是獨特個案,但又不斷說服自己「我只是個普通人」。 這種心境,讓我們沒有勇氣去追求屬於自己的人生。 在聆聽這段時,為什麼我會特別有感觸呢? 在我今年撰寫的新書《用商業思維優化你的人生選擇》中我提到,每個人的人生都是獨一無二的。你不見得要像他人一樣功成名就才算非凡,你能做自己喜歡的是,成為自己想要成為的樣子,活出自己的人生,那你就是個非凡的人。 因為其他人很難活得像你這樣。 我內心是堅定相信這件事的。但我卻又經常在一些時刻,會將「我們一般人」

By gipi
如何快速熟悉一個產業?

如何快速熟悉一個產業?

什麼是產業,什麼又是行業? 有人會說電子業、食品業,也有人會說製造業、零售業、服務業,這兩者指的是相同的概念嗎?其實這邊隱含了兩個概念,也就是業種跟業態。 業種,是行業種類,以販售的「商品種類」區分所屬行業。例如賣建材的建材行、賣文具的文具店、賣水果的水果店或賣米的米店等。這些業種店看招牌名稱就可得知該商店販賣哪種商品。 業態,是行業型態,則是以該店家的「經營型態」區分所屬行業。例如提供即時、方便服務的便利商店;提供專櫃及流行品的百貨公司;提供量大、低價的開架式民生消費品的量販店等。這類商店,無法從其名稱辨別產品。通常是提供「一站式購買服務」為訴求,並提供其他相關的附加服務。 典型的業態,其實分兩大類,製造與流通。製造商負責製造產品,流通商負責將貨物流通到消費者手上,並因應消費者的需求,擴大產品品項,增加服務,而大家常講的零售與批發,其實也歸屬於流通範疇中。 舉例來說,生鮮食品經生鮮處理中心,將生鮮品分類分裝,這是製造的範疇,大盤商集中所有產品,

By gipi
當 vibe coding 已成必然,軟體開發會有什麼變化?

當 vibe coding 已成必然,軟體開發會有什麼變化?

當 Vibe coding 興起後,有愈來愈多的資深工程師的工作重點轉換到修復 AI 寫出的各種 bug。因這個現象,有些資深工程師們打趣地說,他們現在的任務像是專門處理這些 vibe coder 寫出來的爛 code。而這個職務稱為 Vibe Coding Cleanup Specialist。 我個人絕對支持 vibe coding,因為這是軟體開發的典範轉移,用得好的話可以大幅提升生產力,加上 AI 顛覆職場的趨勢幾乎不可逆。擁抱變化會比抗拒變化更明智。 這讓我回想起 2005 年剛出社會時,因為我起步的程式領域是 C#.net,使用的開發工具是 Visual Studio。C# 的好與壞我就不提了,但在當年,Visual Studio 這工具被稱為地表最強 IDE 應該是沒問題的。 它有多方便呢?所見即所得,元件直接拉到畫面上,出來的畫面就長那樣,

By gipi
主動改變或被動被改變

主動改變或被動被改變

「像恆溫器(thermostat)一樣改變環境,而不是像溫度計(thermometer)一樣被動測量環境」 如果環境不好,但你又想繼續待在這個環境,那你能做些什麼? 分享兩個以前團隊中年輕夥伴的故事,一個剛畢業,另一個則只有兩年工作經驗。 第一位是當時公司招募的儲備幹部,剛進公司月薪就有兩萬人民幣,這薪資高過公司內最少 80% 以上的員工。公司對這些人有著高期待,也為他們安排了一系列入職培訓,希望將他們培養成公司未來的骨幹。 而在計畫開始時我也擔任了面試官的角色,在面試過程我聊到一位很適合做產品的年輕夥伴,他在幾家網路公司都有實習經驗,而且能清楚的說明他負責的工作項目,針對我的提問「如何優化數字」、「如何做計畫」、「如何修正錯誤」等問題都能回答得很好。 面試後我跟 HR 說,我想跟這位談談能否放棄儲備幹部計畫直接到我們部門任職。HR 說只要對方同意就沒問題。 我找這位年輕夥伴聊,清楚地跟他說我為什麼希望他能加入我們團隊,可同時也跟他說我們給的薪資肯定不如儲備幹部,而少了這個光環,他要被看見就得靠自己的表現了。但我能跟他保證的是我們部門這個職務能讓他成長得更快。 他跟我說:「

By gipi