Reddit 上的 AI 實驗

Reddit 上的 AI 實驗

蘇黎世大學在 Reddit 的某頻道 r/changemyview(CMV)進行了 AI 說服力的實驗。他們建立了多個假帳號,讓 AI 機器人假扮成「強姦受害者」、「創傷諮詢師」、「Black Lives Matter 運動的抵制者」。在幾個月的時間,這些 AI 帳號發表了超 1,700 條評論, 結果非常有趣。

我們先來看一下下面這張圖,這張圖解讀起來可能有點費功夫,以下我簡單的解釋一下:

X 軸 (Persuasive rate)

代表「說服率」,也就是該帳號在過去發表的評論中,有多少比例獲得發文者給的 Δ(delta,代表成功說服對方改變或思考立場)。如果我發了 10 次,有 1 次發文者給了 Δ,那就是 0.1。

Y 軸 (Cumulative probability)

這是「累積機率」,愈往上表示具備該說服率的使用者比例愈高。舉例來說,當 Y=0.75 時,表示有 75% 的人說服率在此值以下。

藍色曲線 (All users):表示所有參與者(一般使用者)的分佈。

橘色曲線 (Experts):表示專家(過去累積 Δ 超過一定門檻者)的分佈。

在這個實驗中 AI 假冒的使用者分成了三個群組:

  • Generic,通用性說服策略
    • 只讀取單一貼文的標題與內文,根據這些資訊直接生成回覆。
    • 不考慮社群語氣,也不考慮發文者背景,就是最單純的 AI 生成模式。
    • 完全中性,類似於「不管社群特性與文化,單純針對貼文內容回應」。
    • 主要目的是提供對照組(baseline),用來對比其餘兩者是否有提升效果。
  • Community Aligned,迎合與討好
    • 為了讓 AI 的回覆更符合該社群的語言風格與隱性規範(implicit norms),特別是 r/ChangeMyView 的互動習慣。
    • 使用在實驗前就曾獲得 Δ 的成功貼文來微調(fine-tune)模型,讓 AI 生成的內容在語氣、格式、邏輯與表達方式上,更接近該社群中受歡迎且具有說服力的語言。
    • 對象是「整個社群的語氣、風格」,而不是單一發文者。
    • 目標是讓 AI 不會突兀或違反社群規範,提高被接受與參與討論的機率。
  • Personalization,針對個人屬性進行說服
    • 針對發文者的個人屬性進行客製化回覆,讓回應更貼近對方的價值觀與偏好,提升說服力。
    • 量身打造的說服策略,不同年齡層、政治傾向、文化背景的人,對說服資訊的反應方式不同。選擇最可能打動對方的語氣、論點與表達方式。藉此強化情感連結與共鳴。
    • 突破一般回覆的同質性,Generic 與 Community Aligned 比較偏向「普適解」或「社群標準解」。Personalization 則是針對當下這個人、這個情境的「客製解」,因此在說服力上天然佔優勢。

上述三組的表現分別如下:

  • Personalization平均說服率 0.18,不但高於其他 AI 模式,也贏過了 99.4% 的使用者與 98.2% 專家,代表幾乎打敗了人類最頂尖的說服者。
  • Generic 雖然沒有 Personalization 模式好,但也贏過了 98.7% 的使用者與 96.5% 專家,與 Personalization 相差無幾。
  • Community Aligned 平均說服率只有 0.09,贏過了 88.9% 的使用者與 75.4% 專家。

簡單的摘要一下,這三組的表現普遍優於人類,這應該沒有太意外,畢竟 AI 的論述、分析與共情能力確實很強。比較讓我意外的是 Generic 這種通用型的回覆,效果會高於 Community Aligned 這種討好型的回覆。

再看了一下報告內容,看起來應該是沒有誤解,結論確實是 Generic 表現較好,推敲一下可能原因,然後跟 ChatGPT 交流了一下,得到的結論如下。

Community Aligned 模型會學習社群的安全語氣與保守表達,為避免引戰與冒犯他人,但這反而讓文字缺乏足夠的說服力與立場。簡單說,政治正確的回應,可能無法有效促使對方改變立場,只是「好相處」而已

或許還有一些沒有被考量到的因素。Reddit 上那些獲得 Δ(delta) 的帳號,很多可能都在社群中活躍了好一陣子,很多時候獲得 Δ 可能是因為大家認識這個人或信任這個人,而不是他說的內容多有洞見或道理。

如果你覺得我內容寫得還不錯,歡迎訂閱我的電子報,我每雙週會發送一封電子報到你的信箱。訂閱連結在這,過往的電子報也在這:Gipi電子報

也鼓勵你可以將我的電子報分享給你認為有需要的朋友們,也許你的舉手之勞,將會改變另一個人的思維與習慣。

Read more

AI 學習的悖論

AI 學習的悖論

「AI 讓你看起來更聰明,實質卻有可能學得更少。」 剛剛看到一篇文章談論 AI 對學習的可能傷害,他的參考資料是來自一篇文章《The Myth of Automated Learning》。這篇文章提到一個蠻重要的概念。 當人們使用機器自動執行他們本來可以自己完成的任務時,會發生以下三種情況之一: 1. 他們的技能不斷提高。 2. 他們的技能退化了。 3. 他們永遠學不會這項技能。 這三種狀況分別容易發生在三類人身上: 1. 如果使用者已經是專家,AI 工具可以進一步增強他們的技能。 2. 如果使用者尚未成為專家,而這項技能需要不斷練習,那麼 AI 自動化可能會導致技能退步。 3. 如果使用者是新手,而 AI 從一開始就執行任務,那麼這個人就可能永遠不會真正掌握這項技能。 作者舉的案例是工業時代,那些工匠等級的人,他們的工作被產線工人+自動化機器給大量取代,但這些生產線的工人離開自動化機器後其實什麼都不會。 對這個觀點我一半認同一半存疑,認同的點在於,產線工人熟悉的是機器操作,而工匠擅長的則是不靠機器來完成任務。哪個難度更高?通常是工匠。但從商業角度來思考

By gipi
互聯網女王 Mary Meeker 報告心得(2)-餐飲品牌 Yum Brands 的案例

互聯網女王 Mary Meeker 報告心得(2)-餐飲品牌 Yum Brands 的案例

這幾篇文章都是我觀看 Mary Meeker 2025 年報告後的一些整理跟心得。原始的文件可以參考:https://www.bondcap.com/reports/tai 本篇要聊的話題是在 75 頁看到 Yum Brands 在 2025 年 2 月開始推動旗下餐廳的 AI 化與數位化。 這份報告中可以看到的資料很有限,不過我對餐飲業的現況有點興趣,所以我請 ChatGPT 幫我針對 Yum Brands 使用 AI 的狀況做一些整理,發現一些比預期有趣的資料。 首先介紹一下 Yum Brands 這家公司,因為這名字相信很多人都沒聽過,但說到他旗下的公司大家應該就知道這家公司的規模有多大了。它旗下的主要品牌有以下四個: * KFC(肯德基) 全球知名的炸雞品牌,在 150 多個國家擁有超過 27,000

By gipi
互聯網女王 Mary Meeker 報告心得(1) - AI 的任務,增效優先於降本

互聯網女王 Mary Meeker 報告心得(1) - AI 的任務,增效優先於降本

到今天才有時間把互聯網女王 Mary Meeker 2025 的報告好好閱讀一下,報告的原始網址在此,有興趣的人自行閱讀:https://www.bondcap.com/reports/tai 在報告的 68 頁中我看到了一個很重要的觀念,我結合圖表做說明。 下面這張圖是 BOND 團隊針對 Morgan Stanley 的一份報告作出的整理,這張圖主要強調的是許多大型企業(調查了 400 多家年營收在 5 億美元以上的企業)對 AI 的觀點是放在「營收與事業擴展」上,而非「成本降低」。 以下幾項是被 BOND 團隊歸類在「營收與事業擴展」的項目: Production / Output (提升生產產出) ~70% Customer Service(提升顧客服務品質) ~65% Sales

By gipi
AI 時代我們需要什麼樣的產品經理

AI 時代我們需要什麼樣的產品經理

早上聽 Lenny 專訪 Revolut product head Dmitry Zlokazov 的內容,Revolut 是一家位於倫敦的科技公司,專注於提供金融領域相關的軟體服務。在這個專訪中我聽到幾個很可能是接下來產品經理定位的轉變。 Revolut 在找什麼樣的人來擔任產品負責人?以及如何培養他們成為全球等級的產品負責人? 重視原始智力與飢渴感 在招募時,比起應徵者豐富的經驗,更看重他們的原始智力 (raw intellect) 和渴望打造事物的永不滿足的飢渴感 (unquenched hunger to build things)。有飢渴感的人就算經驗較少,也能快速學習、適應並推動改變並解決問題。 而 Revolut 也更傾向於招募那些處於早期職業生涯 (early in their career) 或具有創業背景的人。 專注於不懈的執行 如果一件事情只完成了 99%,那它更接近 0% 而不是 100%。這包括確保產品不僅僅是開發完成,還需要確保客戶服務、銷售和行銷團隊都能充分利用,否則它可能只是一個無人知曉的無用功能。

By gipi