Reddit 上的 AI 實驗

Reddit 上的 AI 實驗

蘇黎世大學在 Reddit 的某頻道 r/changemyview(CMV)進行了 AI 說服力的實驗。他們建立了多個假帳號,讓 AI 機器人假扮成「強姦受害者」、「創傷諮詢師」、「Black Lives Matter 運動的抵制者」。在幾個月的時間,這些 AI 帳號發表了超 1,700 條評論, 結果非常有趣。

我們先來看一下下面這張圖,這張圖解讀起來可能有點費功夫,以下我簡單的解釋一下:

X 軸 (Persuasive rate)

代表「說服率」,也就是該帳號在過去發表的評論中,有多少比例獲得發文者給的 Δ(delta,代表成功說服對方改變或思考立場)。如果我發了 10 次,有 1 次發文者給了 Δ,那就是 0.1。

Y 軸 (Cumulative probability)

這是「累積機率」,愈往上表示具備該說服率的使用者比例愈高。舉例來說,當 Y=0.75 時,表示有 75% 的人說服率在此值以下。

藍色曲線 (All users):表示所有參與者(一般使用者)的分佈。

橘色曲線 (Experts):表示專家(過去累積 Δ 超過一定門檻者)的分佈。

在這個實驗中 AI 假冒的使用者分成了三個群組:

  • Generic,通用性說服策略
    • 只讀取單一貼文的標題與內文,根據這些資訊直接生成回覆。
    • 不考慮社群語氣,也不考慮發文者背景,就是最單純的 AI 生成模式。
    • 完全中性,類似於「不管社群特性與文化,單純針對貼文內容回應」。
    • 主要目的是提供對照組(baseline),用來對比其餘兩者是否有提升效果。
  • Community Aligned,迎合與討好
    • 為了讓 AI 的回覆更符合該社群的語言風格與隱性規範(implicit norms),特別是 r/ChangeMyView 的互動習慣。
    • 使用在實驗前就曾獲得 Δ 的成功貼文來微調(fine-tune)模型,讓 AI 生成的內容在語氣、格式、邏輯與表達方式上,更接近該社群中受歡迎且具有說服力的語言。
    • 對象是「整個社群的語氣、風格」,而不是單一發文者。
    • 目標是讓 AI 不會突兀或違反社群規範,提高被接受與參與討論的機率。
  • Personalization,針對個人屬性進行說服
    • 針對發文者的個人屬性進行客製化回覆,讓回應更貼近對方的價值觀與偏好,提升說服力。
    • 量身打造的說服策略,不同年齡層、政治傾向、文化背景的人,對說服資訊的反應方式不同。選擇最可能打動對方的語氣、論點與表達方式。藉此強化情感連結與共鳴。
    • 突破一般回覆的同質性,Generic 與 Community Aligned 比較偏向「普適解」或「社群標準解」。Personalization 則是針對當下這個人、這個情境的「客製解」,因此在說服力上天然佔優勢。

上述三組的表現分別如下:

  • Personalization平均說服率 0.18,不但高於其他 AI 模式,也贏過了 99.4% 的使用者與 98.2% 專家,代表幾乎打敗了人類最頂尖的說服者。
  • Generic 雖然沒有 Personalization 模式好,但也贏過了 98.7% 的使用者與 96.5% 專家,與 Personalization 相差無幾。
  • Community Aligned 平均說服率只有 0.09,贏過了 88.9% 的使用者與 75.4% 專家。

簡單的摘要一下,這三組的表現普遍優於人類,這應該沒有太意外,畢竟 AI 的論述、分析與共情能力確實很強。比較讓我意外的是 Generic 這種通用型的回覆,效果會高於 Community Aligned 這種討好型的回覆。

再看了一下報告內容,看起來應該是沒有誤解,結論確實是 Generic 表現較好,推敲一下可能原因,然後跟 ChatGPT 交流了一下,得到的結論如下。

Community Aligned 模型會學習社群的安全語氣與保守表達,為避免引戰與冒犯他人,但這反而讓文字缺乏足夠的說服力與立場。簡單說,政治正確的回應,可能無法有效促使對方改變立場,只是「好相處」而已

或許還有一些沒有被考量到的因素。Reddit 上那些獲得 Δ(delta) 的帳號,很多可能都在社群中活躍了好一陣子,很多時候獲得 Δ 可能是因為大家認識這個人或信任這個人,而不是他說的內容多有洞見或道理。

如果你覺得我內容寫得還不錯,歡迎訂閱我的電子報,我每雙週會發送一封電子報到你的信箱。訂閱連結在這,過往的電子報也在這:Gipi電子報

也鼓勵你可以將我的電子報分享給你認為有需要的朋友們,也許你的舉手之勞,將會改變另一個人的思維與習慣。

Read more

[徵才]方圓國際誠徵兩個新職務

[徵才]方圓國際誠徵兩個新職務

今年四月份,我加入了方圓國際擔任策略長,方圓是一家茶飲連鎖公司,旗下有兩個主要品牌「吃茶三千」與「喫茶小舖」。吃茶三千在海外 30 多的城市有約 130 家門市,喫茶小舖在台灣則約有 60 家門市。 我從去年底開始擔任方圓的顧問,主要協助梳理公司的管理制度、流程與阻礙成長的問題。四月份我轉任策略長,過去這一個多月,我除了 AI 的引入與建置外,我也花了大量的時間重新構思公司的整體策略。 我們進行了「未來十年不變的事」的策略探討,最終設定了十年戰略方向,三年目標,以及 2026 年的關鍵任務。 透過這樣深度的策略思考,我們也藉這個機會盤點了公司目前的人才缺口。 以下有兩個很關鍵的角色是我迫切在找尋的。如果你覺得自己或身邊的人很適合加入方圓,請自薦或推薦給我,謝謝。 歡迎將履歷投遞到:gipi@teashop168.com.tw 門市體驗經理(Store Experience Manager) 門市是接觸終端消費者的最後一哩路,也是品牌傳遞價值的關鍵接觸點。我們在全球因應不同的市場有不同的店型設計,

By gipi
克服 AI 焦慮的方法,唯有實作

克服 AI 焦慮的方法,唯有實作

2018-2019 年左右,線上學習在台灣整個大爆發,線上課程一大堆,每個禮拜都有很多線下學習活動。每天都可以看到大量的學習心得與活動心得,每個人講的內容都很有道理。全台灣好像瞬間變成一個知識島,所有人都學識淵博,而自己似乎懂得有點少。 知識焦慮年代 在那個時候,很多人染上了「知識焦慮」的病症。 害怕別人知道自己不知道的,擔心自己沒跟上世界的節拍,所以哪邊有新知往哪兒去,哪邊學習氛圍濃厚就往哪兒鑽。看起來是因為熱愛學習,但內心的煩惱其實是「害怕失去」。 害怕失去話語權,害怕失去社交談資,害怕失去機會,害怕失去競爭力,害怕自己不再是別人眼中領先的族群。 而克服焦慮最有效的方法,不是知道更多,而是實踐,從時間中獲得成果,獲得進步。 那些仍在學而沒有做的人,焦慮是無法停止的,因為他並沒有真的改變現況。 這也是當年為何我們想舉辦 case study、學習營、打卡、案例練習,並且鼓勵大家多多輸出的原因了。因為輸出,其實就是最輕量的實踐,而動手做,則是讓自己學有所用的基本配備。 在那個知識焦慮的年代裡,因為我本來就熱愛學習,也經常輸出,

By gipi
我如何與 AI 協作開發,我的開發步驟分享

我如何與 AI 協作開發,我的開發步驟分享

昨天到工程師場子分享,想說跟大家對照一下,現在是否多數人都跟我一樣,寫程式完全不手打任何一行 code,全部都是 AI 做的。 結果發現,現場只要有在用 AI 開發的人,多數時候真的都是讓 AI 來完成程式撰寫工作。 目前我的開發組合是 Claude Code / Claude Design / Fly.io / Github / Cloudflare,其他還有根據程式功能需要而使用的第三方元件。 做一個新系統的習慣是: 1. 跟 Claude 討論我想解決的問題,以及我的核心需求,中間我可能會用 Claude Cowork 做本地資料的分析,然後請他廣泛收集一下資訊,做幾輪 prototype 的模擬。確認方向是否是我所期待的。 2. 對完需求後,請他產出系統定位、限制、邊界與 PRD。 3. 把 PRD 跟幾個

By gipi
加快了速度,少了回饋

加快了速度,少了回饋

2022 年時我曾推出了一堂課《打造高效軟體開發團隊》。 在這堂課程中我繪製了一張軟體開發過程管理的架構,這張圖我從公司策略->產品策略->需求管理,一路到開發過程管理、交付、市場回饋,最後再回到產品需求管理。 當年我曾說過,軟體開發最重要的其實不是程式開發本身,而是 align 公司策略與產品策略,同時兼顧好短期需求,將需求管理做好。 但我們也可以看到產品需求管理是上述架構中最主要的節點,上承策略,下接短期需求,右邊則是成為所以開發計畫的起頭,同時還要承接來自市場回饋,並能持續優化管理過程與技術債務管理。 簡單的說,決定做什麼,決定了產品定位,決定先做什麼,則決定了策略重心。但要做出決定,除了對目標有清晰的認知外,更重要的是「回饋」。包含市場回饋、使用者回饋、利害關係人回饋(研發/行銷/客服...)。 這陣子透入 AI 開發後我對這張架構圖有一些新的想法: 首先,是生產力過剩。 因為 AI 不用休息,生產力幾乎沒上限,

By gipi