gipi

gipi
大語言模型對軟體開發的影響

產品開發

大語言模型對軟體開發的影響

近期閱讀了一份文件,內容是關於大語言模型對軟體開發工作的影響,文件的連結在這:Assessing and Advancing Benchmarks for Evaluating Large Language Models in Software Engineering Tasks 這份文件聚焦於大型語言模型(LLMs)應用於軟體工程(SE)領域的效能評估。這是個有趣的題目,所謂的效能,簡單的說就是能直接在該工作任務中大幅增進效能的比例。 大家都知道現在的 AI 寫 code 已經不是什麼大不了的事,但透過 vibe coding 寫出來的 code 真的可以用嗎?符合需求嗎?品質可以嗎?能被維護嗎? 關於這些問題,我們要如何衡量 AI 的有效性呢?目前的答案是透過 Benchmark(基準)。 舉例來說,之前有的 benchmark 叫 SWE-bench,

By gipi
溝通,不是把能說服自己的話拿來說服他人

職場與工作技巧

溝通,不是把能說服自己的話拿來說服他人

還記得幾年前有個朋友私訊給我說了一段趣事。 他說公司有個同事援引了我在演講中提到的一句話:「敏捷走不出研發,就不能真正敏捷。」 他試圖用這句話來告訴業務團隊們「業務必須要參與到敏捷中,開發團隊必須要更了解業務狀態,我們才能真正發揮敏捷的效益。」 我那句話的本質跟他說出來的話,在意義上其實毫無分歧。 但他獲得的結果卻是被業務部門修理了一頓。業務部門告訴他:「這不是你該管的範圍,你應該專注把你的任務搞定。」 這邊姑且不論誰的想法才是對的,但我想跟大家分享一個我在溝通過程很重要的體悟。 「所謂的溝通,不是把能說服自己的話拿來說服他人。」 「所謂的溝通,不是把能說服自己的話拿來說服他人。」 「所謂的溝通,不是把能說服自己的話拿來說服他人。」 很重要,所以得說三遍。 我們讀書總會讀到很多很有道理的話,並且被這句話說服了。但千萬要記得,這句話能說服自己,不意味著能說服他人。因為我們的立場不同,遭遇的挑戰不同,先備知識也不同。所以一段自己覺得非常有道理的話,我們必須加以轉換後,才有可能說服他人。 舉個例子來說,做研發的會希望根本的理解一個需求背後的商務價值,因為這

By gipi
Meta 高薪挖來的 AI 人才,一個月後紛紛離職 - 論薪資公平性

經營管理

Meta 高薪挖來的 AI 人才,一個月後紛紛離職 - 論薪資公平性

最近兩天看到好幾個談論 Meta 人才跳槽的消息,甚至連七月份從 OpenAI 高薪挖角的高手,也在入職一個月後決定離開 Meta 重回 OpenAI。當時的高薪挖角引起了眾多同業 CEO 的抨擊,覺得這種以錢為誘因的做法對 AI 的推進沒有幫助,終將會失敗。 Sam Altman:「用金錢驅動招聘,這會破壞以使命為中心的工作文化,真正的長期回報在於共同願景而非一次性高額薪資。」Dario Amodei:「極高的薪資策略可能破壞組織文化,雖然能吸引人才,但未必能吸引與其價值觀一致、長期投入願景工作的員工。」我相 信願景真的很重要,那是凝聚一群優秀人才的關鍵因素之一。但高額薪資背後的問題是什麼? 除了 Dario Amodei 提到的,會破壞組織文化外,我覺得 Michael Dell 的詮釋更直接。 Michael Dell:「這種高額薪資極有可能引發內部員工的不滿與文化上的緊張感。」 一樣從事 AI 研發工作,我在公司內已經是頂天的存在,但我的年薪不過就 1,

By gipi
對情緒控管能力的反思

生活雜感

對情緒控管能力的反思

前陣子跟大家分享了我自己對「情緒管理」與「承壓能力」的反思。 假設我們試著量化一個人的情緒承載能力,如果這個數值是 100,只要超過這個數字時,人的情緒就會崩潰。 而多數時候,我們會將自己的情緒壓力控制在 100 分以下,如果要自在一點的話,可能在 60 分以下是比較輕鬆自在的狀態。而那些工作壓力較大,或者內耗特別嚴重的人,很可能長期處在 80-90 分的狀態。 如果一個人的情緒壓力愈接近 100,那情緒就愈難自控,很容易沒耐性、暴躁、坐立難安。 過往我總認為自己是將情緒壓力控制在 80 分以下,所以自己在高壓工作下其實有許多的餘裕。 但最近發現,我可能只是為自己上了 buff。 所謂的 buff 是個遊戲用語,在遊戲中,有時我們可能會拿到道具,或者被施了魔法,讓我們的能力項注射了腎上腺素一般有個很明確的提升。 例如提升力量 5 點,增加 30% 血量,實體攻擊無效等等。

By gipi
我與《原力心態》作者交流的收穫

讀書心得

我與《原力心態》作者交流的收穫

在六月初的時候收到來自天下文化的邀請,希望我能與 Frederik G.Pferdt 博士進行線上交流。不過這個交流因為我這邊的一些變故,所以改成我以文字進行提問,而博士則以書面回覆我的提問。 這本書剛出版時,我曾寫過簡短的推薦序,我的原文是:「《Google模式》告訴我們怎麼經營公司,這本書則讓我們知道如何啟發人。當 AI 解放了生產力,企業勝出的關鍵將是創造力,而正確的領導方式,永遠是員工維持創造力最關鍵的因素之一。」 這本書,被稱為《Google模式》的續篇,特別強調如何激發人、影響人,順應人的天賦去發展。因為過去幾年從事的大多是教育相關產業,對這些觀念與想法特別有感。 這本書中有許多觀點都引起我很大的共鳴,例如未來思考,鼓勵人們「準備好面對未來的心態」,不用停在現在,而是勇敢地思考未來,並主動迎向未來。找到並發揮自己的「X 特質」,這個 X 特質(Dimension-X)指的是自身獨一無二之處,你也可以稱之為天賦。 而 Frederik G.Pferdt

By gipi
AI 學習的悖論

學習

AI 學習的悖論

「AI 讓你看起來更聰明,實質卻有可能學得更少。」 剛剛看到一篇文章談論 AI 對學習的可能傷害,他的參考資料是來自一篇文章《The Myth of Automated Learning》。這篇文章提到一個蠻重要的概念。 當人們使用機器自動執行他們本來可以自己完成的任務時,會發生以下三種情況之一: 1. 他們的技能不斷提高。 2. 他們的技能退化了。 3. 他們永遠學不會這項技能。 這三種狀況分別容易發生在三類人身上: 1. 如果使用者已經是專家,AI 工具可以進一步增強他們的技能。 2. 如果使用者尚未成為專家,而這項技能需要不斷練習,那麼 AI 自動化可能會導致技能退步。 3. 如果使用者是新手,而 AI 從一開始就執行任務,那麼這個人就可能永遠不會真正掌握這項技能。 作者舉的案例是工業時代,那些工匠等級的人,他們的工作被產線工人+自動化機器給大量取代,但這些生產線的工人離開自動化機器後其實什麼都不會。 對這個觀點我一半認同一半存疑,認同的點在於,產線工人熟悉的是機器操作,而工匠擅長的則是不靠機器來完成任務。哪個難度更高?通常是工匠。但從商業角度來思考

By gipi
互聯網女王 Mary Meeker 報告心得(2)-餐飲品牌 Yum Brands 的案例

經營管理

互聯網女王 Mary Meeker 報告心得(2)-餐飲品牌 Yum Brands 的案例

這幾篇文章都是我觀看 Mary Meeker 2025 年報告後的一些整理跟心得。原始的文件可以參考:https://www.bondcap.com/reports/tai 本篇要聊的話題是在 75 頁看到 Yum Brands 在 2025 年 2 月開始推動旗下餐廳的 AI 化與數位化。 這份報告中可以看到的資料很有限,不過我對餐飲業的現況有點興趣,所以我請 ChatGPT 幫我針對 Yum Brands 使用 AI 的狀況做一些整理,發現一些比預期有趣的資料。 首先介紹一下 Yum Brands 這家公司,因為這名字相信很多人都沒聽過,但說到他旗下的公司大家應該就知道這家公司的規模有多大了。它旗下的主要品牌有以下四個: * KFC(肯德基) 全球知名的炸雞品牌,在 150 多個國家擁有超過 27,000

By gipi
互聯網女王 Mary Meeker 報告心得(1) - AI 的任務,增效優先於降本

經營管理

互聯網女王 Mary Meeker 報告心得(1) - AI 的任務,增效優先於降本

到今天才有時間把互聯網女王 Mary Meeker 2025 的報告好好閱讀一下,報告的原始網址在此,有興趣的人自行閱讀:https://www.bondcap.com/reports/tai 在報告的 68 頁中我看到了一個很重要的觀念,我結合圖表做說明。 下面這張圖是 BOND 團隊針對 Morgan Stanley 的一份報告作出的整理,這張圖主要強調的是許多大型企業(調查了 400 多家年營收在 5 億美元以上的企業)對 AI 的觀點是放在「營收與事業擴展」上,而非「成本降低」。 以下幾項是被 BOND 團隊歸類在「營收與事業擴展」的項目: Production / Output (提升生產產出) ~70% Customer Service(提升顧客服務品質) ~65% Sales

By gipi
AI 時代我們需要什麼樣的產品經理

產品開發

AI 時代我們需要什麼樣的產品經理

早上聽 Lenny 專訪 Revolut product head Dmitry Zlokazov 的內容,Revolut 是一家位於倫敦的科技公司,專注於提供金融領域相關的軟體服務。在這個專訪中我聽到幾個很可能是接下來產品經理定位的轉變。 Revolut 在找什麼樣的人來擔任產品負責人?以及如何培養他們成為全球等級的產品負責人? 重視原始智力與飢渴感 在招募時,比起應徵者豐富的經驗,更看重他們的原始智力 (raw intellect) 和渴望打造事物的永不滿足的飢渴感 (unquenched hunger to build things)。有飢渴感的人就算經驗較少,也能快速學習、適應並推動改變並解決問題。 而 Revolut 也更傾向於招募那些處於早期職業生涯 (early in their career) 或具有創業背景的人。 專注於不懈的執行 如果一件事情只完成了 99%,那它更接近 0% 而不是 100%。這包括確保產品不僅僅是開發完成,還需要確保客戶服務、銷售和行銷團隊都能充分利用,否則它可能只是一個無人知曉的無用功能。

By gipi
Reddit 上的 AI 實驗

學習

Reddit 上的 AI 實驗

蘇黎世大學在 Reddit 的某頻道 r/changemyview(CMV)進行了 AI 說服力的實驗。他們建立了多個假帳號,讓 AI 機器人假扮成「強姦受害者」、「創傷諮詢師」、「Black Lives Matter 運動的抵制者」。在幾個月的時間,這些 AI 帳號發表了超 1,700 條評論, 結果非常有趣。 我們先來看一下下面這張圖,這張圖解讀起來可能有點費功夫,以下我簡單的解釋一下: X 軸 (Persuasive rate) 代表「說服率」,也就是該帳號在過去發表的評論中,有多少比例獲得發文者給的 Δ(delta,代表成功說服對方改變或思考立場)。如果我發了 10 次,有 1 次發文者給了 Δ,那就是 0.

By gipi