中文內容的坑,踩一次還不夠嗎 🤦‍♂️

昨天因為模型調整的問題折騰了一整天,今天原本計畫專心來處理一下產品分析服務的中文內容問題。說真的,當初設計產品分析服務的時候,腦袋裡想得很美:只要用戶上傳產品包裝,我們就能自動抽取成分表,檢查成分安全性,然後生成一份漂亮又易懂的分析報告。看起來超級直覺又實用對吧?

昨天因為模型調整的問題折騰了一整天,今天原本計畫專心來處理一下產品分析服務的中文內容問題。說真的,當初設計產品分析服務的時候,腦袋裡想得很美:只要用戶上傳產品包裝,我們就能自動抽取成分表,檢查成分安全性,然後生成一份漂亮又易懂的分析報告。看起來超級直覺又實用對吧?

但今天實際上去 review 一下用戶回報的問題,我才發現之前定的規範根本不夠嚴謹。原本的邏輯只檢查有沒有成分表,但完全沒管成分表是不是完整的,結果呢?一堆用戶上傳「部分成分表」甚至「成分摘要」,我們的 AI 傻傻地認定「有成分就是 OK」,然後開心地產生報告,結果品質可想而知。這種事情發生一次就算了,居然還發生了好幾次?!

於是今天我重新調整了檢查邏輯,新增了檢查類型,明確要求必須是「完整成分表」。但問題來了,什麼叫「完整」?產品包裝上的成分表可能各種形式都有,有些品牌甚至故意把成分拆成好幾個區塊,光是要定義什麼是「完整」就燒掉了我一整個下午。

後來我決定先從最基本的規則開始:「成分表必須至少包含三個關鍵資訊:成分名稱、含量或濃度,以及成分用途或特性。」一方面這樣 AI 比較好判斷,另一方面至少能確保分析報告的品質。雖然這樣可能會犧牲掉一些彈性,但畢竟我寧可穩定一點,也不想讓用戶拿到一堆亂七八糟的分析結果。

順手補上技術文檔的更新,清楚地把這個檢查邏輯跟功能範疇寫下來。每次寫文檔的時候都會忍不住想吐槽自己:「當初這個功能你是怎麼想的?為什麼連這麼基本的規則都沒定清楚?」但說真的,當時的我哪裡知道用戶會這麼會鑽漏洞呢?🤷‍♂️

Subscribe to 海博賽特日誌

Don’t miss out on the latest issues. Sign up now to get access to the library of members-only issues.
[email protected]
Subscribe