甚麼令 AI 對專業工作有用
專業服務中有用 AI 的實用框架:更好的判斷、準備、協調、來源審閱和跟進。
重點摘要
- AI 對專業工作有用,是因為它提升判斷、準備、協調和跟進的質素。
- 實際測試不是系統聽起來是否聰明,而是它能否幫人帶着更好背景行動,並減少遺漏責任。
- 限制同樣重要:AI 應顯示來源、尊重權限,並把需要人類問責的決定升級。
AI 對專業工作有用,是當它幫助人作出更好判斷、準備得更好、協調得更好,以及更可靠地跟進。
這個定義刻意實務。專業工作不只是內容生產。它包括詮釋、建議、客戶背景、證據、關係、時間、標準、問責和交接。一個系統即使能寫出流暢文字,但削弱上述任何一項,也不算真正有用。相反,一個系統即使安靜地改善它們,也有價值。
在這篇文章,專業工作指成果依賴背景和判斷的知識工作:法律、顧問、財務、營運、客戶服務、照護、研究、政策、設計、工程管理和行政工作。
這個框架令問題保持實際。有用與否,不是看 AI 看起來有多自主,而是看工作是否變得更容易理解、審閱、協調和完成得好。
這是 operating intelligence,讓人和系統知道甚麼改變了,以及下一步甚麼重要。
有用 AI 的工作定義
AI usefulness 是指一個系統在不隱藏良好工作所需判斷的前提下,改善工作的程度。
這不同於問 AI 能否產生令人印象深刻的答案。很多專業任務不是答案形狀,而是情境形狀。專業人士需要知道甚麼改變了、欠缺甚麼、哪些證據重要、誰負責下一步、哪些風險可接受,以及甚麼應該升級。
有用輸出不是「AI 決定了」。而是「專業人士可以帶着更好背景去決定」。
Anthropic 關於建立有效 agents 的指引有幫助,因為它區分結構化 workflows 和較自主 agents,並主張由最簡單而有效的系統開始(Anthropic)。
在專業工作中,這些成分只有在改善團隊營運質素時才重要。
有用 AI 的四個測試
判斷
當 AI 令人的情境視野更清楚,它就改善判斷。
這可以是帶 source links 摘要證據、浮現矛盾、按準則比較選項、指出欠缺資料,或者顯示建議依賴哪些假設。它不應該等於把問責外判給模型。
有用輸出不是「AI 決定」,而是「專業人士能夠帶着更好背景決定」。
NIST 的 AI Risk Management Framework 相關,因為它把 governance、measurement、management、transparency、accountability 和 human-AI oversight 放入可信 AI 系統生命週期(NIST AI RMF4)。專業判斷需要這種紀律,因為很多專業決定影響金錢、權利、安全、聲譽或信任。
準備
當 AI 減少重建背景所花的時間,它就改善準備。
在會議、審閱、通話、存檔、board pack、談判或客戶更新之前,專業人士需要當前狀態:近期事件、承諾、文件、未決問題、過往決定、期限和敏感位。
這正是 AI 可以有價值但不必戲劇化的地方。它可以準備 briefs、reading packs、matter summaries、renewal notes、risk lists 和 draft agendas。當輸出建基於團隊真實紀錄,並顯示說法來源時,才算有用。
好的準備亦應顯示缺口,而不只是整理已找到的資料。若缺少已簽署版本、未能確認最新 approval,或找不到上一個會議承諾,系統應把這些缺口放在審閱者面前。專業人士需要知道自己是否準備好作決定;一份漂亮但隱藏缺口的 brief,可能比沒有 brief 更危險。
協調
當 AI 幫助團隊共享狀態,它就改善協調。
專業工作經常跨角色。一個人負責客戶關係,另一個人負責證據,另一個人負責交付,另一個人負責批准,還有人負責營運。Transactive memory systems 研究解釋了為甚麼團隊知道誰擁有甚麼專長,以及知識如何分佈在團隊中,會更有效(Ren and Argote6)。
AI 可以透過連結人、任務、證據、期限和決定支援共享狀態。它可以令交接更清楚,顯示下一步由誰負責,也可以揭示機構內兩部分正在基於不同假設工作。
協調不只是生產力問題。Amy Edmondson 關於 psychological safety 和 team learning 的研究顯示,團隊需要讓人可以發聲、求助和從錯誤中學習的條件(Edmondson5)。AI 應該令工作更可見和可討論,而不是製造不透明分數或隱性監控。
跟進
當 AI 幫助責任跨過「有意圖」和「有行動」之間的空隙,它就改善跟進。
承諾、批准、審閱、期限、交接和升級都很脆弱。它們經常在會議和訊息中產生,然後要在其他地方執行。Workflow automation 對穩定流程有用;IBM 把它描述為以軟件執行原本由人手完成的任務和流程(IBM3)。
專業跟進通常需要的不只是一個固定觸發。系統要知道承諾、負責人、來源、到期日、當前狀態、關係背景和升級規則。AI 可以透過抽取承諾、監察停滯工作、準備提醒和呈現未解決責任來幫手。
這種跟進價值往往很實際:少一個遺漏承諾,可能比多生成十份初稿更重要。專業團隊的信任來自事情有交代、有紀錄、有負責人,而不只是文字速度。AI 若能令承諾由會議和訊息回到可管理狀態,就已經改善了工作的可靠性。
實務結構
專業工作中的有用 AI 需要 organisational context。系統要從文件、訊息、會議、日曆、任務系統、財務工具、CRM records、case systems 和資料庫捕捉相關紀錄,再把它們轉化成真正常用的物件:client、matter、owner、source、decision、obligation、approval、deadline、risk、evidence 和 next step。
當前營運狀態亦需要 permissions、source links、version history、audit trails,以及受控方法去搜尋、brief、草擬、更新、分派和審閱。沒有這個結構,AI 仍被困在 prompt 裏。有了它,AI 才可以參與真實工作的營運節奏。
有用 AI 不是甚麼
有用 AI 不一定是自主 AI,不一定是聊天機械人,也不是一個做所有事的 universal assistant。
有時最好的 AI 功能是一份有來源的 brief。有時是 extraction pipeline。有時是 workflow checkpoint。有時是知道 file history 的草擬工具。有時是 agentic workflow:收集背景、準備選項,然後把結果送交審閱者。
形式不及它對工作的影響重要。
警號是 AI 產生漂亮輸出,但令審閱更難。如果系統隱藏不確定性、省略來源、跳過權限邊界,或製造比消除更多的 follow-up work,它就不是專業意義上的有用。
實務例子
法律和顧問工作
AI 可以整理 matter context、識別欠缺證據、草擬客戶更新、把立場與過往建議比較,並準備審閱筆記。判斷仍然留給專業人士。
財務和營運
AI 可以連接供應商、預算、續約日期、負責人、批准和使用訊號。它可以在團隊失去談判時間前準備 spend review 或標示續約風險。
客戶成功
AI 可以保存關係歷史、浮現承諾、準備通話 brief、識別未解決關注,並幫助團隊按合適節奏跟進。
研究和政策
AI 可以整理來源材料、摘要證據、比較論點、標示不確定性,並維持由 claim 到 source 的軌跡。
甚麼時候未必需要 AI
如果工作少見、量低、界線非常清楚,或已經由 deterministic system 處理得好,AI 未必需要。當數據質素差、權限不清,或機構無法負責任地審閱輸出時,AI 也可能是錯工具。
最好的第一步可能是更好紀錄、更乾淨流程、更清楚 ownership,或者更簡單自動化。AI 不能修好一個連自己想做甚麼都解釋不清的工作系統。
有用 AI 的論點
AI 在專業工作中有用,是當它改善人類判斷的營運條件。
這代表行動前有更好準備、跨角色有更好協調、承諾有更好記憶,以及決定後有更好跟進。它亦代表更清晰邊界:顯示來源、限制權限、審閱敏感決定,並把問責留在人身上。
因此,評估 AI 專案時,不應只看它是否能生成一段漂亮文字。更好的問題是:它有否減少人重建背景的時間?有否令審閱者更容易看到證據?有否令交接更清晰?有否把會議和訊息中的承諾帶回可管理的工作狀態?有否在超出權限時停下來?這些問題比「模型是否聰明」更接近專業工作的真實價值。
很多 AI 採用失敗,原因不是工具完全沒有能力,而是它沒有落在工作真正斷裂的位置。團隊可能得到更多草稿,但沒有更好來源;得到更多摘要,但沒有更清楚 ownership;得到更快回覆,但沒有更可靠 follow-through。有用 AI 應該減少這些營運裂縫,而不是只把輸出速度提高。
這也影響投資優先次序。若團隊最痛的是會議後承諾遺漏,最有用的 AI 可能是 commitment extraction 和 follow-up workflow,而不是一個更會寫長文的 assistant。若最痛的是審閱前要重建背景,最有用的可能是 source-grounded review packet。若最痛的是跨部門假設不同,最有用的可能是共享狀態和清楚 ownership。AI 要貼近工作問題,才會真正有用。
有用 AI 還要讓人更有能力,而不是更被動。好的系統會把選項、證據、缺口和風險攤開,令專業人士更容易提問和修正;差的系統則只交出一個看似完成的答案,令人難以知道應該從哪裏審閱。專業團隊需要的是增強判斷的工具,不是把判斷藏起來的工具。
價值不在於 AI 取代專業人士。價值在於它幫助專業團隊以更多背景、更少漂移和更少遺漏責任去工作。
要判斷一個 AI workflow 是否有用,可以在部署前定義幾個非常具體的改變。審閱包是否更快準備好?審閱者是否更少時間找來源?承諾是否更少遺漏?交接是否更少追問?錯誤是否更早被發現?如果量度只停留在「生成了多少內容」或「節省了多少分鐘」,很容易錯過專業工作真正重視的質素。
有用 AI 亦應讓團隊更容易學習。當人修正草稿、補充來源、拒絕建議或升級個案,系統應保存這些回饋,讓下一次準備更好。這種 learning loop 不等於讓模型隨意吸收敏感資料,而是讓 workflow 知道哪些來源可信、哪些判斷常被修改、哪些例外需要更早提示。
所以,有用 AI 的採用應該由工作質素來驗證:判斷是否更穩、準備是否更完整、協調是否更少斷裂、跟進是否更少遺漏。若這些質素沒有改善,即使工具使用率很高,也可能只是把更多工作推到審閱者身上。
真正有用的系統應該令人的負擔更集中、更有資訊,而不是讓人花更多時間修正看似完成的輸出。它把選項、來源、缺口、風險和下一步整理出來,讓專業人士可以更快進入真正需要判斷的位置。
這亦回到本文開首的定義:AI 有用,是因為它改善判斷、準備、協調和跟進,而不是因為它看起來更自主。形式可以是 brief、workflow checkpoint、drafting tool 或 agentic workflow;真正重要的是它是否令工作更清楚、更可審閱、更少遺漏。
這才是專業工作中的實際 usefulness。
資料來源
/ 開始
先由一個營運範圍開始,再逐步擴展。
由一個清晰的審閱節奏、工作流程或團隊開始,找出更好的營運背景能即時改善準備和判斷質素的地方。