2026年6月14日應用

做到 80%：AI 如何改變研究工作

AI 如何壓縮專業研究中混亂的第一輪工作，同時把核實、判斷和最終決定保留給人。

重點摘要

撰寫於 2026年6月14日

AI 透過加速第一輪工作改變研究：尋找選項、比較來源、浮現限制，並準備問題。
價值不在於 AI 作出最終決定，而是令團隊更快到達可審閱的 80%。
專業研究流程在行動前仍需要來源檢查、核實、專家判斷和清楚邊界。

AI 特別擅長把研究工作推到第一個 80%。

這個說法是刻意粗略的。它不是指系統在每個情況下都有 80% 正確。它的意思是，系統往往可以壓縮混亂的第一輪工作：尋找選項、收集來源、摘要長篇材料、去除重複、比較規格、跨語言翻譯、浮現限制，並為人手審閱者準備問題。

最後 20% 仍然重要。在很多專業場景裏，它甚至最重要。核實、判斷、風險、背景和責任，都在那裏。

研究問題

研究工作通常由一個很闊的搜尋開始。

團隊可能需要比較供應商、物料、政策、先例、服務商、市場例子、監管立場、產品參考或項目基準。早期工作慢，是因為研究員必須先發現整個版圖，才可以理解它。

他們手動搜尋。打開很多分頁。比較 PDF。把規格複製到筆記。檢查來源是否仍然最新。翻譯供應商頁面或標準。留意到三個列表用略有不同的名稱描述同一件產品。嘗試判斷某個地區的指引是否適用於另一地區。嘗試記得某個選項為何曾被拒絕。然後把分散材料整理成第一個視圖。

AI 可以幫助準備這個第一個視圖。

在專業服務裏，這個第一個視圖往往決定了之後幾天甚至幾星期的工作質素。如果第一輪搜尋漏掉重要地區、混淆了相似供應商、把舊規則當成現行規則，或把市場宣傳當成技術證據，後續審閱就會在錯的基礎上變得很有效率。AI 的價值，是把探索、整理和初步比較做得更快更廣，但它同時必須保留人可以檢查的路徑。

所以「80%」不是一個精確量度，而是一個工作姿態。它提醒團隊：AI 可以把空白頁變成可審閱材料，但不能把可審閱材料直接變成可採取行動的決定。這個分別在供應商篩選、物料研究、政策掃描和市場分析中尤其重要。

AI 可以準備甚麼

對研究密集的工作而言，agent 可以準備：

候選選項；
來源連結和文件參考；
長篇網頁、PDF、目錄或筆記的簡短摘要；
去重紀錄，把同一供應商、產品、政策或先例在多處出現的版本合併；
標準化規格，讓相似欄位可以並排比較；
如相關來源使用另一語言，提供翻譯或雙語摘要；
地區和行業筆記，顯示某個來源可能在哪裏適用或不適用；
明顯限制和未解問題；
比較表；
欠缺資料；
給供應商或專家的問題；
需要核實的風險；
供審閱的下一步建議。

這有用，因為它改變了專業人士的起點。審閱者不是從空白頁或廣泛搜尋開始，而是從一張結構化地圖開始。

重要工作不只是擷取資料。它也包括清理和理解。真正有用的系統應減少重複閱讀，令來源差異可見，並協助審閱者看見兩個來源何時在說同一件事、何時在說不同的事，以及差異是否來自地區、術語、行業背景或翻譯。

研究 agent 亦應把「它找不到甚麼」說清楚。欠缺價格、沒有最新規格、找不到本地供應、認證只在另一地區有效、來源日期過舊，這些都不是小註腳，而是審閱者需要知道的研究結果。很多時候，專業判斷正是從缺口開始：如果關鍵資料不可得，下一步可能不是選擇某個方案，而是問供應商、查正式標準、或縮窄研究範圍。

另一個常見價值，是跨語言整理。團隊可能同時閱讀英文標準、中文供應商頁面、日文或歐洲產品資料，以及本地監管或採購文件。AI 可以先把材料整理到共同工作語言，但原文來源仍要保留，因為翻譯可能影響技術、法律或商業含義。

系統其實在做甚麼

可見輸出可能是一張表或一份備忘錄，但有用的系統工作發生在底層。

系統工作	為何重要
摘要	長篇 PDF、目錄、政策文件和網頁變得可審閱，而不會被壓平成含糊要點。
去重	審閱者不用反覆閱讀以不同名稱出現的同一產品、供應商、條款或基準。
標準化	不一致的單位、術語、日期、欄位和分類被整理成可比較結構。
翻譯	另一語言的相關來源可以用團隊工作語言審閱，同時保留原文供核對。
相關性篩選	資料包會把適用於當前地區、行業、用途或客戶背景的材料，與只是看起來相似的材料分開。
缺口追蹤	欠缺規格、不可取得的價格、不確定聲稱和未核實假設，會成為明確審閱項目。

手動完成這些工作很花時間。它亦容易被低估，因為最終交付物可能看起來很簡單：一張表、一份短備忘錄、一個候選清單，或一組問題。真正的工夫，是把研究清理到人可以使用的程度。

這也是為甚麼研究系統不應只追求一段漂亮摘要。摘要可以告訴你「大概有三類選項」，但審閱者還需要知道每類選項背後有哪些來源、哪些資料被合併、哪些單位被轉換、哪些名稱其實指同一件事，以及哪些差異可能只是翻譯或市場用語造成。底層整理工作越透明，專業人士越能放心指出錯誤、修正分類，並作出下一步判斷。

在實際團隊中，這些底層工作亦能減少重複勞動。下一次研究同類市場、同一供應鏈或相似政策問題時，團隊可以重用已確認的來源地圖、術語對照和去重紀錄，而不是重新由搜尋開始。

例子：供應商或物料研究

想像一個團隊正在為實體產品、裝修、安裝或原型比較物料選項。

舊流程可能包括搜尋平台、供應商頁面、規格表、論壇、目錄和過往筆記。工作不只是找名字。團隊需要比較性能、最低訂購量、認證、交貨期、公差、表面處理、成本和未解問題。

它亦需要較不顯眼的研究衛生。供應商可能以多個產品名稱列出同一物料。平台頁面可能複製了製造商聲稱，卻沒有保留原來背景。某項認證可能只適用於某一地區。中文供應商頁面可能包含有用技術細節，需要翻譯後團隊才可以審閱。某件產品可能適合家具，但不適合醫療、食品接觸、戶外或防火用途。

這些區分需要時間。它們亦正正是令研究審閱變得更好的準備工作。

AI 輔助的研究包可以顯示：

部分	例子內容
選項	候選物料或供應商
來源證據	供應商頁面、規格表、目錄、過往筆記
去重紀錄	同一供應商或產品在重複列表中被合併
標準化比較	成本範圍、單位、性能、供應情況、限制
地區和行業適配	關於地區、監管背景、應用範圍和可能相關性的筆記
翻譯筆記	保留原始來源連結的翻譯摘要
未核實聲稱	需要直接向供應商確認的聲稱
問題	取樣或購買前需要詢問的事項
審閱邊界	AI 不會選擇物料或批准支出

系統幫助團隊建立方向感。它不決定買甚麼、測試甚麼、指定甚麼或建議甚麼。

這個例子亦顯示，研究的第一輪不只是「找到更多選項」。一個材料候選清單如果沒有標明用途限制，就可能造成錯誤信心。適合室內家具的材料，未必適合公共空間；適合樣板的材料，未必有穩定供應；供應商聲稱有認證，未必代表該認證適用於團隊的地區、產品類別或最終用途。AI 應把這些限制推到審閱者面前。

採購和設計團隊亦需要知道哪些問題要在取樣前問清楚。例如最低訂購量是否包括特定顏色、交貨期是否因地區不同而變化、測試報告是否由第三方發出、價格是否只是平台標價而非正式報價。這些問題不等於最後決定，但它們令最後決定更可靠。

例子：政策或先例掃描

在顧問、法律、合規或營運工作中，研究對象可能較不實體，但同樣分散。

AI 研究包可能收集：

相關政策；
過往備忘錄；
可比較決定；
需要檢視的條款或標準；
司法管轄區或地區筆記；
如果來源材料不是團隊工作語言，提供翻譯摘要；
來源之間的衝突；
來源基礎可能過時的地方；
給負責專業人士的問題。

同樣，重點是準備。系統讓審閱者有更好的起點。它不作出由人問責的建議。

這裏的價值也經常在清理工作之中。政策掃描可能涉及同一指引的多個版本、引用舊規則的評論、來自另一司法管轄區的例子，以及用語和正式來源不同的內部筆記。系統可以在專業人士決定甚麼重要之前，協助聚類、翻譯、檢查日期和標示相關性。

在法律、合規或顧問研究中，「相似」尤其危險。另一個市場的監管做法、另一個行業的政策樣本，或幾年前的內部備忘錄，可能提供有用參考，但不應被當成當前客戶可直接採用的答案。AI 可以把相似材料放在一起，但應標示司法管轄區、日期、適用範圍和不確定性，讓負責專業人士決定其重量。

同一點也適用於先例掃描。系統可以整理可比較案例、條款或決策紀錄，但不應說它們「證明」某個建議正確。專業人士仍要判斷差異是否重要、來源是否權威、背景是否足夠接近，以及是否需要補充研究。

為何最後 20% 仍然重要

研究的最後部分不是文書工作。

它包括：

檢查來源是否具權威性；
核實最新價格、供應情況和條款；
決定哪些取捨重要；
應用專業標準；
衡量風險和客戶背景；
知道何時證據不足；
決定要測試或建議甚麼。

生成式 AI 即使在資料不完整或錯誤時，也可以產生自信輸出。NIST 的 Generative AI Profile 以 confabulation 和 unsupported claims 討論這個風險。因此，研究 agents 應清楚顯示來源、不確定性和欠缺資料。

最後 20% 亦包括與現實世界接觸。供應商價格要直接確認；材料性能可能需要測試；政策立場可能要查正式版本；市場例子可能要確認日期和背景；客戶建議需要考慮風險承受能力、預算、時間和策略。AI 可以準備這些問題，但不能承擔採購、法律、設計或商業責任。

因此，研究工作流程應明確設定決策邊界。系統可以把候選方案排成表，卻不應批准採購；可以比較政策來源，卻不應給出最終法律或合規意見；可以建議下一步核實問題，卻不應假裝核實已經完成。

Source Map 才是產品

對研究工作而言，最有價值的產物往往是 source map。

source map 告訴審閱者：

系統找到了甚麼；
每項聲稱來自哪裏；
哪些紀錄被歸為重複；
哪些術語、單位或分類被標準化；
哪些來源被翻譯；
來源看來適用於哪些地區、行業或用途；
哪些來源互相不一致；
哪些來源過時或不清楚；
系統無法核實甚麼；
甚麼需要人手檢查。

這比一個潤飾好的答案更有用。潤飾好的答案可能隱藏薄弱證據。source map 令證據可以被檢視。

所以研究工作流程自然適合配合 source grounding。團隊需要看到比較的根據，而不只是結論。

好的 source map 亦是一種協作介面。研究員可以標記某個來源不可靠，專家可以補充某項規格解讀，項目負責人可以改變適用範圍，採購同事可以加入供應商回覆。下一輪 agent 工作不應抹走這些修正，而應把它們納入新的研究狀態。這樣，AI 不只是產生一次性摘要，而是支援團隊逐步建立可檢查的研究記憶。

這也令錯誤更容易被發現。若答案只是一段文字，審閱者很難知道哪一句依賴哪個來源；若 source map 顯示每項比較的依據，錯誤單位、過時來源、重複供應商或錯誤翻譯就更容易被指出和修正。

如何安全使用 AI 研究

實際工作流程是：

1. 定義研究問題和決策邊界。 2. 讓 agent 收集並整理第一輪材料。 3. 讓系統去重、標準化、翻譯，並標示可能相關性。 4. 審閱 source map，而不只是摘要。 5. 標記未支持聲稱、欠缺證據和可疑相關性。 6. 直接核實高後果事實。 7. 決定要測試、篩選、購買、建議或拒絕甚麼。 8. 把修正回饋到下一輪研究。

這樣可以令 agent 保持有用，而不把它變成決策者。

在實際操作中，團隊可以把這個流程做成固定節奏。第一輪由 agent 擴闊搜尋和整理；第二輪由研究員清理明顯錯誤和補充來源；第三輪由專家或負責人審閱高後果事項；最後才形成建議、採購清單、客戶備忘錄或測試計劃。每一輪都應留下修正，讓下一次研究更好。

這種節奏亦避免了另一個常見陷阱：把 AI 用作一次性的答案機器。研究工作真正需要的是可追溯、可修正、可交接的工作面。當 source map、比較表、缺口清單和審閱決定一起保存，團隊就能在速度之外得到更好的記憶。

這個工作面還可以支援團隊分工。研究員負責擴闊來源和整理資料，專家負責審閱高後果判斷，項目負責人決定下一步行動，營運或採購同事跟進供應商問題。AI 不需要替代任何一個角色；它需要把每個角色要看的證據和缺口放到同一個可追蹤流程中。

最後，團隊應把「已核實」和「仍待核實」視覺上分開。研究速度提升後，最容易出錯的地方，就是把第一輪整理誤認為完成研究。清楚狀態能保護後續判斷。

這不是甚麼

做到 80%，不是承諾 AI 已經完成大部分思考。

它的意思是 AI 可以降低建立方向感的成本。它可以令第一輪工作更快、更廣、更容易審閱。剩下的工作不是形式。那才是專業工作。

所以，最健康的預期是：AI 令研究人員更早到達有材料可討論的狀態，令專家更容易檢查重要差異，令團隊更快知道還欠甚麼。它不令驗證、判斷或責任消失。把這條界線說清楚，反而會令 AI 在研究工作中更可靠，也更值得使用。

換句話說，「80%」是一個起點，不是一個交付承諾。它把搜尋、整理、翻譯、去重和初步比較提前做好，讓人可以更快開始真正審閱。若團隊把它誤當成最後答案，就會把最大風險留到最尾才發現。

因此，好的 AI 研究流程應該讓第一輪成果保持可檢查、可質疑、可修正。source map、比較表、缺口清單和待核實問題，應比一段自信結論更受重視。專業人士仍然決定要相信甚麼、測試甚麼、採購甚麼、建議甚麼，或拒絕甚麼。

這樣使用 AI，速度會服務於判斷，而不是把判斷推到看不見的地方。

第一輪越快，審閱邊界就越要清楚；只有這樣，研究團隊才不會把可審閱材料誤當成已核實結論。

/ 開始

先由一個營運範圍開始，再逐步擴展。

由一個清晰的審閱節奏、工作流程或團隊開始，找出更好的營運背景能即時改善準備和判斷質素的地方。

預約示範