應用

做到 80%:AI 如何改變研究工作

AI 如何壓縮專業研究中混亂的第一輪工作,同時把核實、判斷和最終決定保留給人。

重點摘要

  • AI 透過加速第一輪工作改變研究:尋找選項、比較來源、浮現限制,並準備問題。
  • 價值不在於 AI 作出最終決定,而是令團隊更快到達可審閱的 80%。
  • 專業研究流程在行動前仍需要來源檢查、核實、專家判斷和清楚邊界。

AI 特別擅長把研究工作推到第一個 80%。

這個說法是刻意粗略的。它不是指系統在每個情況下都有 80% 正確。它的意思是,系統往往可以壓縮混亂的第一輪工作:尋找選項、收集來源、摘要長篇材料、去除重複、比較規格、跨語言翻譯、浮現限制,並為人手審閱者準備問題。

最後 20% 仍然重要。在很多專業場景裏,它甚至最重要。核實、判斷、風險、背景和責任,都在那裏。

研究問題

研究工作通常由一個很闊的搜尋開始。

團隊可能需要比較供應商、物料、政策、先例、服務商、市場例子、監管立場、產品參考或項目基準。早期工作慢,是因為研究員必須先發現整個版圖,才可以理解它。

他們手動搜尋。打開很多分頁。比較 PDF。把規格複製到筆記。檢查來源是否仍然最新。翻譯供應商頁面或標準。留意到三個列表用略有不同的名稱描述同一件產品。嘗試判斷某個地區的指引是否適用於另一地區。嘗試記得某個選項為何曾被拒絕。然後把分散材料整理成第一個視圖。

AI 可以幫助準備這個第一個視圖。

在專業服務裏,這個第一個視圖往往決定了之後幾天甚至幾星期的工作質素。如果第一輪搜尋漏掉重要地區、混淆了相似供應商、把舊規則當成現行規則,或把市場宣傳當成技術證據,後續審閱就會在錯的基礎上變得很有效率。AI 的價值,是把探索、整理和初步比較做得更快更廣,但它同時必須保留人可以檢查的路徑。

所以「80%」不是一個精確量度,而是一個工作姿態。它提醒團隊:AI 可以把空白頁變成可審閱材料,但不能把可審閱材料直接變成可採取行動的決定。這個分別在供應商篩選、物料研究、政策掃描和市場分析中尤其重要。

AI 可以準備甚麼

對研究密集的工作而言,agent 可以準備:

  • 候選選項;
  • 來源連結和文件參考;
  • 長篇網頁、PDF、目錄或筆記的簡短摘要;
  • 去重紀錄,把同一供應商、產品、政策或先例在多處出現的版本合併;
  • 標準化規格,讓相似欄位可以並排比較;
  • 如相關來源使用另一語言,提供翻譯或雙語摘要;
  • 地區和行業筆記,顯示某個來源可能在哪裏適用或不適用;
  • 明顯限制和未解問題;
  • 比較表;
  • 欠缺資料;
  • 給供應商或專家的問題;
  • 需要核實的風險;
  • 供審閱的下一步建議。

這有用,因為它改變了專業人士的起點。審閱者不是從空白頁或廣泛搜尋開始,而是從一張結構化地圖開始。

重要工作不只是擷取資料。它也包括清理和理解。真正有用的系統應減少重複閱讀,令來源差異可見,並協助審閱者看見兩個來源何時在說同一件事、何時在說不同的事,以及差異是否來自地區、術語、行業背景或翻譯。

研究 agent 亦應把「它找不到甚麼」說清楚。欠缺價格、沒有最新規格、找不到本地供應、認證只在另一地區有效、來源日期過舊,這些都不是小註腳,而是審閱者需要知道的研究結果。很多時候,專業判斷正是從缺口開始:如果關鍵資料不可得,下一步可能不是選擇某個方案,而是問供應商、查正式標準、或縮窄研究範圍。

另一個常見價值,是跨語言整理。團隊可能同時閱讀英文標準、中文供應商頁面、日文或歐洲產品資料,以及本地監管或採購文件。AI 可以先把材料整理到共同工作語言,但原文來源仍要保留,因為翻譯可能影響技術、法律或商業含義。

系統其實在做甚麼

可見輸出可能是一張表或一份備忘錄,但有用的系統工作發生在底層。

系統工作為何重要
摘要長篇 PDF、目錄、政策文件和網頁變得可審閱,而不會被壓平成含糊要點。
去重審閱者不用反覆閱讀以不同名稱出現的同一產品、供應商、條款或基準。
標準化不一致的單位、術語、日期、欄位和分類被整理成可比較結構。
翻譯另一語言的相關來源可以用團隊工作語言審閱,同時保留原文供核對。
相關性篩選資料包會把適用於當前地區、行業、用途或客戶背景的材料,與只是看起來相似的材料分開。
缺口追蹤欠缺規格、不可取得的價格、不確定聲稱和未核實假設,會成為明確審閱項目。

手動完成這些工作很花時間。它亦容易被低估,因為最終交付物可能看起來很簡單:一張表、一份短備忘錄、一個候選清單,或一組問題。真正的工夫,是把研究清理到人可以使用的程度。

這也是為甚麼研究系統不應只追求一段漂亮摘要。摘要可以告訴你「大概有三類選項」,但審閱者還需要知道每類選項背後有哪些來源、哪些資料被合併、哪些單位被轉換、哪些名稱其實指同一件事,以及哪些差異可能只是翻譯或市場用語造成。底層整理工作越透明,專業人士越能放心指出錯誤、修正分類,並作出下一步判斷。

在實際團隊中,這些底層工作亦能減少重複勞動。下一次研究同類市場、同一供應鏈或相似政策問題時,團隊可以重用已確認的來源地圖、術語對照和去重紀錄,而不是重新由搜尋開始。

例子:供應商或物料研究

想像一個團隊正在為實體產品、裝修、安裝或原型比較物料選項。

舊流程可能包括搜尋平台、供應商頁面、規格表、論壇、目錄和過往筆記。工作不只是找名字。團隊需要比較性能、最低訂購量、認證、交貨期、公差、表面處理、成本和未解問題。

它亦需要較不顯眼的研究衛生。供應商可能以多個產品名稱列出同一物料。平台頁面可能複製了製造商聲稱,卻沒有保留原來背景。某項認證可能只適用於某一地區。中文供應商頁面可能包含有用技術細節,需要翻譯後團隊才可以審閱。某件產品可能適合家具,但不適合醫療、食品接觸、戶外或防火用途。

這些區分需要時間。它們亦正正是令研究審閱變得更好的準備工作。

AI 輔助的研究包可以顯示:

部分例子內容
選項候選物料或供應商
來源證據供應商頁面、規格表、目錄、過往筆記
去重紀錄同一供應商或產品在重複列表中被合併
標準化比較成本範圍、單位、性能、供應情況、限制
地區和行業適配關於地區、監管背景、應用範圍和可能相關性的筆記
翻譯筆記保留原始來源連結的翻譯摘要
未核實聲稱需要直接向供應商確認的聲稱
問題取樣或購買前需要詢問的事項
審閱邊界AI 不會選擇物料或批准支出

系統幫助團隊建立方向感。它不決定買甚麼、測試甚麼、指定甚麼或建議甚麼。

這個例子亦顯示,研究的第一輪不只是「找到更多選項」。一個材料候選清單如果沒有標明用途限制,就可能造成錯誤信心。適合室內家具的材料,未必適合公共空間;適合樣板的材料,未必有穩定供應;供應商聲稱有認證,未必代表該認證適用於團隊的地區、產品類別或最終用途。AI 應把這些限制推到審閱者面前。

採購和設計團隊亦需要知道哪些問題要在取樣前問清楚。例如最低訂購量是否包括特定顏色、交貨期是否因地區不同而變化、測試報告是否由第三方發出、價格是否只是平台標價而非正式報價。這些問題不等於最後決定,但它們令最後決定更可靠。

例子:政策或先例掃描

在顧問、法律、合規或營運工作中,研究對象可能較不實體,但同樣分散。

AI 研究包可能收集:

  • 相關政策;
  • 過往備忘錄;
  • 可比較決定;
  • 需要檢視的條款或標準;
  • 司法管轄區或地區筆記;
  • 如果來源材料不是團隊工作語言,提供翻譯摘要;
  • 來源之間的衝突;
  • 來源基礎可能過時的地方;
  • 給負責專業人士的問題。

同樣,重點是準備。系統讓審閱者有更好的起點。它不作出由人問責的建議。

這裏的價值也經常在清理工作之中。政策掃描可能涉及同一指引的多個版本、引用舊規則的評論、來自另一司法管轄區的例子,以及用語和正式來源不同的內部筆記。系統可以在專業人士決定甚麼重要之前,協助聚類、翻譯、檢查日期和標示相關性。

在法律、合規或顧問研究中,「相似」尤其危險。另一個市場的監管做法、另一個行業的政策樣本,或幾年前的內部備忘錄,可能提供有用參考,但不應被當成當前客戶可直接採用的答案。AI 可以把相似材料放在一起,但應標示司法管轄區、日期、適用範圍和不確定性,讓負責專業人士決定其重量。

同一點也適用於先例掃描。系統可以整理可比較案例、條款或決策紀錄,但不應說它們「證明」某個建議正確。專業人士仍要判斷差異是否重要、來源是否權威、背景是否足夠接近,以及是否需要補充研究。

為何最後 20% 仍然重要

研究的最後部分不是文書工作。

它包括:

  • 檢查來源是否具權威性;
  • 核實最新價格、供應情況和條款;
  • 決定哪些取捨重要;
  • 應用專業標準;
  • 衡量風險和客戶背景;
  • 知道何時證據不足;
  • 決定要測試或建議甚麼。

生成式 AI 即使在資料不完整或錯誤時,也可以產生自信輸出。NIST 的 Generative AI Profile 以 confabulation 和 unsupported claims 討論這個風險。因此,研究 agents 應清楚顯示來源、不確定性和欠缺資料。

最後 20% 亦包括與現實世界接觸。供應商價格要直接確認;材料性能可能需要測試;政策立場可能要查正式版本;市場例子可能要確認日期和背景;客戶建議需要考慮風險承受能力、預算、時間和策略。AI 可以準備這些問題,但不能承擔採購、法律、設計或商業責任。

因此,研究工作流程應明確設定決策邊界。系統可以把候選方案排成表,卻不應批准採購;可以比較政策來源,卻不應給出最終法律或合規意見;可以建議下一步核實問題,卻不應假裝核實已經完成。

Source Map 才是產品

對研究工作而言,最有價值的產物往往是 source map。

source map 告訴審閱者:

  • 系統找到了甚麼;
  • 每項聲稱來自哪裏;
  • 哪些紀錄被歸為重複;
  • 哪些術語、單位或分類被標準化;
  • 哪些來源被翻譯;
  • 來源看來適用於哪些地區、行業或用途;
  • 哪些來源互相不一致;
  • 哪些來源過時或不清楚;
  • 系統無法核實甚麼;
  • 甚麼需要人手檢查。

這比一個潤飾好的答案更有用。潤飾好的答案可能隱藏薄弱證據。source map 令證據可以被檢視。

所以研究工作流程自然適合配合 source grounding。團隊需要看到比較的根據,而不只是結論。

好的 source map 亦是一種協作介面。研究員可以標記某個來源不可靠,專家可以補充某項規格解讀,項目負責人可以改變適用範圍,採購同事可以加入供應商回覆。下一輪 agent 工作不應抹走這些修正,而應把它們納入新的研究狀態。這樣,AI 不只是產生一次性摘要,而是支援團隊逐步建立可檢查的研究記憶。

這也令錯誤更容易被發現。若答案只是一段文字,審閱者很難知道哪一句依賴哪個來源;若 source map 顯示每項比較的依據,錯誤單位、過時來源、重複供應商或錯誤翻譯就更容易被指出和修正。

如何安全使用 AI 研究

實際工作流程是:

1. 定義研究問題和決策邊界。 2. 讓 agent 收集並整理第一輪材料。 3. 讓系統去重、標準化、翻譯,並標示可能相關性。 4. 審閱 source map,而不只是摘要。 5. 標記未支持聲稱、欠缺證據和可疑相關性。 6. 直接核實高後果事實。 7. 決定要測試、篩選、購買、建議或拒絕甚麼。 8. 把修正回饋到下一輪研究。

這樣可以令 agent 保持有用,而不把它變成決策者。

在實際操作中,團隊可以把這個流程做成固定節奏。第一輪由 agent 擴闊搜尋和整理;第二輪由研究員清理明顯錯誤和補充來源;第三輪由專家或負責人審閱高後果事項;最後才形成建議、採購清單、客戶備忘錄或測試計劃。每一輪都應留下修正,讓下一次研究更好。

這種節奏亦避免了另一個常見陷阱:把 AI 用作一次性的答案機器。研究工作真正需要的是可追溯、可修正、可交接的工作面。當 source map、比較表、缺口清單和審閱決定一起保存,團隊就能在速度之外得到更好的記憶。

這個工作面還可以支援團隊分工。研究員負責擴闊來源和整理資料,專家負責審閱高後果判斷,項目負責人決定下一步行動,營運或採購同事跟進供應商問題。AI 不需要替代任何一個角色;它需要把每個角色要看的證據和缺口放到同一個可追蹤流程中。

最後,團隊應把「已核實」和「仍待核實」視覺上分開。研究速度提升後,最容易出錯的地方,就是把第一輪整理誤認為完成研究。清楚狀態能保護後續判斷。

這不是甚麼

做到 80%,不是承諾 AI 已經完成大部分思考。

它的意思是 AI 可以降低建立方向感的成本。它可以令第一輪工作更快、更廣、更容易審閱。剩下的工作不是形式。那才是專業工作。

所以,最健康的預期是:AI 令研究人員更早到達有材料可討論的狀態,令專家更容易檢查重要差異,令團隊更快知道還欠甚麼。它不令驗證、判斷或責任消失。把這條界線說清楚,反而會令 AI 在研究工作中更可靠,也更值得使用。

換句話說,「80%」是一個起點,不是一個交付承諾。它把搜尋、整理、翻譯、去重和初步比較提前做好,讓人可以更快開始真正審閱。若團隊把它誤當成最後答案,就會把最大風險留到最尾才發現。

因此,好的 AI 研究流程應該讓第一輪成果保持可檢查、可質疑、可修正。source map、比較表、缺口清單和待核實問題,應比一段自信結論更受重視。專業人士仍然決定要相信甚麼、測試甚麼、採購甚麼、建議甚麼,或拒絕甚麼。

這樣使用 AI,速度會服務於判斷,而不是把判斷推到看不見的地方。

第一輪越快,審閱邊界就越要清楚;只有這樣,研究團隊才不會把可審閱材料誤當成已核實結論。

/ 開始

先由一個營運範圍開始,再逐步擴展。

由一個清晰的審閱節奏、工作流程或團隊開始,找出更好的營運背景能即時改善準備和判斷質素的地方。

預約示範
© 2026 Interfacing Research Laboratory
版權所有。