
Harvard/BCG的研究发现,使用AI的人完成任务的速度提高了25%。但同一项研究也表明,部分员工的表现反而下降了19%。两类人之间的差距究竟在哪里?
你需要了解的是: Harvard与BCG针对758名咨询顾问开展的研究发现,使用AI的参与者多完成了12.2%的任务,速度提升了25.1%,产出质量也更高。但同一项研究也表明,在某些任务上,使用AI的参与者比不使用AI的人准确率低了19%。研究人员将这一现象称为"参差不齐的技术前沿"。获益最大的那批人,已经摸清了这条前沿的边界。大多数人还没有。
核心发现:
- 在AI擅长的任务上,它能带来真实的效率优势:写作、总结、头脑风暴、编程
- 在AI能力边界之外的任务上,AI反而可能拉低你的准确率
- 2026年,善用AI的人与其他人之间的差距正在扩大
- 将AI融入可重复的工作流,比选择哪款工具更重要
- 在关键环节保留自己的判断力,是真正的高效用户与过度依赖者之间的本质区别
Harvard商学院与Boston Consulting Group联合开展了一项广受引用的AI职场研究。他们为758名咨询顾问布置了18项贴近实际的工作任务,一部分人使用AI,另一部分人不使用。
结果泾渭分明。
使用AI的组别多完成了12.2%的任务,速度提升了25.1%,产出质量也可量化地更高。对于每周工作40小时的知识工作者来说,25%的速度提升意味着周五的工作量,周四下午就能收尾。
但有一点,大多数人都忽略了。
在超出AI能力范围的任务上,使用AI的顾问给出正确答案的概率,比不使用AI的人低了19%。某些情况下,AI的介入实际上拖累了表现。
研究人员将这一现象称为"参差不齐的技术前沿"。获益最大的那批人知道这条前沿在哪里。大多数人还不知道。
想象一张涵盖知识工作者所有任务的地图:写邮件、市场调研、数据分析、制作演示文稿、调试代码、在模糊问题上做判断……
现在,在这张地图上画一条参差不齐、形状不规则的边界线。边界以内:AI擅长的任务;边界以外:AI力不从心、容易出错甚至会误导你的任务。
这条前沿之所以"参差不齐",是因为它违反直觉。AI能流畅地起草一封有说服力的邮件,却可能在财务计算上自信满满地给出错误结果。它能在30秒内总结一份50页的报告,却可能错过那个改变全局的关键段落。它能写出像模像样的样板代码,但遇到真正新颖的问题时,逻辑往往会出错。
那些真正从AI中受益的人,是通过实践摸清了这条前沿的边界。他们不再把AI当成万能答题机,而是把它当成一个术业有专攻的专家来使用。
观察职场人士使用AI的方式两年多后,大多数人可以归入以下三类。
怀疑者几乎不用AI。他们试过一次,结果平平,便回到了原来的工作方式。他们白白放弃了25%的效率提升,而与那些熟练使用AI的同行之间的差距,正在随时间不断拉大。
过度使用者把AI用在了所有事情上——每一封邮件、每一个决策、每一项调研。BCG研究所警示的正是这类人。他们在简单任务上更快,但在真正重要的任务上反而更差。他们在不知不觉中外包了自己的判断力。
精准用户善于取舍。他们通过反复试错,摸索出了属于自己的那条前沿边界。他们清楚AI能在工作流的哪些环节提速,也知道何时该信任AI的初稿,何时不能把最终决策交给AI。
大多数人介于怀疑者和过度使用者之间,真正做到精准使用的人寥寥无几。这恰恰就是优势所在。
精准用户脑子里有一张清单,列着AI可靠地能帮上忙的事情。对大多数知识工作者来说,这张清单通常包括:
同时,这张清单也会排除以下内容:
清楚这张清单,会从根本上改变你使用AI的方式。你不会再把棘手的判断题丢给AI,然后期待一个可靠的答案。
一个模糊的提示与一个有效的提示之间的差距,几乎始终在于背景信息。大多数人只会写"帮我总结这个"或"给我写一封关于X的邮件"。高效用户则会补充受众、目标、语气和限制条件。
这并不复杂。它就像在给一位有能力但需要了解背景的同事做任务交接,而不是在向一个自己会想办法的搜索引擎发出指令。一个好的交代应涵盖:这是给谁看的、你想达到什么目的、需要什么格式、以及要避免什么。
面向初学者的提示词工程指南详细介绍了影响最大的具体技巧,包括角色扮演提示和少样本示例。
普通AI用户只在卡壳时才去找AI。精准用户则已将AI嵌入日常流程。他们有一套经过验证的常用提示词,把有效的方式沉淀下来,不必每次从零开始。
比如一位自由内容策划师,可能有客户简报模板、文章调研框架和修改核查清单,每个环节都在特定步骤引入AI。她不只是偶尔使用AI,而是建立了一套系统。
如果你想搭建这样的体系,用AI自动化日常任务指南是一个实用的起点,帮助你识别哪些任务最适合优先自动化。
BCG研究中,超出能力边界的任务导致准确率下降19%,原因正是顾问们轻信了本应核实的AI输出。精准用户将AI的产出视为初稿,而非定稿。他们会核查重要的论断,选择修改润色而非直接复制粘贴。
这听起来显而易见,却恰恰是过度使用者频繁踩坑的地方。AI用得越顺手,就越容易停止仔细阅读。BCG研究发现,无论资历深浅,这一现象同样存在——当有经验的专业人士不再质疑AI输出时,他们掉进的是同一个坑。
2023年,大多数知识工作者还在摸索AI的边界。到2026年,两个群体已经明显分化。
一个群体已养成稳定的AI使用习惯。每周有10到20小时的脑力工作,如今由AI完成初稿。他们响应更快、产出更多,承接的工作范围过去需要一整个团队。
另一个群体则变化不大。也许偶尔用一用AI,也许试过几款工具但没看到价值。他们仍在以大致相同的节奏做着同样的工作。
这种差距直接体现在定价能力和承接范围上。拥有强大AI工作流的独立从业者,正在竞争过去只有机构才能拿下的合同。2026年最适合独立从业者的AI工具这一品类持续增长,正是因为回报切实存在——但前提是真正学会了用好这些工具。
你不必成为AI的重度用户,但在竞争激烈的领域,精准使用AI正日益成为一项基本门槛。
你不需要什么框架,也不需要生产力顾问。你只需要五天的诚实观察。
选一个工作周,每天结束时记录两件事:
五天后,你就有了10个数据点。这就是你的初始地图。收获告诉你在哪里加大AI的使用,亏损告诉你在哪里及时止损。
每隔几个月重复一次。工具在进步,你的技能也在进步,前沿边界也会随之移动。
几个实际有效的做法:
从你频率最高的任务开始。 你做得最多的事情,正是精准使用AI回报最快的地方。如果是写邮件,就从这里入手;如果是代码审查,就从这里入手。
建立一个提示词库。 当某个提示词给你带来了很好的结果,就把它保存下来。大多数精准用户都有一份文档,收录了10到20条最常用的提示词。这就是持续获得稳定结果的全部秘诀。
养成核实习惯。 任何要发给他人的AI输出,都设置一个审查步骤。不是所有内容都需要核实,但在发送前有一个标准化的检查,可以防止那种逐渐放松警惕、最终导致准确率下滑的"信任蔓延"。
用AI来探索,而不是做决策。 AI擅长生成选项、梳理问题空间,但在最终拍板上不够可靠。用它来发现你可能遗漏的视角,然后由自己来做决定。
用哪款AI工具重要吗?
没有大多数人想象的那么重要。BCG研究使用的是GPT-4,但这些习惯适用于任何工具:了解你的前沿边界、在提示词中提供背景信息、在关键环节保留自己的判断。当然,部分工具在特定任务上确实更出色——专为编程设计的助手处理代码审查的方式,与通用对话工具是不同的。
如果我从未真正在工作中用过AI,该怎么开始?
从你花时间最多的任务入手。如果是写作,试试用AI起草初稿;如果是调研,试试用它做摘要。选定一个使用场景,把它用好,再逐步扩展。试图一下子把AI用在所有事情上,是人们沦为过度使用者的最常见方式。
资深专业人士也会陷入准确率陷阱吗?
会。BCG研究发现,准确率下降在各个资历层级都有发生。决定因素不是经验多寡,而是能否识别出某项任务超出了AI的能力边界。那些想当然地认为AI在所有方面都可靠的资深员工,表现反而不如保持质疑态度的初级员工。
成为一个精准用户需要多长时间?
大多数人在持续使用2到4周后就能开始看到规律。你不需要几个月。你需要的是在足够多的不同任务类型中积累经验,从而能识别出AI哪些情况下可靠、哪些情况下不可靠。
Harvard/BCG的研究结论在2026年依然成立:AI能让精准用户的效率显著提升,也可能让过度自信的用户变得更不准确。差距不在于你用的是什么工具,而在于你是否了解AI在你具体工作中的真实优势所在。
每个人的前沿边界都不同。开发者的前沿与写作者或策略师的前沿长得不一样。但每个人都有自己的边界,把它摸清楚,比往工具栈里多加一款工具更有价值。
如果你想在一个地方跨任务测试AI、找到真正适合自己工作流的方式,Zemith 提供多款主流AI模型的统一入口,集聊天、编程辅助与AI智能体于一身。不用在多个平台之间来回切换,更容易找到你自己的前沿边界。
一个订阅替代五个。每个顶级AI模型、每个创意工具和每个生产力功能,都在一个专注的工作空间中。
ChatGPT、Claude、Gemini、DeepSeek、Grok 及25+模型
语音 + 屏幕共享 · 即时回答
学习一门新语言的最佳方式是什么?
沉浸式学习和间隔重复效果最好。尝试每天消费目标语言的媒体内容。
语音 + 屏幕共享 · AI 实时回答
Flux、Nano Banana、Ideogram、Recraft + 更多

AI自动补全、改写和按命令扩展
PDF、URL或YouTube → 聊天、测验、播客等
Veo、Kling、MiniMax、Sora + 更多
自然AI语音,30+语言
编写、调试和解释代码
上传PDF,分析内容
iOS和Android完整访问 · 随处同步
聊天、图像、视频和动态工具 — 并排展示

节省数小时的工作和研究时间
受信赖的企业团队
无需信用卡