🚀 突发!GPT-5.4 震撼发布:AI 终于长出“手”了,甚至连鼠标都替你点!

“不是哥们,你来真的啊?” 🤯
当大多数人还在研究怎么写出更好的提示词(Prompt)时,OpenAI 今天直接掀了桌子——GPT-5.4 及面向高复杂任务的 GPT-5.4 Pro 版本正式发布!
如果说以前的 AI 是个只能坐在屏幕里陪你聊天的“最强大脑”,那么这次的 GPT-5.4,就是第一个真正长出“手”的赛博同事。
它不仅能在智商上碾压对手,还能直接接管你的电脑!今天,我们就来深度扒一扒,这次更新到底有多炸裂?新手又该如何快速上手?
🤯 核心震撼:AI 长出了手,人类竟成“手残党”?
这次发布会上最大的王炸,就是 GPT-5.4 成为了 OpenAI 首个原生支持 “电脑操控”(Computer Use) 的通用大模型。
📖 【新手科普小课堂】什么是“电脑操控”?
过去你让 AI 帮你买张电影票,它只能给你一行代码或者一段文字教程,你还得自己去操作。而“电脑操控”意味着,AI 能够像真人一样:看懂屏幕截图 ➔ 移动鼠标 ➔ 点击图标 ➔ 敲击键盘输入。 也就是说,你可以直接对它说:“帮我打开 Excel,把昨天的数据做成折线图并发给老板”,然后你就可以去喝咖啡了,它会自己在电脑上帮你点!
在极其严苛的桌面操控权威测试(OSWorld-Verified)中,人类的平均成功率是 72.4%,而 GPT-5.4 直接飙到了 75%! 没看错,在玩电脑这件事上,AI 第一次在官方测试中超越了人类平均水平。(注:上一代 GPT-5.2 只有可怜的 47.3%)。
💼 顶级“打工人”:44 个行业,无差别降维打击
除了会点鼠标,GPT-5.4 的专业业务能力也进化到了令人发指的地步。
- 📊 投行与金融: 投行建模任务评测得分从 68.4% 暴涨到 87.3%。做出来的 PPT,在人工盲测中有 68% 的概率比前代更受好评。(金融民工狂喜/落泪?)
- 💻 程序员的福音: 它直接吸收了上一代专门写代码的“偏科生” GPT-5.3-Codex 的毕生功力,编程测试得分 57.7%,不仅能力持平,而且反应速度更快,延迟更低。
- 🏆 全能王者: 在涵盖 44 种职业的知识类工作基准测试中,GPT-5.4 与行业顶尖专业人士打平或胜出的比例高达 83%!
🧠 “边想边干”还能听劝:神级交互体验
经常用 ChatGPT 的朋友一定有个痛点:当你让它写一篇长文时,它在那儿吭哧吭哧生成半天,等它写完了你一看——方向完全错了! 只能骂骂咧咧地重新让它写。
这次 GPT-5.4 带来了一个极为人性的功能:思考过程可视化与中途干预(Mid-course Correction)。
📖 【使用场景还原】 现在,GPT-5.4 在生成内容时会展示它的“思考计划”。如果你发现它第一步就想偏了,你可以直接喊停并介入修改方向! 这就好比你站在设计师背后,不用等他做完一整张海报,在他刚画出线稿时你就可以指点江山:“这个颜色不对,换成五彩斑斓的黑。”——极其省时省力!
登录后可查看完整内容,参与讨论!
立即登录