2026.1.30

不止 Office,钻进桌面,MiniMax Agent 一直都可以帮你做 PPT、Excel、Word 和 PDF


今天,我们分享一些 MiniMax Agent 在办公场景的优秀实践。

从上线起,MiniMax Agent 就可以处理 PPT、Excel、Word 和 PDF 等文件。我们认为,一个好的 Agent,需要点亮足够丰富的技能树,才能够在不同的场景,帮助不同角色、不同职能完成任务。

最近一次更新中,我们上线了桌面端与专家 Agent:桌面端让 Agent 进入你的工作环境来直接帮你整理文件、梳理信息;专家 Agent 在注入特定的知识和行为模版,学习具体的 SOP 后,能够在某类任务中干得更加漂亮。

接下来,我们通过几类典型场景,展示 MiniMax Agent 如何工作。

01 长程复杂任务:跨源搜索+复杂逻辑理解+多条件匹配


在大规模跨源信息检索的场景下,Agent 能够完成遍历网站、并行浏览,细节提取和结构化整理的任务。
HR 工作中,每年都需要根据毕业季节,提前几个月做校招计划,需要针对每所重点学校,收集应届生校园招聘会的信息(时间、地点、费用、报名方式等)。HR 需要逐个访问学校官网(这里也存在每个学校网站结构都不同的问题),手动复制信息,粘贴到 Excel,过程复杂耗时。

以北美 20 所名校的校园招聘会信息整合为例,Agent 能够自动列出学校清单,逐个访问各校官网,提取过去半年和未来半年的活动时间、企业报名方式、参与费用等细节信息,整理成 Excel 表格。

Query:
我要帮公司规划明年的北美校招,你先帮我列一下 CS 和 AI 最强的那些学校——Stanford、CMU、MIT 这些,大概 20 所左右。然后一个一个去查他们 Career Fair 的情况:过去半年办过哪些、接下来半年还有哪些、企业要怎么报名参加、大概要花多少钱。查完之后做一份 Excel 给我。

在结构化检索整理信息的基础上,Agent 还能理解复杂逻辑并筛选匹配。

每年 3 月是省考招录报名期。和国考的一次性集中公示招录岗位不同,31 个省份(直辖市、自治区)的招考公告分散在各自的人事考试网上,考生需要逐个访问。

更麻烦的是条件匹配的复杂性:岗位要求"本科及以上"时,硕士是否符合?要求"新闻传播类(专业代码 0503)"时,代码为 055200 的"新闻与传播专业硕士"是否属于此类?要求"应届毕业生"时,已工作 1 年就不符合。还有"本省户籍或生源"这类地域限制。考生需要在每个岗位前逐条对照自己的年龄、学历、专业、户籍、政治面貌,判断是否符合。

Agent 能理解这些规则("岗位的学历要求是本科及以上时,硕士学历也是符合该岗位的""055200 和 0503 都属于新闻传播类"),根据考生的年龄、学历、专业、政治面貌等信息,跨页面抓取招考公告,筛选出所有符合考生条件的岗位,整合生成个性化清单。

02 进入桌面:处理大量本地文件,完成跨模态任务


在真实任务中,Agent 能够完成 500 张电商图片的自动整理和归档。

电商的日常工作中,商品图片需要分类存储,比如"男装-外套-商务"一个文件夹,"女装-T 恤-休闲"另一个文件夹,这样方便快速找图

一个运营面对 500 张新到的商品图,需要不断确认,这是男装还是女装?偏商务还是休闲?该放在哪个目录下?这些判断过去只能由人完成。Excel 看不懂图片,文件管理器也不知道图片是什么内容。

MiniMax Agent 可以自动识别图片,并据此完成后续自动分类、创建文件夹、移动并重命名文件等所有工作。图片理解和动作执行被合并在同一个系统中,你可以放心把素材整理这类工作交给 AI。

Query:
请识别这四个品牌文件夹中每张图片的性别、衣服种类和适用场景,按照「品牌/性别/衣服种类/场景」的层级结构创建文件夹并移动图片,文件命名格式为「衣服种类_场景_序号.扩展名」(如 Coat_Casual_01.png)

整理后文件夹效果为:


除了整理文件,Agent 还能读懂多种格式的本地文件,并基于内容完成写作。

留学申请中,个人陈述(Personal Statement)是关键材料。学生需要根据目标项目的要求,结合自己的作品集、成绩单、个人简历等信息写出一篇有说服力的叙事文章。

Agent 能够读取分散在不同文件里和不同格式的本地文件(PDF 作品集、图片格式的成绩单、Word 简历),理解其中的关键信息(GPA、项目经历、作品亮点),结合申请项目的具体要求,生成个人陈述初稿。
Query:
针对这个文件夹里的所有个人信息,为李记滢写一篇 650 词内的 Personal Statement 英语主文书,用来申请北美的大学。
Agent 生成的 PS 语句流畅:

03 专业场景:从庞杂内容到结构化洞察

法务场景中,Agent 能够完成法条逐版差异识别、变化归类和逻辑提炼的全流程。

制药企业的法务部门需要持续追踪《药品管理法实施条例》的变化。这部条例从 2002 年首次发布至今,经历多次修订,最新版本在 2026 年发布。每次修订都可能影响企业的生产、销售、质量管理等环节。

法务人员的工作是:打开所有版本的条例文件,逐条对比。某条在 V1 版本是这样写的,V2 版本改成了什么?是新增了内容,还是删除了某些表述,还是调整了措辞?某条在 V3 版本突然消失了,是被删除了还是合并到其他条款了?

多个版本,上百个条款,人工对比不仅耗时,还容易遗漏关键变化。

Agent 能逐版本对比条款,对重点条款进行解读,提炼每次修订背后的监管逻辑变化,分析对企业的实务影响,输出完整的深度分析报告。

Query:
请对《药品管理法实施条例》进行相邻版本的横向对比分析(V1-V2、V2-V3、V3-V4 等),并采用可视化方式呈现:每一版本对比先给出对比总表(条款号|修订前|修订后|变化类型∣修订时间),并用颜色或标记区分新增/修改/删除;随后对重点条款进行分类解读,配套原文截图或权威来源引用,最后用 2-3 行总结该次修订的监管逻辑与实务影响。
Agent 准确高效地交付对比分析报告:
金融财报分析中,Agent 能够完成从数据提取、指标计算到可视化呈现的全流程。

投资分析师要写一份腾讯的深度研报时,需要下载多份财报,提取核心财务数据,计算毛利率、净利率、ROE、资产负债率、增长率等多个指标,按照游戏、广告、金融科技、云服务等不同的业务板块拆解收入,测算未来增长情况,最后要把这些数据做成图表

Agent 能够自动采集所需财务数字,完成各项比率运算,对不同业务线收入进行拆分,梳理现金流状况,输出多维度可视化内容,分 Sheet 有序呈现。
Query:
做一个完整的腾讯的财务分析 Excel,包含:1)近年的核心财务数据汇总;2)游戏、广告、金融科技、云服务这几个业务板块的收入对比;3)算一下盈利能力指标、偿债能力指标和成长性指标;4)现金流部分也需要分析一下;每个维度单独一个 Sheet,最后需要堆这几个维度作图并插入最后一个 Sheet。

04 专家 Agent:一句话启动复杂任务

前面展示的案例中,用户都需要写比较详细的指令,需要告诉 Agent 要提取哪些字段、生成什么格式、分几个 Sheet。这对熟悉工作流程的专业用户来说不难,但新手可能不知道该怎么描述需求。

专家 Agent 解决的就是这个问题: 我们把特定领域的专业知识、工作流程、输出标准、相关工具等预先注入到 Agent 中。 用户只需要一句简单的话,Agent 就能自动展开完整的专业级工作。
以"热点追踪"专家为例。如果使用普通 Agent 追踪行业动态和热点事件,用户需要写:

"搜索 Clawdbot 最近 7 天的相关新闻,筛选出 3-5 个有讨论度的话题,每个话题再深度搜索背景信息和各方观点,然后写成 800-1500 字的文章,配 2-3 张图,保存成 docx 文件。"

此刻这套流程已经内置在专家 Agent 中。用户只需输入"Clawdbot 最新消息",Agent 就会自动理解追踪主题并拆解搜索关键词,搜索最新的权威信源,从结果中挖掘近期爆点话题(优先 1 天内、3 天内、5 天内的事件),对每个话题深入搜索背景、数据和观点,撰写 800-1500 字长文并配图,保存为 docx,最后进行事实核查确保准确性。

搭配定时任务,还可以要求专家 Agent 每天定时更新运行一次,每天收到自定义专题的新鲜报道。

整个过程用户只说了一句话,剩下的 Agent 都能够自主细化并完成。
Query:
Clawdbot 的最新消息。
我们展示的这些案例,只是 Agent 能力的一部分。欢迎来一起探索 Agent 的更多实用技巧。

Web 端使用链接:
agent.minimaxi.com

桌面端下载入口:
agent.minimaxi.com/download

企业合作:
api@minimaxi.com

你的工作场景可能更复杂,你的需求可能更独特—— 我们希望倾听你的需求和灵感。

如果你希望 Agent 在某个特定场景下帮你完成工作,欢迎参与下方许愿池活动,填写你最想要的 Expert 功能或建议。如被采纳,我们会 免费帮你构建对应的 Expert,并将额外赠送 2000 积分作为感谢。

Intelligence with Everyone.