Manus介绍

最近武汉团队的Manus非常火爆,以一个高智能Agent的方式,引起了国内AI行业震动,它主要是解决了这几个问题:

  • 自主任务规划与执行:能将复杂任务分解为多个子任务,自动规划合理执行步骤,通过 “规划 - 执行 - 验证” 的多代理协同架构,独立完成从目标设定到成果交付的全流程任务。如筛选简历时,可自动理解解压等隐藏指令,完成解压缩、浏览简历、记录重要信息、生成排名建议并划分候选人等级等操作,无需用户额外提示或干预。

  • 强大的工具调用能力:可在虚拟环境中调用各类工具,如编写和执行代码、智能浏览网页、操作网页应用,支持跨平台操作,内置浏览器、代码编辑器等工具。在分析股票价格相关性时,能通过 API 访问信息网站获取数据,用 Python 进行数据分析和可视化,引入金融专业工具深入分析,最终以数据可视化图表搭配详尽报告反馈结果。

  • 直接交付完整成果:不仅提供解决方案,还直接交付完整任务成果,如生成报告、表格或可视化图表。例如为用户做旅行规划时,能提供个性化旅行手册;教育场景中,能为教师创建教学材料。

  • 云端异步处理:任务在虚拟环境中持续运行,用户无需保持在线。

  • 深度记忆功能:记录用户历史操作习惯,优化后续执行路径。

Manus 案例库 - 快速学习 Manus 如何使用:

https://www.aisharenet.com/manus-anlikubao/

一些使用Manus生成的案例:

https://manus.im/share/lLR5uWIR5Im3k9FCktVu0k?replay=1 银川中卫亲子游5天4夜路线规划 - Manus manus产品技术实现分析与未来展望 - Manus NotebookLM中打断AI播客的功能实现方法 - Manus monica.im退出ai agent产品manus的信息收集 - Manus OpenAI大事件网站设计概述 - Manus

OpenManus 产品体验

同步MetaGPT团队也做了一个类似开源版本,叫做 open-manus ,很容易就复刻执行,体验了一下OpenManus。(github地址:https://github.com/mannaandpoem/OpenManus)

按照描述它大概产品特性如下:

  • 模块化 Agent 系统

    • Manus 主代理:如同项目经理,能精准理解用户需求。比如用户提出 “策划一场公司年会” 的需求,主代理会明确年会的规模、预算、时间等关键信息,然后协调其他模块开展工作。

    • PlanningAgent:像战略专家,将复杂任务分解为可执行的步骤。对于年会策划任务,它会把任务拆解为场地预订、节目安排、嘉宾邀请等子任务,并规划每个子任务的具体步骤。

    • ToolCallAgent:作为技术专家,在任务执行中调用相应工具。在年会策划中,它可能会调用网络搜索工具找合适的场地,调用文档编辑工具制作嘉宾名单等。

  • 多任务处理能力

    • 网页浏览与信息收集:可自动控制浏览器,按要求访问网站,抓取关键信息并整理。如收集旅游景点信息,能访问各大旅游网站,提取景点介绍、门票价格等信息。

    • 文件操作:能快速对文件进行分类、重命名、内容提取等操作。比如可将一个文件夹中的文档按类型自动分类,或从多个文件中提取特定内容汇总。

    • 编程协助:能协助编写代码,根据需求生成代码片段,完成项目框架搭建,并进行调试和优化。若要开发一个简单的用户登录系统,它可生成相关的代码框架和基本逻辑。

  • 实时反馈机制:用户可以直观地看到 AI 的思考过程和任务执行进度,便于干预和调整。比如在生成一篇长文时,用户能看到 AI 逐步生成内容的过程,可随时让 AI 调整方向或补充内容1。

  • 底层 LLM 驱动:依赖大语言模型(如 GPT-4 等)生成任务规划与内容。利用大模型的强大语言理解和生成能力,为各种任务提供智能支持。

  • 配置灵活性:通过 config.toml 文件自定义 API 密钥、模型参数(如随机性、生成长度),方便用户根据自身需求和场景进行个性化配置。

我设定的任务一:

帮我生成一个高一语文《红烛(闻一多)》的课堂讲课逐字稿,生成对应逐字稿和讲课使用的PPT课件

提交给它的界面如下:

执行到第3步:生成了逐字稿。(感觉差点意思)

执行到第16步,生成了md格式的ppt:

从最终生成质量来看比较一般,无论是逐字稿还是PPT,下载的一张图片打开还是报错。

我设定的任务2:

帮我设计一个七天六夜的去新疆旅游的攻略,必须包含酒店、景区信息,包括每一天的行程,最后帮我生成一个整个旅游行程安排的PPT,方便我给别人介绍

第1步:通过搜索获取景点信息

第6步:生成了基本的旅游行程安排

第7步:创建行程介绍PPT

旅游行程结论:

只有简单的旅游行程安排,酒店信息没有,行程介绍PPT也没有生成。在Call本机工具层面还是比较薄弱。

一些初步结论

  1. 从执行过程来看,主要就是利用搜索,组件是使用 broswer_use 包,然后整个过程一直与大模型这个大脑进行交互反馈,不能够很好的调用本机的现有工具。

  2. 从模型使用来看,目前测试了豆包、deepseek、qwen、cluade 等模型,效果最好的是Cluade,因为支持function call能力,国内的模型,勉强能跑的只有deepseek和qwen,相对来说qwen效果好一些,但是实际他们都不支持function call,所以整个体验会比较差。

  3. 距离生产实际使用还有距离,从体验来看,确实不如 Manus 这种跑在容器中的产品,毕竟open_manus只是三个小时做出来的产品,从目前来看还比较薄弱,但是上线5天,代码已经有139次commit了,按照这种迭代速度未来可期!

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐