AI智能体 – 青瓜传媒 //m.clubpenjuin.com 全球数字营销运营推广学习平台! Thu, 19 Mar 2026 06:34:12 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.2.21 https://static.opp2.com/wp-content/uploads/2021/04/favicon-1.ico AI智能体 – 青瓜传媒 //m.clubpenjuin.com 32 32 百度RedClawAI智能体深度评测 //m.clubpenjuin.com/380067.html Thu, 19 Mar 2026 06:34:12 +0000 //m.clubpenjuin.com/?p=380067

 

百度RedClaw是百度智能云推出的全球首款手机端AI智能体助手,基于OpenClaw框架和VLA多模态大模型打造,通过云端虚拟手机托管实现跨App自动操作。用户只需下载App,即可指挥AI完成订餐、订票、游戏、金融分析等复杂任务,无需任何技术背景即可体验原生AI Agent能力。

一、百度RedClaw是什么?

RedClaw百度智能云于2026年3月推出的全球首款手机端AI智能体应用,定位为”任务执行型AI Agent”。不同于传统语音助手只提供信息,RedClaw能直接操作用户手机,完成跨App的复杂任务。

RedClaw的技术架构:

    • 云端虚拟手机:基于百度自研ARM云服务,AI在云端手机实例中运行
    • VLA多模态大模型:视觉-语言-动作模型,理解屏幕内容并生成操作指令
    • OpenClaw框架:兼容OpenClaw Skills生态,支持个性化扩展

核心差异化:RedClaw不是”给你建议”,而是”替你办事”——从打开App到完成任务全流程自动化。

二、百度RedClaw的用户规模和营收情况

产品数据(截至2026年3月)

指标 数据 说明
发布时间 2026年3月17日 与百度龙虾全家桶同步发布
平台支持 Android(iOS即将上线) 目前仅限安卓
免费体验 10天 新用户云手机免费试用
技术底座 百度ARM云+VLA模型 云端虚拟手机架构

战略定位

    • 所属公司:百度智能云
    • 产品系列:百度”龙虾全家桶”(DuMate、RedClaw、DuClaw、小度龙虾)
    • 目标场景:手机端高频碎片化任务
    • 生态战略:覆盖桌面、手机、云端、家庭四大场景

商业模式

    • 当前阶段:新用户免费体验10天
    • 未来定价:预计订阅制收费(具体方案待公布)
    • 变现路径:服务抽佣、推广合作、增值功能

三、百度RedClaw的核心功能有哪些?

跨App无缝协作(核心能力)

RedClaw能自动在不同手机应用间切换,执行连续操作:

    • 订餐流程:打开外卖App → 搜索餐厅 → 选菜 → 填地址 → 等待支付确认
    • 比价购物:同时在京东、淘宝、拼多多搜索 → 对比价格优惠 → 生成购买建议
    • 资讯搜集:多平台抓取信息 → 自动整理 → 生成每日简报

原生交互体验

模拟真人触屏操作,支持:

    • 点击、滑动、长按
    • 文本输入、图片识别
    • 甚至可操作游戏完成重复性任务

定时任务与自动化

设置定时任务,让RedClaw在指定时间自动执行:

    • 每日自动获取金融数据
    • 定时整理工作周报
    • 自动生成交易策略报告

技能生态兼容(Skills)

    • 适配OpenClaw Skills能力
    • 用户可按需选配个性化技能
    • 扩展AI能完成的任务范围

任务可视化与用户控制

    • 操作可见:AI每一步操作对用户透明
    • 关键确认:涉及隐私或支付时暂停等待确认
    • 主动权:用户始终掌握最终决策权

多模型支持

集成多种大模型提升任务理解:

    • 百度自研千帆(qianfan)模型
    • 第三方模型(如deepseek-v3.1)

四、百度RedClaw面向的人群有哪些?

用户群体 核心需求 使用场景 价值体现
上班族 节省时间、自动化琐事 订餐、打车、日程管理 每天节省30-60分钟
投资者 自动盯盘、数据分析 获取金融数据、生成策略 实时掌握市场动态
网购达人 比价、找优惠 跨平台比价、优惠券领取 省钱省时
资讯爱好者 信息聚合、简报生成 每日资讯自动整理 高效获取信息
游戏玩家 自动化重复任务 游戏日常、材料收集 解放双手
内容创作者 素材搜集、数据分析 热点追踪、竞品分析 提升创作效率
技术小白 零门槛使用AI 无需编程即可自动化 降低AI使用门槛

五、百度RedClaw的应用场景有哪些?

金融投资场景

自动盯盘助手

    • 每日定时获取黄金、股票价格
    • 自动计算技术指标
    • 生成交易策略报告
    • 推送到用户手机

适用人群:股票、基金、黄金投资者

消费购物场景

智能比价助手

    • 同时在多个电商平台搜索商品
    • 对比价格、优惠、评价
    • 生成购买建议报告
    • 提醒最佳购买时机

适用人群:网购频繁、追求性价比的用户

日常生活场景

自动化订餐

    • 根据历史偏好推荐餐厅
    • 自动下单常用套餐
    • 只需确认支付即可完成

行程规划

    • 自动查询交通信息
    • 预订机票酒店
    • 生成完整行程单

信息获取场景

资讯雷达

    • 定时抓取GitHub热门项目
    • 收集科技新闻
    • 生成每日简报
    • 推送到用户手机

竞品监控

    • 监控竞品动态
    • 分析市场趋势
    • 生成竞争情报报告

游戏娱乐场景

游戏助手

    • 自动完成日常任务
    • 收集游戏材料
    • 挂机刷经验

适用人群:手游玩家、想节省时间的学生党

办公自动化场景

周报自动生成

    • 自动收集工作数据
    • 整理本周成果
    • 生成周报文档
    • 发送给相关人员

六、百度RedClaw和同类竞品的差异有哪些?

维度 百度RedClaw 智谱AutoGLM 传统语音助手
核心能力 跨App任务执行 手机操作自动化 信息查询、基础设置
执行深度 全流程自动化 单App内操作 仅返回信息或链接
技术架构 云端虚拟手机 端侧+云端 本地语音处理
使用门槛 零门槛,下载即用 需要一定技术背景 极低
生态兼容 OpenClaw Skills 自有生态 封闭生态
平台支持 Android(iOS待上线) Android/iOS 全平台
商业模式 订阅制(预计) 免费+增值 硬件捆绑/免费

RedClaw的差异化优势

    1. 云端虚拟手机架构:无需本地部署,零门槛使用
    1. 全流程自动化:从打开App到完成任务一气呵成
    1. 跨App协作:能在多个应用间无缝切换执行
    1. OpenClaw兼容:支持丰富Skills生态
    1. 百度生态整合:与百度服务深度结合

相对劣势

    1. 平台局限:目前仅支持Android,iOS用户无法使用
    1. 网络依赖:必须保持网络连接,离线无法使用
    1. 隐私顾虑:AI直接操作手机涉及敏感权限
    1. 商业化不明:正式定价未公布,长期成本不确定

七、百度RedClaw有哪些使用技巧?

技巧1:从简单任务开始

新手建议先尝试简单任务:

    • 查天气、设提醒
    • 打开特定App
    • 搜索指定内容

熟悉后再尝试复杂跨App任务。

技巧2:善用定时任务

设置每日/每周定时任务:

    • 早上自动获取财经资讯
    • 中午自动推荐午餐
    • 晚上自动整理工作数据

让RedClaw成为你的”数字管家”。

技巧3:关注关键确认点

涉及支付、隐私等敏感操作时:

    • 仔细阅读AI的操作说明
    • 确认无误后再授权
    • 定期检查任务日志

技巧4:探索Skills生态

    • 浏览OpenClaw Skills市场
    • 安装适合自己需求的技能
    • 尝试自定义简单任务

技巧5:结合百度生态使用

    • 与百度地图结合:自动导航、查询路线
    • 与百度网盘结合:自动备份、整理文件
    • 与百度搜索结合:深度信息检索

技巧6:反馈优化

    • 任务完成后给予反馈
    • 帮助AI学习你的偏好
    • 持续优化任务执行效果

八、百度RedClaw对于企业和个人有哪些价值?

对个人的价值

价值维度 具体体现 效果评估
时间节省 自动化日常琐事 每天节省30-60分钟
效率提升 跨App任务一键完成 操作效率提升5倍
信息获取 自动整理资讯简报 信息处理效率提升10倍
决策支持 比价、分析、建议 决策质量提升
门槛降低 零技术背景使用AI AI普及化

对企业的价值

应用场景 价值体现 ROI预估
数据监控 自动收集市场数据 人力成本降低70%
竞品分析 持续监控竞品动态 情报获取实时化
客户服务 自动化客户跟进 响应速度提升80%
内容运营 自动采集热点素材 内容产出提升3倍
效率工具 员工日常事务自动化 人均效率提升20%

九、百度RedClaw的产品定价是怎样的?

当前阶段

    • 免费体验:新用户10天云手机免费试用
    • 下载方式:安卓应用商店搜索”RedClaw”
    • 邀请机制:可能需要邀请码(限量测试)

预计定价模式(推测)

版本 目标用户 预计价格 核心权益
免费版 轻度用户 ¥0 基础功能、有限时长
标准版 普通用户 ¥29-49/月 完整功能、标准时长
专业版 重度用户 ¥99-149/月 无限时长、高级功能
企业版 企业客户 定制报价 多账号、API接口、定制开发

计费维度(推测)

    • 按使用时长:云端手机使用时长计费
    • 按任务数量:完成的任务数计费
    • 按功能模块:不同Skills单独收费
    • 订阅制:月付/年付套餐

与竞品价格对比

产品 定价模式 参考价格 特点
RedClaw 待公布 预计¥29-99/月 手机端、云端架构
智谱AutoGLM 免费+增值 基础免费 端侧为主
Claude App $20/月 约¥145/月 对话为主
ChatGPT App 免费+Plus $20/月 对话为主

性价比评估:如果RedClaw定价在¥29-49/月,将具有较强的价格竞争力,特别适合需要自动化手机任务的用户。

十、百度RedClaw的官网和下载地址

官方渠道

    • 应用商店:安卓应用商店搜索”RedClaw”

下载方式

    1. 打开安卓手机应用商店
    1. 搜索”RedClaw”或”百度RedClaw”
    1. 下载安装App
    1. 注册百度账号并登录
    1. 开始体验(新用户免费10天)

支持平台

    • 当前支持:Android系统
    • 即将支持:iOS系统(预计2026年3月底)
    • 未来扩展:可能支持平板等更多设备

使用条件

    • 网络要求:必须保持网络连接
    • 账号要求:需要百度账号
    • 权限要求:需要开启辅助功能等系统权限

总结

百度RedClaw是手机端AI Agent的开拓者,它将OpenClaw的能力从电脑带到了手机,让普通用户也能零门槛体验AI自动化的魅力。

核心优势

    • 全球首款手机端OpenClaw应用
    • 云端虚拟手机架构,零部署使用
    • 跨App全流程自动化
    • 百度生态深度整合

适合人群

    • 想节省时间、自动化日常琐事的上班族
    • 需要自动盯盘、数据分析的投资者
    • 追求性价比、爱比价的网购达人
    • 想零门槛体验AI的技术小白

不足之处

    • 目前仅支持Android系统
    • 必须保持网络连接
    • 涉及敏感权限,隐私顾虑待解
    • 正式定价未公布

总体而言,RedClaw代表了AI Agent向消费级市场普及的重要一步。如果百度能解决iOS支持和隐私信任问题,RedClaw有望成为手机AI Agent领域的标杆产品。

评分:4.0/5(创新性优秀,实用性良好,生态和成熟度待验证)

    • 创新性:优秀
    • 实用性:良好
    • 易用性:优秀
    • 生态成熟度:待验证
    • 性价比:待验证
    • 平台覆盖:一般
]]>
AI智能体之OpenClaw 龙虾【接入个人微信】 //m.clubpenjuin.com/380001.html Mon, 16 Mar 2026 02:15:57 +0000 //m.clubpenjuin.com/?p=380001

 

最近这段时间,AI 真是不太太平啊。

什么 AI 漫剧,Skills,Seedance 2.0 ,OpenClaw 时不时就炸一个热点概念炒一下,我不跟一下都有点显得我像原始人了。

但说实话,这些概念炒的飞起,其实和普通人没什么大关系,顶多也就看两篇文章爽一下,听不知道哪个博主吹一下一人公司起飞,XX 赛道万亿市场。

至少我认为普通人做一人公司是很难的,具体可以看这篇文章:OpenClaw 越火,一人公司死得越惨。

你要知道有的人牛批他不是到了哪个年纪才牛批,人家是从小就牛批(我没说所有人)。

有的人能做成一人公司,那不是有 AI 他才能做成一人公司。

那是因为人家本身就有能力做成一人公司,只是 AI 帮他提升了 N 倍的效率,更牛批了。

但不得不说,这是一轮新的风口浪潮,前几天挂了一波简历,投都不用投,后台未读消息就 99+ 了(这个可能就和咱们普通人有关一些)。

这一轮新浪潮再次来临,我们真得问问自己,真能比父辈做得更好吗?

由于 QClaw 又要邀请码,又 Windows 尽请期待的,所以我就整理这个。

放心吧,用的官方的微信插件不会给你封号的。

好了,不吹了,看看效果吧。

需求分析

帮忙整理文件:打工牛马都知道,工作期间需要接触到的文档非常非常多,如果没整理好的话,等要用的时候。

找起来那 tm 叫一个痛苦,翻来翻去找不到,最后还是问同事再发一份。

搭建一个龙虾助手后,让他给文件打标签帮我们整理一下文件,等我们需要的时候可以和他说个大概,让它给我们快速找出来相关文件。

整理待办事项:我们可以把一些群里的聊天记录截图发给他,然后让它帮我们整理出关于我们部分,我们需要做的相关事项是那些,(整理聊天记录打标签,一键溯源:时间,事件,发消息人,上下关联内容。寻找证据,防止需求不对的时候开撕。 当然这里是我畅想,因为看聊天记录不一定合规,哈哈)

前置条件

接入流程分析梳理

第一步:进入 openclaw 终端升级

我们先进入 openclaw 的终端,无论是云端还是本地部署都可以。

我这里直接用腾讯云云端进行演示教程,云端这里点击登录进入终端。

进来后先检查一下自己的版本是不是 2026.3.8 最新的,如果不是需要升级。

指令:openclaw –version

我的也不是最新的所以我也需要升级。

方案一:

指令:openclaw -update

方案二:

腾讯云一键升级,点之前忘记截图了,抱歉了兄弟姐妹们。

升级完之后检查一下是不是最新的。

第二步,安装开源插件

这个插件,通过企业微信自建应用,可以接入个人微信。

github 开源网站:

https://github.com/BytePioneer-AI/openclaw-china/tree/main

在终端输入指令:openclaw plugins install @openclaw-china/wecom-app

第三步:获取五个参数

先登录企业微信获取这 5 个参数,然后再通过官方的微信插件接入到个人微信中。

企业微信的官方网站:https://work.weixin.qq.com/

获取 corpId 参数

获取 agentId 参数前,我们需要先建立一个应用。

获取 corpSecret 参数

点击查看然后发送后,应用端会弹出一条通知,我们直接打开看就有了。

获取 WeCom App token 和 WeCom App encodingAESKey 参数

第四步,配置参数

把参数配到 wecom 插件里面。

指令:openclaw china setup

敲回车键!

把刚刚的参数一一对应的输入进去。

注意!注意!注意!注意一定要对好再填进去,省的错了又搞!!!!!!

都选 NO !!

第五步,连接与端口放行

修改 gateway.bind 参数为 lan,让 wecom 插件和 OpenClaw 建立通信 。

指令:openclaw config set gateway.bind lan

在企业微信进行接收消息配置。

需要填写的 URL:http://公网IP:18789/wecom-app

查询公网 IP 指令:curl ifconfig.me

我打码的这个就是我们公网的 ip 。

填入后点击保存。

OK 出现报错,上 AI 大法。

OK 用 AI 大法找到端口未放行是主要原因了。

进入防火墙,放行 18789 端口建立 TCP 连接,再次保存,保存成功。

然后我们在进行一下公网的 IP 信任就好了。

OK 到这里就配置完了,我们重启一下龙虾。

指令:openclaw gateway restart

第六步,测试效果

我们进入工作台对企业微信的龙虾进行测试效果,发现没问题。

通过官方的微信插件接入个人微信。

扫码完成一系列操作就可以直接使用了。

总结

整体一共有 六 步,但如果细分的话可能六步还不止,但我把它划成这样容易理解一些。

这是云端的接入教程,兄弟们也可以尝试在本地部署,也是一样的,遇到问题截图发给 AI 就好了。

作者:AI偶然

]]>
GEO优化:企业AI智能体搭建的隐形战场 //m.clubpenjuin.com/379867.html Fri, 06 Mar 2026 02:54:46 +0000 //m.clubpenjuin.com/?p=379867

 

作为AI产品经理,在搭建企业AI智能体时,我们往往倾注大量精力在模型选型、提示工程和性能优化上,却容易忽略一个关键环节:如何让AI智能体在生成式搜索时代被准确引用和推荐。这就是今天要讨论的主题——GEO优化(Generative Engine Optimization,生成式引擎优化)。

为什么AI产品经理必须关注GEO优化?

2025年,搜索的规则已经改变。根据工信部《AI搜索生态白皮书》的数据,国内活跃AI搜索请求日均已突破28亿次,其中商业查询占比高达41%,但品牌搜索结果一致性不足30%。这意味着,当用户向DeepSeek、ChatGPT等AI引擎提问时,大部分品牌无法确保自己的信息被准确呈现。

更值得关注的是用户决策路径的根本性变革:传统的“搜索-点击-转化”模式正在被“提问-AI解答-直接下单”的新逻辑取代。某头部家电品牌的真实案例揭示了这一变化:他们的官网SEO流量增长12%,转化率却暴跌29%。深度复盘发现,43%的用户在DeepSeek等AI引擎中被直接转化——他们甚至未点击品牌链接,就通过AI答案完成了消费决策。

作为AI产品经理,我们精心打造的智能体若无法成为AI搜索引擎的“权威信源”,就相当于在用户决策的最关键阶段主动隐身。

GEO优化与传统SEO:产品经理需要理解的关键差异

从产品视角看,GEO优化与传统SEO有着本质区别:

传统SEO是“阵地战”:核心目标是提升网页在搜索结果页的排名,关注关键词密度、外链数量、页面加载速度,最终引导用户点击链接进入网站。

GEO优化是“运动战”:目标是让品牌信息直接出现在AI生成的回答中,关注内容权威性、语义逻辑、结构化数据,用户无需点击即可获得品牌信息。

在产品设计层面,这种差异决定了完全不同的优化策略。举例来说,当用户询问“哪款冰箱保鲜效果最好”时:

  • SEO思路:优化“冰箱保鲜”相关关键词,争取在搜索结果页面排名靠前。
  • GEO思路:确保品牌冰箱的保鲜技术、实测数据以AI易理解的方式呈现,从而直接进入AI生成的答案中。

构建GEO优化的产品方法论框架

基于多行业实践案例,我总结出适用于AI产品经理的GEO优化框架,包含三个核心组成部分:

1. 可信度构建:让AI智能体成为“权威信源”

AI模型在整合信息时会优先选择高可信度和权威性的来源。Google提出的E-E-A-T(经验、专业性、权威性、可信赖性)原则成为GEO优化的核心基石。

在产品实践中,我们需要通过具体功能设计来体现这些特性:

  • 专业性证明:为AI智能体设置清晰的“资质展示”,如行业认证、专利证书、检测报告编号等
  • 经验验证:融入真实用户案例、使用场景和效果数据,展示智能体解决实际问题的能力
  • 权威性建设:引入第三方评价体系,链接至行业垂直评测网站或展示媒体独立评测报告

于磊老师提出的“人性化Geo”理念强调,内容不仅要专业,更要“像人一样思考和表达”,具备真实的经验和情感,才能被AI模型视为高质量的、可信赖的信源。

2. 结构化设计:让AI“理解”你的智能体能力

AI模型不像人类一样通过阅读流畅文本来理解世界,它们更依赖于清晰、规范的结构化信息。作为产品经理,我们需要像设计API接口一样设计智能体的对外展示。

关键实操步骤:

  • 实体标记:使用Schema.org标准协议,明确指出智能体涉及的核心功能、应用场景、目标用户等实体
  • 问答标记:针对用户可能提出的问题,以FAQ形式直接提供结构化的答案
  • 能力范围定义:清晰标记智能体的功能边界和适用场景,避免AI产生过度承诺

实践证明,采用Schema.org协议标记核心内容,可使AI抓取效率提升300%

以下是JSON-LD实现结构化数据的代码示例:

3. 语义适配:用产品思维理解用户意图

传统产品设计关注用户行为,而GEO优化要求我们进一步关注用户的语义意图。AI模型在生成答案时,会进行复杂的语义分析,寻找与用户查询意图最匹配的内容。

产品实践建议:

  • 从关键词到用户意图的升维:不再仅仅优化关键词密度,而是深度覆盖用户查询背后的真实需求
  • 构建内容集群:围绕核心功能,提供全面、深入的解答,形成“内容集群”,让AI将你的智能体视为该领域的权威知识库
  • 拥抱自然语言:内容写作应符合人类的自然对话习惯,而不是堆砌关键词

GEO优化的产品实施路径

结合业界实践,推荐采用三阶段实施路径:

第一阶段:认知评估与目标定义

作为产品经理,首先需要明确GEO优化的核心指标:

  • 心智占有率:对话份额、被推荐率
  • 对话归因:品牌搜索量、官网流量、认知度

同时对现有AI智能体在各大模型中的展示情况进行全面评估:在不同AI平台测试关键问题,记录当前品牌的露出情况(露出率、排名、内容专业度和完整度等)。

第二阶段:内容重构与语义布局

基于评估结果,重构智能体的对外内容呈现:

  • 结构化内容渗透:将核心卖点、权威数据转化为AI易抓取的FAQ模块
  • 全域信任资产布局:通过官网白皮书、知乎专业解析、行业PR铺设,打造“技术权威”人设
  • LLMs.txt配置:像管理robots.txt一样,通过LLMs.txt控制AI的引用权限

第三阶段:持续监测与迭代优化

GEO优化不是一次性的项目,而是持续的产品优化过程。建立动态监测机制:

  • 识别AI知识盲区:发现AI模型尚未充分理解或引用不足的主题,针对性补充内容
  • 优化引用路径:分析AI引用内容的上下文,调整文章结构和表达方式
  • 对抗语义漂移:确保品牌信息跨平台传递的一致性

避免常见产品误区

在GEO优化实践中,AI产品经理需警惕以下误区:

误区一:认为做几篇AI友好型内容就够了

真相:AI需要“持续更新的内容活水”。随着其他品牌新内容的涌入,早期内容的引用权重会逐步降低

误区二:让SEO团队兼做GEO就行

真相:GEO需要“全域语义重构”,要求内容具备“语义结构化”、“跨平台信任背书”和“实时算法适配”能力

误区三:过度优化导致“黑帽GEO”

真相:坚决反对黑帽Geo,倡导通过规范化的技术手段建立长期、健康的Geo生态

结语:作为产品战略的GEO优化

对AI产品经理而言,GEO优化不应仅仅是营销团队的职责,而应上升为产品战略的重要组成部分。在生成式AI重塑搜索生态的今天,我们设计的AI智能体不仅要功能强大,更要确保在用户最需要的时刻被“发现”和“推荐”。

GEO优化的本质是重构品牌与AI的认知协议——企业需从“内容生产者”升级为“AI原生信息中枢”,通过结构化建设、动态更新、跨平台协同,让品牌内容成为AI生成答案的“默认选项”,最终实现从“被搜索”到“被引用”的流量革命。

在AI时代,产品经理需要掌握的不仅是技术实现,更是这种跨越技术与语义鸿沟的系统思维。只有在产品设计初期就融入GEO优化理念,我们打造的AI智能体才能在日益激烈的竞争中占据先机。

作者:运营怪咖

]]>
2026年智能体AI发展趋势 //m.clubpenjuin.com/379783.html Tue, 03 Mar 2026 01:56:06 +0000 //m.clubpenjuin.com/?p=379783

 

2024年是AI智能体AI Agents)概念深入人心的一年。那些令人惊叹的演示效果吸引了全球的目光。

2025年则是智能体实现从实验室演示向生产环境跨越的一年。我们带着“2025是AI智能体元年”的口号开启了这一年。到年底时,几个明确的信号表明一场更深层次的变革正在发生:Linux基金会成立了Agentic AI基金会,标志着生态系统迈向开放;摩根大通部署的智能体已覆盖超过3万名员工,这暗示了智能体系统在真实生产环境中具有巨大的复利价值。

那么,2026年将迎来什么?在2026年,AI领域的核心转变将不再是追求更聪明的模型,而是转向可协调、可验证且能随时间持续进化的智能体操作系统。

在过去的三年里,我一直站在智能体系统研究、开源和生产应用的最前沿。这段历程可以追溯到2023年初AutoGen的诞生。在本文中,我将总结这些经验,并分享我对2026年智能体AI走向的看法。

1. AI智能体:从演示迈向规模化生产

这个趋势显而易见(甚至很难称之为“预测”)。尽管技术栈尚未完全定型,但由于智能体能带来的巨大经济价值,生产环境的部署早已势不可挡。

尽管势头强劲,但许多团队仍会陷入一个共同的陷阱:没搞清楚真正的投资回报率(ROI)到底在哪里。

对于任何具备一定运营和组织成熟度的机构而言,最高的价值绝非来自一个简单的聊天机器人、通用型智能体或任何孤通的智能体系统。在规模化场景下,缺乏协作的智能体会迅速退化为难以管理的庞大“上下文孤岛”。真正的杠杆在于编排(Orchestration)。最高的收益往往产生于一个协调良好的智能体系统——它能智能地理解组织结构,进行路由分发,并协调多个专业角色来共同完成任何单一智能体都无法独立达成的目标。

2. AGI的雏形?智能体深入职场

OpenAI在2025年10月发布了GDPVal,这是一项衡量模型在44个职业中执行具有经济价值的现实任务表现的评估体系。虽然它看起来不如新模型发布那样风光,但它揭示了一个深远的意义:即使以现有的模型能力,我们也已经能够构建出可规模化执行具备经济价值工作的智能体。这些任务直接取自美国职场的真实工作职能。当智能体同时通过了图灵测试和“就业测试”时,它们开始展现出AGI的雏形。

3. 自改进闭环与验证架构

自进化智能体的技术全景图

AI智能体不应是静态的,而应具备适应性。要想在现实世界发挥作用,智能体必须能够观察自己的行为,从结果中学习并随时间自我优化。缺乏这种能力的智能体,即使再强大,也会随着环境的变迁、假设的失效以及边缘案例的堆积而不可避免地出现性能退化。

对于需要持续、自主且规模化运行的智能体来说,适应能力不是锦上添花的选项,而是基础性的要求。我们最新的研究成果之一《绝对零度推理者》(NeurIPS 25 焦点论文)展示了强化自博弈推理(Reinforced Self-play Reasoning)在几乎零数据的情况下处理编程任务的有效性。这种新范式的核心是一个可验证的环境加上一个任务生成器,允许智能体通过自博弈进行压力测试,并系统地提升其推理能力。

将这一范式扩展到编程任务之外,会直接引出一个更普遍且基础的挑战:验证。对于许多现实任务,目前尚不存在可扩展的验证机制。我们必须构建一套围绕验证的基础设施:通过任务与问题的结构化分解、中间检查点、反馈信号,甚至人工标注与指导,共同将开放式目标转化为可验证的环境。一旦这种验证架构(Fabric)建立起来,自博弈和强化学习就能广泛应用于编程之外的领域,如推理、规划、数据分析、决策以及多智能体协作。

这重新定义了智能体AI的核心挑战与机遇:进步将由那些能使结果变得可观察、可对比且可持续改进的系统来推动。

4. 欢迎来到软件4.0时代:智能体软件(Agentware)

软件正在改变(一次又一次地):从1.0到4.0的演进

安德烈·卡帕斯(Andrej Karpathy)曾有一个著名的论断,描述了软件从1.0到3.0的演进过程。

  • 软件1.0:我们编写计算机代码。
  • 软件2.0:我们对神经网络进行编程。
  • 软件3.0:提示词(Prompts)成为了新的程序。

六个月前,安德烈最后一次公开谈论这一演进,主题是“软件(再次)发生改变”。但就在他演讲时,我们已经跨入了软件4.0时代的门槛——在这个时代,“代理能力”(Agency)与“协作”(Coordination)变得可编程。

在软件4.0中,编程的概念和开发者的角色都发生了根本性的变化。衡量开发者的标准不再仅仅是编写代码或撰写提示词的能力,而是设计、编排和运营AI智能体的能力。编程回归了其本质:定义问题并引导计算,而机器则承担了更多的执行工作。新颖之处在于一种完全不同的计算形式——“智能体计算”——系统具有适应性、目标导向性,能够采取行动,并能通过反馈进行迭代,而非仅仅执行固定的代码路径。

软件进化为“智能体软件”(Agentware)。智能体成为应用程序的基本单元:将推理、记忆、工具/技能、编排和学习闭环封装在一个单一的运行系统中。对于开发者来说,这实在是太令人兴奋了!

5. 智能体互联网的兴起

2025年见证了开放协议的初步形成与巩固,其中著名的包括:智能体工具调用协议MCP;智能体间通信A2A协议;以及智能体支付协议:ACP(智能体商务协议)、AP2(智能体支付协议)和x402。

我们一直在积极实验这些开放协议,并系统地将其中的许多协议集成到AutoGen/AG2中。通过这些早期探索,我开始看到了“智能体互联网”的雏形——在这个世界里,自主智能体可以跨越组织和平台界限,彼此发现、通信、调用工具、交易价值并协同工作。

就像早期的互联网一样,这一层对于全面的开放运营来说仍然粗糙且不完整。然而,在受控的边界内,我们已经看到了网络效应的显现。其意义是深远的:智能体不再是孤立的自动化工具,而是成为了共享全球底座的参与者。能力变得可组合,智能变得可分发,而协作——这一长期以来AI系统中最复杂的问题——终于开始实现规模化。

前行之路

我们正进入智能体AI的新阶段,这不再由更大的模型或更炫的演示来定义,而是由那些可操作、互联、可信且能随时间持续进化的实用系统来定义。

译者:boxi。

]]>
从0到1搭建AI智能体应用! //m.clubpenjuin.com/378147.html Mon, 05 Jan 2026 01:40:06 +0000 //m.clubpenjuin.com/?p=378147

 

如何搭建一个AI智能体应用,满足个性化的需求?下面分享0到1到搭建一个文章内容总结智能体的实操过程。

需求分析

通常,文章总结包含以下内容:

  • 核心观点:提炼文章的主要观点或中心思想,这是文章总结的关键部分,能让读者快速了解文章的主旨。
  • 主要内容:概括文章的主要内容,包括重要的论据、关键的分析和主要的论证过程。
  • 关键信息:提取文章中的关键信息,如重要的概念、定义、新的发现等。

功能说明

智能体需要能够总结文章观点、内容、提取关键信息,并能保存,可方便实时查看

业务流程图

平台

扣子智能体平台:扣子是新一代 AI 应用开发平台。无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 AI 应用,并将 AI 应用发布到各个社交平台、通讯软件,也可以通过 API 或 SDK 将 AI 应用集成到你的业务系统中,而且扣子内部使用无任何费用,其次扣子中集成的插件生态丰富

飞书云文档:将总结内容存储到飞书云文档多维表格中,使用扣子智能体平台可以非常方便的与其对接。

搭建AI智能体应用

在 Coze 搭建AI 智能体应用,主要分为搭建工作流、创建智能体两部分。首先搭建工作流,然后在创建一个智能体,将工作流嵌入进去。

搭建工作流:

步骤1:创建工作流基本信息

登录Coze平台(https://www.coze.cn) → 鼠标停在右侧「资源库」 → 选择「资源」 → 点击「工作流」

步骤2:设置工作流节点(流程)

1、开始:输入url

2、抓取内容:使用”链接读取插件”抓取url链接文章内容

3、总结内容:使用DeepSeek-V3+提示词总结文章内容

4、数据转成json格式:使用Python代码将大模型输出内容转化成json格式数据

5、保存数据:使用”飞书多维表格”插件,将json数据保存到飞书多维表格

飞书多维表格保存的数据如下:

6、结束:输出文章标题、总结内容、标签等

完整的工作流

创建智能体:

步骤1:创建智能体基本信息

选择「工作空间」 → 点击「创建」 → 点击「创建智能体」

步骤2:添加工作流到智能体

选择「工作空间」 → 选择项目开发 → 点击上一步创建好的项目「文章内容总结库」→添加工作流[save_article_summary_to_feishu]

步骤3:发布

点击右上角发布,就创建好一个智能体啦!我们可以返回到项目空间进行查看

以上就是从0到1搭建一个智能体应用的全过程,希望让人人都可以搭建属于自己的AI智能体应用!

作者:叶子

]]>
AI智能体扣子(Coze)搭建教程 //m.clubpenjuin.com/375731.html Wed, 29 Oct 2025 09:44:04 +0000 //m.clubpenjuin.com/?p=375731

要说2025年AI的热门趋势,那AI 智能体一定排在前列。

不用在各种工具中来回切换,也无需编程基础,一句话就能让它帮你生成短视频、小红书图文等内容,高效处理重复工作,提高效率。

但智能体看起来那么复杂,如何创建?工作流又该如何编排?

我们为你整理了一份【扣子AI智能体搭建的详细教程】,直接照着学就够了!

理论说再多,不如跟着步骤上手实操搭建一次【扣子智能体】

第一步:注册扣子

进入扣子官网(https://www.coze.cn),点击左上角「登录扣子」,通过手机号即可注册登录。

图片
图片

第二步:创建智能体

登陆扣子后,点击页面左上角⊕,选择创建智能体。

图片
图片

创建智能体有两种形式:

第一种是「手动创建」,输入智能体「名称」和「功能介绍」,然后单击图标旁边的生成图标,自动生成一个头像。

图片

第二种就是「AI 创建」,输入你的智能体创建需求,扣子会根据你的描述自动创建一个专属于你的智能体。

图片

第三步:编排智能体

任意选择一种创建形式后,单击确认进入「智能体编排页面」

「手动创建」的智能体编排页面是空白,需要你自行设置补充,你可以:

  • 在左侧人设与回复逻辑面板中描述智能体的身份和任务

  • 在中间技能面板为智能体配置各种扩展能力
  • 在右侧预览与调试面板中,实时调试智能体
图片

「AI创建」的编排界面则已经匹配了基础信息,只需要在这个基础上调整优化即可(适合不会写指令的同学)。

图片

创建成功后,下一步就是配置智能体。

🌟步骤一:

首先需要编写提示词,也就是智能体的人设与回复逻辑,后续会根据你设定的人设来回答生成内容。

建议在人设与回复逻辑中指定模型的角色、设计回复的语言风格、限制模型的回答范围,让对话更符合用户预期。

在智能体配置页面的人设与回复逻辑面板中输入提示词,提示词越清晰,越符合预期。

图片

不知道怎么写提示词可以参考左下角的提示词库,然后喂给AI,让它根据模版来生成完整可复制的指令👇

图片

之后,你可以单击页面中的优化按钮,让扣子自带的大语言模型优化帮你将它优化为结构化的提示词。

图片
🌟步骤 2:为智能体增加技能点
 
设定完智能体的人设与回复逻辑后,就需要为智能体配置技能,以保证其可以按照预期完成目标任务。
 

但是如果模型能力可以完成设定的智能体任务,则只需要为智能体编写提示词即可。如果不会,就需要加插件/知识库等技能。

比如针对「小红书图片生成智能体」,就需要选择:

图像生成能力插件、多模态理解技能(让其看懂文本描述+参考图)、小红书风格专属知识库、版权素材搜索技能等等。

图片

另外,你还可以为智能体添加开场白、用户问题建议、背景图片等功能,增强对话体验。例如为智能体添加一张背景图片,使对话过程更沉浸。

第四步:测试智能体

配置好这个AI Agent后,就可以在预览与调试区域中测试这个AI Agent 是否符合预期,测试后可单击清除图标清除对话记录。
图片

第五步:发布智能体

完成调试后,单击发布将智能体发布到各种渠道中,在终端应用中使用智能体。目前支持将智能体发布到飞书、微信、抖音、豆包等多个渠道中,你可以根据个人需求和业务场景选择合适的渠道。

  • 智能体编排页面右上角,点击「发布」
  • 可以在发布页面输入发布记录,并勾选发布渠道(红色框部分)。
  • 选择完成后,即可单击发布
图片
图片
以上。
]]>
2025年AI 5大智能趋势 //m.clubpenjuin.com/375030.html Fri, 17 Oct 2025 01:52:51 +0000 //m.clubpenjuin.com/?p=375030

 

在科技高速迭代的今天,人工智能已不再是实验室中的概念,而是深刻重塑着我们的生活方式和商业模式。作为魔都产品创新的敏锐观察者,本人带您深入探析2025年AI领域最前沿的发展趋势,揭秘这些技术将如何引领下一代产品创新浪潮。

一、生成式AI:从概念爆发到价值兑现

如果说2023年是生成式AI的”概念爆发年”,那么2025年已成为它的”价值兑现年”。最新统计显示,71%的头部企业已将生成式AI深度应用于产品创新全流程,从研发、设计到营销,AI正在重构传统产品开发模式。

案例聚焦

  • 医药行业:跨国药企利用AI加速药物分子筛选,新药研发周期缩短超50%
  • 汽车领域:通过AI仿真与生成设计,研发效率提升50%,成本下降30%
  • 金融科技:摩根大通的“合同智能平台”(COiN)可自动解析数万页法律文件,节省数万小时人力

在上海,我们看到越来越多的本地制造企业将生成式AI融入产品设计环节,实现了从”中国制造”到”中国创造”的智能化转型。

二、AI智能体:从聊天机器人到数字员工

2025年被业内称为”AI智能体元年”,标志着人工智能从被动响应向主动执行的跨越。这些智能体不再只是回答问题的工具,而是能够自主规划、调用工具、执行复杂任务的”数字员工”。

OpenAI和国内的月之暗面等科技巨头正引领这一革命,开发出能够持续学习、自主决策的AI系统。在产品管理领域,AI智能体已能协助产品经理进行市场分析、用户调研、竞品监测等繁琐工作,使团队能够将精力集中在更具创造性的战略规划上。

三、预测分析:数据驱动的产品决策新范式

基于大数据、统计算法和机器学习技术的预测分析,正在成为产品创新的核心驱动力。通过分析历史数据,企业能够精准预测市场趋势、用户需求变化和产品生命周期,从而制定更加精准的产品策略。

在上海的金融科技和零售领域,预测分析已广泛应用于:

  • 用户行为预测与个性化推荐
  • 库存优化与供应链管理
  • 产品定价策略动态调整
  • 潜在风险预警与防范

四、自主系统:从辅助工具到独立运作

自动驾驶汽车、智能机器人、无人机配送系统…这些曾经只存在于科幻电影中的场景,如今已在我们的生活中逐步实现。2025年,自主系统的智能化程度和应用范围都达到了新的高度。

在产品创新领域,自主系统正在改变:

  • 生产制造:智能工厂实现无人化生产,提高效率和精度
  • 客户服务:24/7智能客服提供个性化服务体验
  • 产品维护:预测性维护系统减少设备故障停机时间
  • 物流配送:智能配送网络优化路径,提高效率

五、AI安全:创新与保护的平衡艺术

随着AI技术的广泛应用,信息安全(InfoSec)已成为行业关注的焦点。2025年,AI安全不再是事后补救,而是从产品设计初期就纳入考量的核心要素。

成功的产品创新需要在创新与安全之间找到平衡点:

  • 数据隐私保护:符合GDPR、个人信息保护法等法规要求
  • 算法透明度:确保AI决策过程可解释、可追溯
  • 安全审计:建立常态化的AI系统安全评估机制
  • 伦理考量:避免AI偏见和歧视,确保公平性

未来展望:人机协作的产品创新新时代

普华永道(PwC)的最新预测指出:”未来三年,AI智能体将与人类协同工作,创造1.7亿个新岗位,远超被替代的9200万岗位。人机协作将成为主流工作模式。”

对于产品人而言,这意味着:

  • AI将成为我们最强大的创意伙伴和效率工具
  • 人类的创造力、同理心和战略思维将变得更加珍贵
  • 持续学习和适应能力将成为产品人必备的核心竞争力

结语

人工智能的发展不是对人类创造力的替代,而是对人类潜能的放大。在这个充满变革的时代,本人将持续关注AI技术在产品创新领域的最新应用,与您一起探索智能时代的无限可能。

作者:Ian Huang

来源:魔都翎世产品荟

]]>
AI agent 热门智能体应用详细拆解 //m.clubpenjuin.com/374059.html Mon, 22 Sep 2025 01:10:28 +0000 //m.clubpenjuin.com/?p=374059

 

前几个月,各个大模型公司都发布了自己的智能体应用。这个智能体降低了AI的使用门槛,而且更有针对性。这篇文章,作者通过几个案例教大家如何创建自己的智能体应用。

一、 智能体简介

1.1 Dream Story

Dream Story是利用Coze平台搭建的一款智能体应用,可以通过关键词或简单的描述生成一段图文并茂的故事画本。该应用充分的利用了AIGC的文生图及文生文的能力,将AiGC与实际应用场景深度结合。上架一周即被Coze官方推荐至首页,日均会话1K+。

我们以此热门应用,来开始今天的Ai agent智能体应用拆解。希望让人人都可以搭建属于自己的Ai智能体应用。

2.1 需求分析

目前,在小红书、抖音等各大媒体平台上,通过AI工具批量生成儿童绘本的案例越来越多。许多博主借此迅速涨粉,并已具备了变现能力,因此我们基于此切入点准备做一个儿童画本故事生成的智能体:

2.2 bot功能说明

1. 根据用户输入内容扩写故事内容

请提供一个简短的故事开头或主题,我们将根据此扩写出完整的故事内容。

2. 将故事内容拆分为5个分镜内容

我们会将扩写后的故事内容拆分成5个主要情节或场景。

3. 将5个分镜内容分别生成关键词

从每个分镜内容中提取出描述该场景的关键词。

4. 通过关键词生成相应的图片

使用关键词通过DALLE 3和Stable Diffusion生成相应的图片。

2.3 bot效果展示

DALLE 3 智能体

体验链接地址:

Coze: Next-Gen AI Chatbot Developing Platform

www.coze.com/store/bot/7375114153545187345?bid=6cnmcn3d85g07&from=bots_card&panel=1

问题:一位红衣女侠客在荒凉的戈壁上看到一家客栈

输出效果:

Stable Diffusion

Bot 链接 – Stable Diffusion:

Coze: Next-Gen AI Chatbot Developing Platform

www.coze.com/store/bot/7376115189772648449?panel=1&bid=6cnmeuvqg9g08

问题:一位红衣女侠客在荒凉的戈壁上看到一家客栈

输出效果:

三、 应用制作详细步骤拆解

3.1 创建一个新的Coze项目

创建一个新的Coze项目的步骤如下:

  1. 登录 Coze
  2. 在左侧导航栏的 My Workspace 区域,选择进入指定团队
  3. 在页面顶部进入 Plugins 页面,或进入 Bot 编排页面,在 Plugins 区域单击 +
  4. 单击 Create Bot
  5. 在 Create Bot 对话框,完成配置并单击 Confirm

3.2 Bot的基本结构

Dream Storybook-DALLE 3主要使用了工作流的方式来实现故事与图片的生成,具体的实现步骤如下;

3.2.1 bot基础设置

  1. 基础prompt,定义调用工作流即可
  2. Background image,选择一个符合场景的图片
  3. Voices,儿童绘本选择一个能够吸引小孩子声音
  4. 开场白,可以使用markdown的格式放一些生成图片的效果图,能够更好的吸引用户使用

3.2.2 bot工作流设置

1、工作流整体结构图

2、输入

接收用户输入内容,用于后面流程分析

3、LLM大模型解析

模型选择

-建议选择GPT-4o或GPT 4 Turbo

-由于用户使用bot时调用workflow会增加响应回复时长甚至因为工作流较复杂导致请求超时,如不需要在prompt中处理极其复杂的逻辑,可优先使用GPT-4o

prompt配置

-在工作流中写prompt与在bot中写prompt规则一致

-Dream Storybook-DALLE 3中prompt解析主要分为以下三部分

1)角色定义

你是一个儿童绘本的专家,擅长根据用户的简单描述来创建详细且吸引人的故事。

2)流程1:解读内容并生成分镜

-分析{{input}}内容及语言
-创造五个分镜内容,分镜内容包括标题、正文
-每个分镜内容为一组数据,生成的标题赋值到title,生成的正文赋值到text
-将title、text翻译成{{input}}对应语言
-将title、text按下方格式严格拼接为一个json字符串到content中输出
-最终输出格式示例,仅供参考:
content:"[ {"title": "title1","text": "text1"},{"title": "title2","text": "text2"},{"title": "title3", "text": "text3"},{"title": "title4","text": "text4"},{"title": "title5","text": "text5"}]"

3)流程2:以分镜内容为基础生成图片关键词

- 将流程1生成的五个分镜内容分别生成五组适用于DALLE 3图片生成工具的关键词
- 关键词包括三部分内容:角色描述、场景描述、通用关键词。
- 对于角色和场景的描述都要尽可能的详细
- 如分镜内容中涉及到相同场景或角色描述时相同的部分必须使用相同关键词
- 与图片风格相关的关键词必须使用相同的
- 通用关键词为默认固定值,其默认固定值为:dynamic composition、animation aesthetic、children's book illustration、Disney style、in the style ofWalt Disney、fairy tale style、animation aesthetic、peaceful scene、warm lighting、fantasy elements、fantasy scene、dynamic composition、storybook illustration、high detail、hyper quality、masterpiece、highres、cute
- 将五组最终关键词翻译成英文词组,将五组英文词组作为一个数组输出到prompt
格式如下,仅供参考:
prompt:["","","","",""]

output配置(输出格式如下)

  1. content:存放根据prompt生成的故事标题与正文;输出格式为string字符串
  2. prompt:存放根据prompt生成的图片关键词;输出格式为一维数组

4、code输出内容结构解析

通过代码的方式解析content内容,由字符串转换成二维数组,见下方

async function main({ params }: Args): Promise<Output> {
    const ret = {
        
        "outputcontent": JSON.parse(params.inputcontent)
    
    };

    return ret;
}

//代码含义解读:
params.inputcontent 是一个包含JSON格式字符串的变量,即在LLM大模型解析时生成的title、text。

JSON.parse() 是JavaScript中的一个方法,用于将JSON格式的字符串转换为JavaScript对象。

outputcontent 是解析后的JavaScript对象,及将input content由一个字符串转换成一个二维数组。

所以,"outputcontent": JSON.parse(params.inputcontent) 的作用是将 params.inputcontent 中的JSON字符串解析成JavaScript对象,并将其赋值给 outputcontent 变量。

举个例子,如果 params.inputcontent 的值是 '{ "title": "在森林里跳舞的开始", "text": "小女孩穿着白色的连衣裙,在阳光照射下的森林里快乐地跳舞" }',那么执行 JSON.parse(params.inputcontent) 后,outputcontent 的值将是一个包含两个属性的对象:
{
    name: "Alice",
    age: 25
}
如果实在理解不了,遇到想要将一个字符串转换为二维数组的情况,可直接复制本段代码,将inputcontent与outputcontent替换为对应的输入与输出即可

5、图片生成

-添加DALLE 3插件,选择Batch processing 批量生成,即可一次性生成5张图片

-如选择Single time则只会根据第一条prompt生成一张图片

6、结果输出

最终结果输出时我们需要展示给用户是标题分镜内容及对应的图片

1)Selec Mode 可选择“Answer directly Answer Content(直接使用下方内容回复)”

2)固定格式内容输出,可是使用Markdown或html的格式

  • ##二级标题
  • * 内容 * 正文内容使用斜体
  • ![](图片链接) 将图片链接直接展示
  • *** 分割线
## {{outputtext[0].title}}
*{{outputtext[0].text}}*
![]({{outputimage[0].data_structural[0].image_thumb.url}})
 
***
 
## {{outputtext[1].title}}
*{{outputtext[1].text}}*
![]({{outputimage[1].data_structural[0].image_thumb.url}})
 
***
 
## {{outputtext[2].title}}
*{{outputtext[2].text}}*
![]({{outputimage[2].data_structural[0].image_thumb.url}})
 
***
 
## {{outputtext[3].title}}
*{{outputtext[3].text}}*
![]({{outputimage[3].data_structural[0].image_thumb.url}})
 
***
 
## {{outputtext[4].title}}
*{{outputtext[4].text}}*
![]({{outputimage[4].data_structural[0].image_thumb.url}})

四、 常见问题和解决方案

如何在工作流程确定使用插件的参数及使用规则

4.1 为什么要知道插件的用法?

为了确保工作流的顺利进行,插件参数的输入需要严格遵循格式要求。因此,在使用大语言模型(LLM)或其他工具时,必须预先定义好插件所需的参数格式,以确保插件能够成功运行。

4.2 如何了解插件的用法?

以DALLE 3和Stable Diffusion举例,可以在coze上找一个功能较全的聊天机器人,直接提问“stable diffusion 插件参数及用法”,回答如下,如对某一个参数有疑问可继续展开询问:

markdown的常见语法

1、我们如果想要输出内容为固定格式需要使用markdown格式,什么是markdown及常见用法可查看下图

2、该bot中标题、分割线、图片展示等语法

补充stable diffusion 在workflow中调用方法。

Stable Diffusion的text_prompt格式要求比较严格,需要是数组格式,此处需要通过代码方式解析格式,如果没有代码基础,可以直接修改参数值后饮用。

第一步:使用LLM大语言模型解析关键词格式

注意:大模型存在一定解析失败的概率

– 最终输出格式如下,严格拼接为一个json字符串到prompt输出,最终输出格式示例,仅供参考:

- 最终输出格式如下,严格拼接为一个json字符串到prompt输出
最终输出格式示例,仅供参考:
prompt:"[
  {
    "text": "A(0)",
    "weight": 1
  },
  {
    "text": "A(1)",
    "weight": 1
  },
  {
    "text": "A(2)",
    "weight": 1
  },
  {
    "text": "A(3)",
    "weight": 1
  },
  {
    "text": "A(4)",
    "weight": 1
  }
]"
 
 
//prompt输出参数名称,可替换

第二步:代码解析字符串格式为数字

生成单张图片

async function main({ params }: Args): Promise<Output> {

    const ret = {
        "outputprompt": JSON.parse(params.inputprompt),
        "outputtext": JSON.parse(params.inputtext)
    };

    return ret;
}

生成多张图片

async function main({ params }: Args): Promise<Output> {
    const inputPrompts = JSON.parse(params.inputprompt); // 假设是一个数组
    const formattedPrompts = inputPrompts.map(text => ({
        "prompt": [
            text
        ]
    }));

    const ret = {
        "outputprompt": formattedPrompts,
        "outputtext": JSON.parse(params.inputtext)
    };

    return ret;
}

4、 欢迎讨论:

生成图片很难保证一套图片的角色和画风一致,大家有什么好的解决方案分享么~ (可以通过评论此文档或者在群聊里沟通哦)

五、如何利用Coze变现

5.1 什么是BlueAD?

BlueAD 是利用生成式人工智能改变营销和广告行业的革命性平台。它简单高效。开发者可以轻松地集成我们的 API,使他们的 GPT 、Coze或其他 AI 软件从中受益。此外,BlueAD也提供越来越多的广告形式和策略,以供广泛应用。

5.2 如何通过BlueAD变现?

如果你使用Coze、GPTs等AI Agent平台,都有能够商业变现变现的机会,例如coze只需要将“BlueAD”插件加入到Bot中获取接入广告,你的使用者查看了广告即可获得一定比例的收入奖励,Coze上已经有很多高流量的bot已经接入了这个插件,有变现需求和兴趣的同学可以试试~

参考资料:AI Agent 智能体榜单

作者:jyc

]]>
如何用Coze搭建一个AI预约智能体? //m.clubpenjuin.com/373202.html Fri, 29 Aug 2025 01:35:17 +0000 //m.clubpenjuin.com/?p=373202

 

预约场景在生活和工作中很常见,比如预约某个场地(会议室、球馆、棋牌室、舞蹈室…),比如预约某项服务(美容美发、理疗推拿、咨询服务..)…

记录预约信息的方式有很多,使用最广泛的就是纸笔,进阶一点的会用到预约登记的H5/小程序。但不管使用的是什么工具,预约记录的本质的逻辑无外乎是如下图所示:

从下图的表格中可以很直观地看出优劣势:

由此我开启了一个思考,是不是可以搭建一个AI预约智能体,来处理预约这件事;

通过梳理,大模型要实现上述4件事,除了本身的语言对话能力外,还需要写入表格,和确认是否可预约,涉及到以下2两条工作流:

智能体搭建平台:Coze

搭建内容:工作流(Workflow)X2,智能体X1

操作路径:工作空间-资源库-资源-工作流

平台费用:创建免费,工作流运行时调用插件及大模型需消耗Token。平台账号可免费注册,每日有免费Token额度,超额需充值

智能表格创建工具:飞书-多维表格(个人用户可注册)

步骤1:创建预约记录表

首先我们需要有一个记录登记信息的表,这里还是可以直接用上我们的飞书智能表格,下图是我根据我的业务场景设计的,大家可以根据自己的实际预约使用场景增减字段;

-这里,我预约的日期、预约人、联系电话、备注信息都是文本格式。

步骤2:创建工作流

工作流1:写入表格

上图是整条工作流的完整全貌,除了开始和结束节点是固定的之外,主要包含4个节点模块:

-时间插件:这相当于给大模型带上“电子手表”,方便它能看时间,知道当下是什么时间进行对话。直接在插件库中搜索[当前时间]随便选一个链接成功率高的即可;

-大模型1:这里它的作用就是像“秘书”一样,帮我们整理有用的信息。在一个预约对话场景中,我们最核心要录入的信息就是[预约日期]、[预约时间段]、[预约人]、[预约人联系方式]、[备注]。这里需要大模型整理输出这些。;

输入部分,点击右上角加号,新增两个变量,一个是引用开始节点输入的内容,另一个引用时间插件,变量的名称不支持中文,用拼音或者是英文短语都可以,看自己喜欢,只要自己能知道每一个变量名称对应什么值就可以了。

然后是系统提示词部分,可以理解为你写给AI的“培训手册”,要包含要让他做什么,要怎么使用输入给他的这些信息。其中引用输入的变量,需要用大括号。

输出字段这边,要让AI输出5个字段,那就点“+”添加五个变量名称,这里需要跟系统提示词中要对应起来,变量类型选择string即可。

-大模型2:这里也可以直接选择插入代码节点,它的作用是将上一节点大模型输出的字段,按照写入表格的格式要求,整理成对应的格式。

输入部分,将上一节点大模型输出的5个字段,作为输入变量。系统提示词这边写入要AI整理的格式(这里的格式是根据下一节点飞书插件要求的写入格式定义的),输出的变量格式选择Array-Object。

-飞书表格插件:这个是扣子官方的插件,从插件库中检索“飞书智能表格”即可,app_token写上要写入的飞书智能表格的文档地址。record变量引用上一节点大模型输出字段即可。

配置完成,可以点击“试运行”测试一下,输入一段话,看是否可以顺利整理写入飞书表格中。测试正常即可点击发布这条工作流。

工作流2:确认是否可预约

接下来需要新建第二条工作流,下图是该条工作流的全部节点,除了开始和结束节点外,主要包含飞书插件和大模型两个节点。

-飞书插件:这里插件的作用是获取表格内所有的信息,供后续大模型阅读理解。在插件库中检索“飞书智能表格”,找到search_record这个插件。

这个插件,只需要输入要读取的飞书智能表格的链接即可,首次调用需要完成授权;

-大模型节点:大模型在这里的作用主要是分析处理内容的,输入部分,需要将开始节点和插件节点输出的内容引用为变量。

提示词的部分,就需要给AI设定,什么情况下才算可以预约,什么情况不可以预约,可预约要输出什么,不可预约要输出什么。

同样设置完成之后,可以点击“试运行”对工作流进行测试,测试前,可以先在表格内手动写入一个预约信息,然后测试用例上,涵盖这个已经写好的时间段,看大模型是否正确识别预约。

步骤3:编辑智能体

完成上述两步,还不能实现自动化流程运转,还需要编辑一个智能体。智能体就像是“大脑”,工作流就像是“手脚”,由大脑根据不同的情况,指挥调用不同的工作流。

在工作空间-项目开发-+项目中,选择创建智能体。

创建完成会进入编辑智能体的页面,分为三栏,左侧是智能体的人设与回复逻辑(需要在这部分编辑规则,明确调用工作流的场景和流程等),中间是编排部分(主要是添加技能,添加工作流,对智能体的能力进行配置),最右侧是预览和调试(作用是当你配置好左边两栏之后,测试效果用的,可以根据测试的情况,再去调整左边的人设)

在中间的编排-工作流区域,添加上我们前面编辑好的两条工作流,在插件部分,添加一个获取当前时间的插件。用户的输入方式可以调整为语音输入。

下面的图是我基于我预设的场景编写的智能体提示词。任何与回复逻辑没有标准的答案,需要根据实际的业务场景进行编写。注意这里要让智能体调用某条工作流,或者使用某个插件时,需要用大括号将对应的名称引用出来,这样智能体才能知道你要它调用的具体是什么。

步骤4:测试与发布

完成人设和技能的配置后,可以在最右边的预览与调试栏进行测试,这里测试时需要尽量模拟实际的对话场景,如果结果不满意,可以通过左边的人设进行调整。

测试完成之后,可以点击右上角,发布智能体。智能体可以部署在办公软件飞书,公众号,或者是通过API方式部署在专门的H5上。

以上是预约智能体的初步实验笔记

作者:笛仁杰

]]>
如何用Coze搭建一个AI预约智能体? //m.clubpenjuin.com/372592.html Sun, 17 Aug 2025 00:05:17 +0000 //m.clubpenjuin.com/?p=372592

 

预约场景在生活和工作中很常见,比如预约某个场地(会议室、球馆、棋牌室、舞蹈室…),比如预约某项服务(美容美发、理疗推拿、咨询服务..)…

记录预约信息的方式有很多,使用最广泛的就是纸笔,进阶一点的会用到预约登记的H5/小程序。但不管使用的是什么工具,预约记录的本质的逻辑无外乎是如下图所示:

从下图的表格中可以很直观地看出优劣势:

由此我开启了一个思考,是不是可以搭建一个AI预约智能体,来处理预约这件事;

通过梳理,大模型要实现上述4件事,除了本身的语言对话能力外,还需要写入表格,和确认是否可预约,涉及到以下2两条工作流:

智能体搭建平台:Coze

搭建内容:工作流(Workflow)X2,智能体X1

操作路径:工作空间-资源库-资源-工作流

平台费用:创建免费,工作流运行时调用插件及大模型需消耗Token。平台账号可免费注册,每日有免费Token额度,超额需充值

智能表格创建工具:飞书-多维表格(个人用户可注册)

步骤1:创建预约记录表

首先我们需要有一个记录登记信息的表,这里还是可以直接用上我们的飞书智能表格,下图是我根据我的业务场景设计的,大家可以根据自己的实际预约使用场景增减字段;

-这里,我预约的日期、预约人、联系电话、备注信息都是文本格式。

步骤2:创建工作流

工作流1:写入表格

上图是整条工作流的完整全貌,除了开始和结束节点是固定的之外,主要包含4个节点模块:

-时间插件:这相当于给大模型带上“电子手表”,方便它能看时间,知道当下是什么时间进行对话。直接在插件库中搜索[当前时间]随便选一个链接成功率高的即可;

-大模型1:这里它的作用就是像“秘书”一样,帮我们整理有用的信息。在一个预约对话场景中,我们最核心要录入的信息就是[预约日期]、[预约时间段]、[预约人]、[预约人联系方式]、[备注]。这里需要大模型整理输出这些。;

输入部分,点击右上角加号,新增两个变量,一个是引用开始节点输入的内容,另一个引用时间插件,变量的名称不支持中文,用拼音或者是英文短语都可以,看自己喜欢,只要自己能知道每一个变量名称对应什么值就可以了。

然后是系统提示词部分,可以理解为你写给AI的“培训手册”,要包含要让他做什么,要怎么使用输入给他的这些信息。其中引用输入的变量,需要用大括号。

输出字段这边,要让AI输出5个字段,那就点“+”添加五个变量名称,这里需要跟系统提示词中要对应起来,变量类型选择string即可。

-大模型2:这里也可以直接选择插入代码节点,它的作用是将上一节点大模型输出的字段,按照写入表格的格式要求,整理成对应的格式。

输入部分,将上一节点大模型输出的5个字段,作为输入变量。系统提示词这边写入要AI整理的格式(这里的格式是根据下一节点飞书插件要求的写入格式定义的),输出的变量格式选择Array-Object。

-飞书表格插件:这个是扣子官方的插件,从插件库中检索“飞书智能表格”即可,app_token写上要写入的飞书智能表格的文档地址。record变量引用上一节点大模型输出字段即可。

配置完成,可以点击“试运行”测试一下,输入一段话,看是否可以顺利整理写入飞书表格中。测试正常即可点击发布这条工作流。

工作流2:确认是否可预约

接下来需要新建第二条工作流,下图是该条工作流的全部节点,除了开始和结束节点外,主要包含飞书插件和大模型两个节点。

-飞书插件:这里插件的作用是获取表格内所有的信息,供后续大模型阅读理解。在插件库中检索“飞书智能表格”,找到search_record这个插件。

这个插件,只需要输入要读取的飞书智能表格的链接即可,首次调用需要完成授权;

-大模型节点:大模型在这里的作用主要是分析处理内容的,输入部分,需要将开始节点和插件节点输出的内容引用为变量。

提示词的部分,就需要给AI设定,什么情况下才算可以预约,什么情况不可以预约,可预约要输出什么,不可预约要输出什么。

同样设置完成之后,可以点击“试运行”对工作流进行测试,测试前,可以先在表格内手动写入一个预约信息,然后测试用例上,涵盖这个已经写好的时间段,看大模型是否正确识别预约。

步骤3:编辑智能体

完成上述两步,还不能实现自动化流程运转,还需要编辑一个智能体。智能体就像是“大脑”,工作流就像是“手脚”,由大脑根据不同的情况,指挥调用不同的工作流。

在工作空间-项目开发-+项目中,选择创建智能体。

创建完成会进入编辑智能体的页面,分为三栏,左侧是智能体的人设与回复逻辑(需要在这部分编辑规则,明确调用工作流的场景和流程等),中间是编排部分(主要是添加技能,添加工作流,对智能体的能力进行配置),最右侧是预览和调试(作用是当你配置好左边两栏之后,测试效果用的,可以根据测试的情况,再去调整左边的人设)

在中间的编排-工作流区域,添加上我们前面编辑好的两条工作流,在插件部分,添加一个获取当前时间的插件。用户的输入方式可以调整为语音输入。

下面的图是我基于我预设的场景编写的智能体提示词。任何与回复逻辑没有标准的答案,需要根据实际的业务场景进行编写。注意这里要让智能体调用某条工作流,或者使用某个插件时,需要用大括号将对应的名称引用出来,这样智能体才能知道你要它调用的具体是什么。

步骤4:测试与发布

完成人设和技能的配置后,可以在最右边的预览与调试栏进行测试,这里测试时需要尽量模拟实际的对话场景,如果结果不满意,可以通过左边的人设进行调整。

测试完成之后,可以点击右上角,发布智能体。智能体可以部署在办公软件飞书,公众号,或者是通过API方式部署在专门的H5上。

以上是预约智能体的初步实验笔记

作者:笛仁杰

]]>