感兴趣的朋友可以看看这个基础版的教程。
多次提到过,智能体是个趋势。好的智能体,可以根据知识库、数据库以及对话不断自我训练,按照你特定的工作流,帮你把活干好。
想要创建高级智能体,你必须把工作流给吃透,可是这部分多少需要点技术基础。
那没有基础,又没有大佬指点,要怎么解决呢?
好说!找AI啊,找Kimi啊!你把每一步交给AI协助你干,是不是就简单多了!
你只需要把需求交代清楚,再利用我下面的工作流,就可以搞定。
应网友需求和之前的承诺,今天咱们上硬菜!
为了照顾新手,我会以一个独特的方式讲解。
我不是技术出身,只在大学自学过计算机应用。
后来都是从事的运营管理方面的工作。
同是“天涯沦落人”,我懂零技术基础的朋友,想要手搓智能体的难处。
所以我会站在小白的角度,用Kimi来协助创建。
一个月前做计划时,只用了Kimi和阅读助手,
但这还不够高效和简单,于是我重新推倒了,
专门站在0基础小白的角度,又重新写了一遍。
加上了更高效的工具,引入了双屏操作的玩法。
这篇扣子长文教程,重点分明,细节拉满,
会给你一个别样的视角,相信看完之后,你对扣子更加了解,便于你创建属于自己的智能体。
建议慢慢细看,也可以收藏后观看。
我将采取逐步深入的方法,讲两个实操案例,分为三个部分:
03 结语
coze用的GPT-4Turbo,插件也更多,效果确实更好。
国外版操作界面全英文,好在跟国内版类似。
我就以国内版(称扣子)为例讲解,咱们先掌握国内的,要用国外版时,操作起来也方便。下图为国外版效果。
好了,正题开始。这个部分先用基础效率工具。
之前的文章已经介绍过基础操作了,这里说重点和相关细节。本案例是用插件和知识库,做一个专用于爆文写作的智能体。
步骤1:做个知识库,堆满你的创意弹药
基于知识库做智能体,知识库非常重要!而且后面,我们编写提示词也要用到,请认真看下哦,尤其是我加粗的部分!本身写作智能体不需要很复杂的知识库,但为了大家理解并用好知识库,我在这里详细介绍下。
1. 简介:知识库是一个智能文档管理和检索平台,类似于虚拟图书馆。
2. 功能:支持全文检索,能帮助用户快速定位所需信息。可以解决大模型幻觉、专业领域知识不足的问题,提升大模型回复的准确率。
3. 应用场景:适用于语料补充、客服自动化、垂直领域知识应用等多种场景,帮助用户更有效地获取和管理知识。
这个部分操作比较麻烦,我用Kimi生成了思维导图,方便大家阅读和理解。
划重点!收集的文档资料,尤其是需要调用图片的,最好保存为markdown格式(.md),看下图框中的位置,这种图片格式就是markdown格式的标记符,相当于图片ID,这样AI可以识别,才能在生成文章时展示出来。
步骤二,搭建知识库。
第二步,添加内容,选择导入类型。
在线数据导入,也就是从在线网页中爬取内容。支持自动采集和手动采集两种方式,自动采集较为简单,可以单个网页抓取和批量抓取。手动采集需要安装一个官方的爬虫插件Scraper(安装包放在文末了)。这种非常适合小范围的爬取内容,比如抓取你官网中不同套餐的产品介绍,抓取在线网站中的重点文段等。二者区别如下:
接上面创建知识库的操作,填写知识库名称和描述,选择导入类型,然后点击下一步。
第三步,上传文档,分段设置和数据处理。
这个部分,是做好知识库的核心,很重要,尤其是分段!因为回答精准度跟知识库内容颗粒度直接关联。方式有自动分段和自定义分段两种,知识点很多,我讲细一点,会分享本地上传和在线数据采集两种导入文档方式。
第一种,本地文档上传方式。
如果是资料文字多、杂乱无序、不需要精准或者固定化的回答,建议自动分段,比如下面的网络流行语资料,本身就已换行,且文字杂乱关联性小,自动分段就好了,操作如下图所示(接上一步选择了本地文档的导入类型)。
如果你的资料是不同板块组成,同板块段落内容关联度很强,就需要自定义分段。比如文档是多篇文章汇总的,每篇文章是一个板块,这个时候自动分段,容易把一篇文章拆分了。又如,文档是多个产品简介,不同类型问答资料、提示词资料、操作教程等,最好自定义分段,这样系统才切分得准确。
自定义分段,不是让你自己老老实实的去拆分,也有巧妙方法。这里需要引入标识符,先做个含有标识符的文件,然后在分段适填写这个标识符,以此作为自定义分段的依据,敲重点!下面给大家分享个技巧性的操作。
我现在要上传Kimi17个官方提示词的文档,实现每个提示词都拆分准确。由于文档中有markdown格式,符号很复杂,而且每个提示词长短不一,切分时也有字数限制,如果你自动分段,就很容易把某个提示词拆分了。
这时,我们在每段提示词前面加AA来做个含有标识符的文档,注意这个标识符最好是原文档中没有的,独特的,便于识别切分。设置标识符,可以让Kimi写一段VBA代码或者批量替换(VBA玩法会写进我即将发布的Kimi学习手册中),把文档操作成下图这样,便于系统准确分段。
我们来看看分段效果,非常准确,每个提示词都单独拆分成了独立的内容片段(不同底色就表示不同的内容片段)。
在线数据上传文档,有自动采集和手动采集两种。这里操作很复杂,我给大伙演示下。
先看看自动采集,这种方式适合新手。在前面选择在线数据的导入类型后,我们选择自动采集,添加URL的方式可以是添加单个或批量添加。单个添加可以设置更新频率,对于需要实时获取资料的智能体,这个挺有用的。比如我这里做的在线网络流行语资料,需要设置更新频率为每天。
批量添加,能自动抓取网站根目录或者网站地图下面的所有网页内容,最多抓取300个,现在默认不自动更新,要等知识库做好之后才可以设置自动更新的频率。
输入网址,点击导入后,系统自动抓取,没问题后就点确认。
系统自动解析并分段,如果不够,还可以继续添加,设置同上,单个和批量可以混和来添加,如下图,背景里是先添加的单个网页,后面又批量添加。
等系统把添加的文档解析并上传,传完你可以对每段内容编辑和删除,弄完之后,点下一步就是数据处理了,这点还是比较良心的。
如果你的知识库需要多种方式导入,可以先添加完一个文档后,再往知识库添加内容。如图所示,不过需要注意的是,这时候再添加内容就是自动分段,不能选择自定义分段了。
还有一点,知识库内容都可以随时修改以及重新分段(添加内容按钮左边那个按钮就是重新分段),如果是用在线数据方式采集的,对每段内容,还可以随时更新频率,这点比较人性化。
步骤2:创建Bot,起个花哨名,选个buff模型
在个人空间点创建 Bot,起个花哨名,比如AI领域写作大师。
确认创建之后,来到编排页面。这里我多提几句,最近扣子增加了多Agent模式,这个模式可以说非常nice。
简单来说,单Agent模式像一个全能助手,自由度更高,多Agent模式则像一个团队,它还可以把你单Agent模式下创建的Bot全部串联起来,这个不得了!比如你把文案、设计、客服、财务智能体做了一通,整合这些智能体,构建一个全自动的运营体系,是不是可以卖给中小公司?
亦或超级个体,把原来多平台AI操控体系,变成基于扣子主平台的智能体运营管理系统,效率是不是更高了?当然目前还不够强大,未来肯定会应用得越来越多。
从多角色、场景应用和落地效果看,多Agent模式>单Agent模式>AI大模型通用回答。
扣子自家的大模型也改名了,原来叫做云雀大模型,随着豆包大模型系列发布,现在改成了其中一个模型——豆包·Function call模型,这里我多提一句,你在豆包上创建的智能体也会同步到这里来,完全打通了。
大模型选择根据需求来,moonshot就是Kimi大模型,三种模型根据回复长短区分,比如这个写作bot,用的128k。不是说越长越好,做简单问答,推送新闻等,8k就够了,模型越大回复越慢,消耗token越多,也不利于体验。
回复随机性:随机性越高,生成内容更多样,更具创新。反之,生成内容会更加保守和精确,且类似于训练数据。比如写作智能体,需要“别开生面”的创意,以适应不同的写作场景和任务需求,因此我直接搞得1。像心理咨询、营销顾问这种,也需要整高一点。如果是简单的推送新闻或者问答等,随机性可以低一点,例如设置0.2,这样更精确。
携带上下文轮数:主要控制上下文的记忆能力,对话历史轮数越多,多轮对话的相关性越高,像是需要处理复杂任务,比如行业研究报告、论文撰写智能体,或者垂直领域、有特定风格类型的,比如幽默风格写手、大厂职场写作等,建议数值大一些。
步骤3:编写提示词,让Kimi帮你写明白
那么,编写提示词(人设与回复逻辑)就得说清楚,这是重中之重!咱们就不用基础版的系统自动优化了,效果不太好,还掉价!这里直接上个高阶操作,全程交给Kimi来搞定。
下面是我3月份创建Bot时的提示词编写案例,为什么用当时的案例?
一是因为这个Bot分享到网上后,网友觉得效果不错,希望我分享,我就原封不动的公开;二是那个时候我才用扣子不久,操作思路放在这里更适合,毕竟还有好多同志不熟悉扣子。不用太关注细节,重点是掌握思路。
第一步,投喂AI领域优秀文章资料或者对标文章素材,把资料吹得高大上一些,让Kimi学习分析,并总结写作技能和特点。
强调下,资料很重要,跟知识库同源,二者结合起来做,效果才更好。找资料的方法以前文章也分享过,在这我就不啰嗦了。不管什么领域,思路都一致。
第二步,根据扣子官方编写模板撰写提示词,指令如下:
扣子官方提示词编写模板:
点击可查看大图
一顿优化操作下来,最终组合编写的提示词如下:
注意,这个写作大师智能体基于账号定位来写的,能力宽泛,可以策划、原创、二创、仿写等,是属于自由和富有创意的,因此就没有固定的回复逻辑和流程。如果你要做一些精细化或者单一任务的智能体,比如“低配版”秘塔AI搜索,或者新闻推送助手,可以参考官方的这个。
在编写提示词这块,你得下功夫,尽管我们可以让AI协助,但是需求和思路在你脑子里,不要过度依赖AI,尤其是思考。好的提示词一定是基于你的需求和意图来的,同时与知识库、工作流搭配起来,以编排回复逻辑和流程,这样就有双重保障。
可以先做简单的,再做复杂的,逐步优化。饭一口一口吃,路一步一步走,可别想一步登天。
怎么找?
步骤4:添加技能,把插件和知识库都搞起。
第一步,加技能,这里主要是插件,因为不用做工作流等,相当于给智能体加武器,属于不讲武德!官方给了60多种插件,视频解析和提取、新闻、旅游、办公、图片识别等等,的确丰富。扣子的插件满足不了你?也可以自己开发,官方都有教程。
这部分根据需求来搞,简单的智能体,你用3、4个插件即可。写作智能体,创作任务还挺复杂的。需要解析链接、PDF文件、获取站外内容,用Link Reader;需要生图,就要用ByteArtist或者通义万相等生图插件,用一个就好;需要设计图片,就调用比格设计或者创客贴(这两个我都用去水印脚本了,所以很方便);需要简单配图,用必应图片搜索;需要获取热搜和站外文章,就加全网热搜、知乎热榜、头条搜索等。插件中还有一些例如微信搜索、公众号文章列表等插件,不太稳定,不建议加。
新手的话,建议前面加少点,调试一些简单任务,用得顺畅后再逐步加插件。比如你是仿写和站外二创,你需要解析链接,必须用Link Reader,需要配图,就用字节的ByteArtist一个插件,不要搞太复杂了。
添加完后,点击知识配置区-自动调用按钮,设置下调用和检索规则。这里的配置主要是解决从那里查,怎么检索,召回几条精准内容的事儿。内容找得全,相关性强,大模型才回得准。这里我简单说下,详细配置说明可见官方文档。
作为新手,前期建议都自动调用,这种方式,会在每轮对话自动调用知识库来回答。按需调用的话,需要在左侧人设与回复逻辑区明确何种情况调用哪个知识库回复,这就增加了提示词编写的难度。
搜索策略方面,简单来说,语义检索更注重内容之间的内在联系,全文检索更直接,适合找具体词汇,而混合检索则是两者的结合,既考虑内容也考虑联系。下面是一些适用场景说明:
当你的智能体需要理解句子或短语之间的深层联系时,比如写论文时找相关资料,或者翻译跨语言的文本,用语义检索。当你的智能体要找包含特定术语或专有名词的文档时,比如搜索法律文件中的特定条款,或者研究报告,用全文检索。当你的智能体需要同时考虑文档的内容和它们之间的联系时,比如做市场调研或者爆文创作,需要找的资料既要包含特定的关键词,又要符合一定的主题或情境,就用混合检索。
第三步,基础配置。这里主要是配置不太重要的内容,比如记忆功能、对话体验和角色三个板块,我简单介绍下。
记忆功能,是相对重要的。它可以持久记录和回忆对话中的重要参数或内容,让交互更便捷、有趣、回答更精准。
变量部分,保存用户姓名、行为偏好或者语言风格等信息,Bot会记住并调用,后面对话会越来越合你的口味,比如你可以设置幽默风格、语言变量,随时让他切换风格回答或者不同语言来回答。最好的方式是你在编写提示词时,指定变量的使用场景,这样回答更准确。具体操作可以查看官方文档,如果你看得枯燥或者看不懂,直接在页面调出Kimi阅读助手,让他帮你解释、总结等,这个方法适用于绝大多数网页,很方便。
更关键的一点是,你如果对某些内容不熟悉或者需要追问,你直接选中,插件会自动识别,并加在对话框中(这些都是小技巧,可以当引用或者标注来用)。
数据库,可以帮我们把信息(比如客户资料、商品清单、订单信息)整齐地分类存放,让数据管理变得简单又清晰。这个功能其实很厉害,应用场景非常多,比如用于个人记账、金融分析、社交互动、客户关系管理、库存管理、健康追踪、项目管理等多种场景。我们这里用不到,而且需要技术基础,没有基础的话可以看官方文档。
长期记忆的主要作用是增强Bot智能体的个性化服务能力,通过记录和累积用户的交互历史,使Bot能够更好理解用户的意图和需求,提供更加连贯和相关的响应。
可以跟变量和知识库搭配起来使用,变量和长期记忆的结合,通过记录用户在具体场景对话中的选择(例如用户选择偏好设置)来动态更新长期记忆,以便在未来对话中提供个性化服务。知识库提供通用信息,长期记忆可作为补充,二者结合可以使Bot实现更精准的交互。比如在用户询问产品信息时,知识库提供通用答案,长期记忆补充用户的购买历史或偏好,让Bot的回答更加贴合用户的个人需求。其实相当于你通过对话交互,在对Bot做数据训练,长期使用效果愈加明显。
长期记忆在页面上开启即可,会自动总结,点击按钮可以查看总结内容。
对话体验这些简单,就不过多说了。可以添加背景图片,选择中英文两种语音角色,语音主要是用在豆包APP上,不得不说,豆包的语音做得还是很不错的,非常接近真人了。
步骤5:测试Bot,调教到它服服帖帖听你话。
调试的话,核心在于模拟交互,验证功能,确保Bot能够按照预期执行任务,比如正确理解指令,回答是否精准。具体而言,需要调试你添加的插件、工作流或知识库等。对于一些专业性智能体,比如写作类的,你还得测试文章效果。
点击可查看大图
步骤6:发布Bot,选个你喜欢的平台跟它玩。
这个案例咱们升级操作,不仅用插件和知识库,还加入工作流,并且让Kimi协助自动设计工作流,做个复杂的智能体。
工作流是打造智能体的核心,是扣子编排中最难的一部分。它就像是一个简单的拼图游戏,通过设置并拖拽不同的模块(节点),比如插件、知识库、大模型、代码等,来搭建起一个完整的业务流程。工作流就是sop,帮助我们把复杂的任务分解成简单的步骤,然后自动完成,并确保工作既快速又准确。
为了让小白也能轻松理解、效率操作,待会咱们再引入一个高效工具,谷歌浏览器的插件,Anything Copilot,这个插件算个“缩小版谷歌浏览器”,可以在侧边栏无限制、多方式地打开 AI 及其他网站,实现双屏操作功能。这个功能其实Edge就有,但是考虑到很多朋友都用的谷歌,我就用谷歌来操作。
以上为edge使用示例
前面讲解过的操作我们简单带过,这里重点在工作流设计。
接下来咱们正式开始Kimi协助操作流程。
后面就是跟前面做知识库相同的步骤,分段和数据处理。方法前面都讲了,这里就不赘述了。
这里是最新版扣子的截图
第三步,来到工作流设计页面,配置节点,这是最重要最难的(最近更新了图像流,基本上啥都能搓了,包括前面说的一键生成图文),而且也是我讲的最细的部分,不要觉得麻烦哈。坦白讲,小白看到这里可能头都大了,都不知道怎么开始。毕竟需要一些技术性语言,比如变量,只能用字母、字符等设置。
第一步:配置开始节点。
询问Kimi,顺便也当作考验下他,让他帮你配置第一个节点。
你看Kimi多懂事,每个变量一一对应起来了。你按照它给的设置,根据自己需求选择使用,复制粘贴完整就是,“懒人”用着极度舒适(0编程基础的朋友可以顺带学习并了解下常用技术语言,其实也就是着译的英文,一般不使用拼音或者首字母简写之类的)。
之前发的官方链接中就叫做condition节点,因为当时他们没改成中文,所以你会看到是condition节点,国内版对应选择器节点。
先向Kimi提出你的问题,比如这里不能配置,页面出现什么反馈,怎么解决?Kimi会给你一些建议和解决办法。
其实基本可以确定了,他已经指出了连接问题,下图中的第2点建议。你思考也觉得是这个问题,然后再问他怎么去连接两个节点?他直接把操作步骤给你了,让你通过圆圈把两节点连接起来,你再去试,完美解决。
在对话过程中,你搞定了给Kimi说,他还很高兴,似乎听到你解决了问题,估计感觉到老师的快乐了,哈哈。对话不要太死板或者拘谨了,该活泼就活泼,该幽默就幽默,工作生活会增添很多乐趣。
说实话,这个选择器(条件判断)设置较难,新手确实要花点时间研究。不过有了Kimi,也能提高效率。跟前面思路一样,把选择器的设置页面截图后,传给Kimi,让它根据要求来写。你只需要盯着他写的对不对,符合你要求不。
第三步:配置大模型节点。
接下来,我先弄个插曲。因为流程较多,我怕Kimi配置出错,就准备简化步骤,先加个大模型节点和结束节点,运行一番,到时候排查也方便。咱们循序渐进,后面再添加知识库,弄个完整流程(PS:简单点的工作流可以一次性搞完,复杂的可以部分运行后再增加)。
现在配置第三个,大模型节点,按照之前的方式问他,发设置页面截图和要求。它把配置结果都给你了,不过我截图没注意,给他显示的是云雀大模型(之前的素材,现在叫豆包),咱们可以选好Kimi的moonshot后再发给他。
注:这里本身是为了测试,Kimi配置较简单,下面咱们还要优化。
我发布后去编排页面测试了下,Kimi还是贴心,把测试建议都给我了。
第六步:增加知识库
还有种更好的方法,就是你把提示词编写模板、大模型编写页面截图以及要求等都发给他,让他针对性的编写。但是往往一次不够好,需要你多次优化后,整合形成如下这种提示词。提醒下,为了使回答更具个性化,你可以增加技能,语气,限制等。这里我就附上了联系信息,方便让用户私信联系,另外也可以运行测试下效果。以下为简洁版和个性版参考:
简洁版:
个性版:
之前已配置过,现在就是让Kimi帮忙检查下,这里他引导我增加了大模型输出的变量,设置完后就试运行一下,运行成功就可以发布了。
补充一下,结束节点的选择回答模式可以自定义。回答内容设置必须引用输出变量中的变量或者参数名,且对应起来,注意下图中红色和蓝色框一一对应,引用方式为:{{变量名或者参数名等}}
步骤三:创建并编排Bot
点击可查看大图
调用外部工具的最佳方式是,加上关键词,比如搜索下最近的AI热点资讯,生成一张图片,知乎热榜 推送今日AI资讯,必应搜索3张AI科幻图...等等(能加上插件名称更准确)。如果问得不太明确,就容易造成工作流和插件的回答冲突。这里插件不要加太多了,够用就好,相同功能的插件就用一个。
把小客服给你的一些资料直接存进飞书,方便你使用。
获得资料后,直接存成表格,点击后直接下载。
获得资料后,生成pdf文件,存成自己的文档。
好了,我不多演示了。记得调试好了去发布你的Bot,我的小客服发布到了豆包和公众号,欢迎大家去体验,获取资料等等。
总体而言,创建智能体的大体思路是:
对多数人而言,用好插件、知识库和工作流已足够,毕竟大多是自己用,而非商用。要想更好,还可以加入数据库,变量,图像流,甚至多Agent。
这篇文章是之前基础版扣子教程的延续,应用两案例+三章节+由浅入深的总体格局,希望大家跟着思路,逐步探索,轻松掌握,以便举一反三。
AI智能体的发展是个趋势,从目前各大厂相继开放来看,商业化落地进程在加快了,多Agent模式也会逐步成熟,越来越多人会入坑。毕竟,大模型更多的是通用能力,而垂直场景的智能体更适合专项任务。他可以通过知识库、数据库以及对话不断自我训练,按照你特定的工作流,实现想要达成的目的。
未来智能体的应用场景会越来越多,包括个性化教育、智能经营管理、健康咨询与监护、虚拟个人助理、内容创作与分发、企业办公自动化、辅助决策制定等方面。智能体的优势在于满足个性化需求,提供定制化服务,通过优化流程,提高效率和生活质量,可落地细分场景。
这也是我今后的主攻方向,我的远大目标是用“AI+”重塑“互联网+”,落地到商业场景。如果大家有好的项目,需要工作流或者企业级智能体开发,也可以联系我(微信号 hkzxt023),大家可以一起来做。
写到这里,快2万字了,有点小兴奋。
我想叨叨几句。
之所以撰写这篇教程,最主要的就是回应网友需求和允诺。期望和我一样的零技术基础的朋友,也能在扣子创建自己的高级智能体。
从最初只想写用Kimi全自动创建智能客服,到回应网友们的需求,公开这个写作智能体调教方法,期间反反复复修改与优化。
过程中,我也在思考,怎么让大家更易上手。
开始只是想分成两篇写,这样流量也更多。
但考虑两个案例特性,一个用到插件和知识库,
另一个再添加工作流,正好能满足大部分需求。
从计划扣子教程到现在,一个月了。
从准备素材到现在,花了三周。
还有一点,我也看了网上很多有关扣子的教程,多数走遍创建流程,直接扔出提示词,知识库上传一遍,工作流直接讲解等等。
其实有些教程写得挺好的,甚至官方文档,不过还是不那么容易懂。这大概多是技术或产品在写,包括我也容易陷入个误区,站在个人角度考虑。这让一些新手或者0技术基础的朋友稍微感到难,从而不去实操。就没办法传播开来。
这里最重要的不是案例,而是操作思路。希望大家掌握的是,对一个陌生,甚至没有接触过的东西,如何借用AI和效率工具来学习并上手,如何思考整个架构,怎么在提问互动中进步等。
文章内容繁多,但还好通俗易懂,我基本上没有应用专业术语,因此阅读起来可能会好一点。不过想要靠仅一两次阅读就学会,是不大可能的。我建议多阅读几次,跟着思路实操。阅读十次,不如操作一次!在实践过程中,你才会遇到问题,利用AI来协助你解决问题,这点意义重大。
为了大家更好阅读,理解和学习。咱们直接拓展举一反三的方法,借用文中提到的开双屏操作。阅读时,打开文章,调出Kimi阅读助手,常用语总结,快速理清文章脉络。实操时,在左边主页面打开扣子实操,右侧边栏在Anything Copilot插件打开公众号文章,这样边看边操作,效率更高。(用edge也可以实现相同效果)