前言#
0x01#
因为 Cuteen 主题下个版本就要脱离 Typecho 转向 React 开发了,所以前段时间终于学完了 React,算是勉强入了门。最近在把 React 的笔记、新写的 API 整理成文档,整理到一半才发现乱七八糟的东西越来越多了,用到的时候很难找到对应的内容。
0x02#
想起好久之前看的这篇文章,当时觉得克隆一个数字版的自己是很酷很酷的事情。但是受限于技术和钱包以及数据量,并没有能够实现。
趁着这次机会就想着能不能把笔记之类的东西连同博客里的自己数字化。
Chat Thing#
网上瞎逛的时候发现了 Chat Thing,可以用自己提供数据源训练 AI 的网站:
Chat Thing 可以通过连接 Notion、爬取网站、上传文件、YouTube 视频、RSS 订阅来获取数据作为数据源,基于 ChatGPT 来实现 AI 机器人。
免费订阅可以建立一个使用 GPT3 模型的机器人,实际使用下来已经完全足够了,毕竟不需要它来编写一大段代码。同时每个月提供 60 万个储存代币(Storage tokens)和 8 万个消息代币(Message tokens),根据官方文档的解释:当每次从数据源同步数据的时候会消耗储存代币,1000 个储存代币大约相当于 750 个英文单词;而机器人返回的每条信息使用 1000 到 4000 个消息代币,8 万个消息代币可以和机器人对话 40 次(消息代币肯定是不够的😔。
导入数据源#
Warning
请注意上传的数据有没有个人敏感数据。
因为我的文档、博客文章全都是在 Notion 上面完成的,可以很方便地连接 Notion 然后把数据全部导入到 Chat Thing 里面。
同时如果你想把博客的文章作为数据源导入,可以使用爬取网站地图或者网站的 RSS 功能导入。当然如果你的博客是 Typecho 的话也可以使用 Tp2MD 插件把文章导出为 MD 格式再上传导入。
放置机器人#
免费订阅只提供 Js 和 iframe 标签引入,如果想使用 API 等集成到其他地方则需要付费订阅。
Ps. 因为模型使用的是 gpt3 且受限于最大上下文,所以机器人的智能程度肯定比不上使用 gpt3.5 甚至 4.0 的 ChatGPT。Enjoy it🎉~
Note
Pss. 提问『我』的信息需要用 『Vinking』 代指,例如: 『 Vinking 的博客网址是什么?』,而非『 你的博客网址是什么?』。同时请降低期待,他并没有这么聪明。
此文由 Mix Space 同步更新至 xLog
原始链接为 https://www.vinking.top/posts/codes/using-chat-thing-clone-myself