ChatBase + RAG,简单的理解为:把网站的文章当作一个知识库,接入一个大语言模型(LLM),通过RAG(Retrieval-Augmented Generation,检索增强生成) 的方式,让机器人能够基于你提供的内容来回答问题。

也可以理解成生成一个网站的专属问答AI客服:

可以作为FAQ智能客服、网站嵌入助手、内部知识库查询使用。

Chatbase + RAG可以提供更精准的回答,减轻用户在大量网站数据中检索的负担。

注册并创建Chatbase

登录Chatbase官网:https://www.chatbase.co/

注册并登录账号,点击“Build your agent”按钮。

需要注意的是,不要使用Chrome浏览器的翻译功能,否则Chatbase在使用的过程中会返回500。

在创建Chatbase Agent时,如果是网站类型,选择“Website”并输入网站链接;如果是文件或文本等类型,则选择对应的Files或Text。

因为我这里设置个人博客的问答机器人,选择“Website”并输入URL后,点击“Fetch links”捕捉网站的链接和资源。

捕捉完成之后,点击右侧的“Create agent“,创建Chatbase Agent。

管理Chatbase Agent

创建完成后,显示Chatbase Agent的管理界面。

可以选择“Model”配置AI的类型,例如GPT-4o Mini,如果涉及开发技术等领域,推荐使用Claude 3 Haiku,在技术方面要领先于ChatGPT。

左侧的Activity – Chat logs,可以查看和Chatbase Agent的对话框,后期的对话内容都会保留在这里。

部署Chatbase Agent

在左侧点击Deploy,可以看到Chat widget(聊天小组件),Chat widget可以添加到网站并支持iframe,点击“Setup”按钮进行部署。

在Chat widget配置界面,可以配置Chatbase Agent的名称和欢迎语。

在“Style”(风格)标签页中配置Chatbase Agent的头像和默认图标。

在“Embed”(嵌入)标签页中,可以选择Chat widget(聊天小组件),将Widget Setup(设置)中的<script>…</script>代码复制到网站中。

WordPress配置Chatbase Agent

如果是WordPress部署的网站,可以在WordPress的管理后台 → 外观 → 主题文件编辑器。

1、直接修改footer.php

找到header.php或footer.php:

如果希望脚本早点加载,可以放到</head>前;

如果希望脚本最后加载,可以放到</body>前。

例如,在footer.php代码中,先找到<?php wp_footer(); ?>这一行。

WordPress 的惯例是:所有额外脚本最好放在它之前。

<!-- 额外脚本 -->
<script>
  console.log("Chatbase配置代码");
</script>

<?php wp_footer(); ?>
</body>
</html>

保存后刷新,网站底部就会挂出Chatbase的浮动聊天按钮。

2、用functions.php挂载脚本(推荐)

推荐在主题或子主题的functions.php里加:

function add_chatbase_script() {
    ?>
    <script>
    (function(){
        if(!window.chatbase||window.chatbase("getState")!=="initialized"){
            window.chatbase=(...arguments)=>{
                if(!window.chatbase.q){window.chatbase.q=[]}
                window.chatbase.q.push(arguments)
            };
            window.chatbase=new Proxy(window.chatbase,{
                get(target,prop){
                    if(prop==="q"){return target.q}
                    return(...args)=>target(prop,...args)
                }
            })
        }
        const onLoad=function(){
            const script=document.createElement("script");
            script.src="https://www.chatbase.co/embed.min.js";
            script.id="********"; // 你的 Chatbase bot ID
            script.domain="www.chatbase.co";
            document.body.appendChild(script)
        };
        if(document.readyState==="complete"){onLoad()}
        else{window.addEventListener("load",onLoad)}
    })();
    </script>
    <?php
}
add_action('wp_footer', 'add_chatbase_script');

这样WordPress会删除<?php wp_footer(); ?> 时自动插入 Chatbase 脚本,逻辑上和方法 1 一样,但更优雅、更安全。

总结

Chatbase可以实现个人博客网站的知识库问答机器人,帮助使用者更快的搜索内容。

需要注意的是,免费版本的Chatbase Agent不会自动捕获网站更新的数据,只保留初次创建捕获时的数据。

每次需要更新Chatbase Agent数据库时,都需要在Sources – Website中,重新抓取网站数据,重新培训Chatbase Agent代理。

否则,Chatbase数据库可能只保留创建时抓取的网站数据。

相关文章

1、RAG知识库、AI代理和远程大模型:https://fangjunyu.com/2025/09/13/rag%e7%9f%a5%e8%af%86%e5%ba%93%e3%80%81ai%e4%bb%a3%e7%90%86%e5%92%8c%e8%bf%9c%e7%a8%8b%e5%a4%a7%e6%a8%a1%e5%9e%8b/

2、Chatbase:https://www.chatbase.co/

3、Chatbase privacy:https://www.chatbase.co/legal/privacy

扩展知识

嵌入脚本的安全隐患

1、嵌入脚本的工作原理

本质上就是:

在网站上插入一段 JS;

这段 JS 会动态创建一个 <script src=”https://www.chatbase.co/embed.min.js”> 标签;

浏览器加载这个 外部脚本,执行它;

外部脚本负责在页面上渲染一个聊天窗口(浮动按钮、对话框),并与 Chatbase 的服务器通信。

因此,Chatbase 并不会直接“读取”网站的数据库。它能看到的是客户端浏览器里的内容和上下文,主要包括:

用户的网页 DOM(即页面上已经渲染的 HTML 内容);

用户的浏览器信息(IP、User Agent、设备信息);

用户和 Chatbase 聊天窗口中的对话内容。

如果个人网站里有公开的文本内容(比如文章正文),理论上 Chatbase 的脚本是可以读取到的,因为它运行在页面环境里,能访问 DOM。但它不能直接访问WordPress 后台数据库,也不会有管理员权限。

2、潜在的安全隐患

嵌入第三方脚本时要注意:

信任问题:等于把浏览器的一部分控制权交给了 Chatbase。它理论上可以读取页面上的数据、设置 cookie、上报访问情况。这和嵌 Google Analytics、Disqus 评论系统、Facebook Pixel 的性质类似。

隐私问题:用户和 Chatbase 聊天时的数据会被发送到 Chatbase 服务器。是否合规取决于 Chatbase 的隐私政策(比如 GDPR、CCPA 等)。

数据泄露风险:如果网站里有敏感数据(例如只对登录用户可见的信息),Chatbase 脚本也能读到,除非做了严格的前端隔离。

依赖风险:如果 https://www.chatbase.co/embed.min.js 被黑客篡改,攻击者可能利用它向个人网站访客植入恶意代码。和所有第三方 CDN/脚本依赖一样,这是常见风险。

3、如何降低风险

如果决定用这种嵌入:

1)只加载在需要的页面,不要全站都加载。

2)避免前端暴露敏感信息(如 API Key、用户隐私字段),因为脚本能读 DOM。

3)开启 CSP(Content Security Policy),只允许可信来源执行脚本。

4)定期检查 Chatbase 的隐私条款,确保符合网站访客的隐私要求。

5)如果非常在意隐私,可以考虑自己搭建类似的聊天机器人,而不是依赖 SaaS。