FAQ #
项目有没有体验的地址? #
A: Playground访问地址:http://117.72.46.148:9080
初始启动后为什么能显示DEMO问答对话? #
A: 为了便于快速体验,系统内置DEMO语义模型,且实现了基于规则的解析器,所以不需要大模型也可以进行问答对话。不过,规则解析器能力有限,推荐仅用于测试验证,生产使用还是需要大模型解析。
是否自带大模型服务? #
A: 项目内置langchain4j社区提供的demo API key,但单次请求openai大模型限制在1000 token,因而只能用于快速体验。要正常体验问答对话,请自行申请大模型服务。
支持哪些大模型服务? #
A: 当前主要支持兼容open_ai接口协议的大模型服务,比如GPT、GLM、DeepSeek、Qwen、Moonshot等。文心和混元正在验证中,敬请期待。
是否支持文本知识库? #
A: 当前主要聚焦于结构化数据的问答,文本数据将在未来版本加入支持。
是否支持多轮对话? #
A: 自0.9.2版本起已经支持多轮对话,但默认是关闭的,需要在助理配置里开启。
重启系统后为什么配置的助理/模型数据丢失了? #
A: 系统默认使用H2内存数据库,如果需要持久化存储需配置DB,参考文档
系统默认的账号和密码是什么? #
A: 系统默认创建的用户有admin, jack, tom, lucy, alice,密码都是:123456
如果要用我自己的数据进行测试,我至少需要经过哪些步骤 #
A: 连接数据库 -> 构造模型(创建指标和维度) -> 组装数据集 -> 创建助理和工具
是否可以提供接口供第三方应用调用? #
A: 可以,启动系统后查看swagger接口文档:http://localhost:9080/swagger-ui/index.html
有哪些国内的大模型服务对接? #
A: 以下是我们验证过的商用大模型服务,都通过OPEN_AI协议对接,如下表所示:
提供商 | API服务URL | 推荐模型 |
---|---|---|
智谱AI | https://open.bigmodel.cn/api/paas/v4 | glm-4 |
阿里云 | https://dashscope.aliyuncs.com/compatible-mode/v1 | qwen-max |
幻方 | https://api.deepseek.com | deepseek-chat |
月之暗面 | https://api.moonshot.cn/v1 | moonshot-v1-8k |
以下是我们验证过的开源本地大模型,都通过OLLAMA协议对接,如下表所示:
开源方 | OLLAMA模型镜像 |
---|---|
阿里云 | qwen2:7b, qwen2.5:7b |
Meta | llama3.1:8b |
【语义模型】和【数据集】有什么区别? #
A: 简单来说【数据集】比【语义模型】高一个层次,是直接面向应用的字段集合。从建模过程来说,先构建语义模型,在模型下创建指标和维度,最后从多个语义模型下选择指标和维度来创建数据集。那【数据集】存在的意义是什么?一方面,类比下数据库中的视图,可对底层数据表进行封装,从而对应用层屏蔽多表关联,在Text2SQL中能降低LLM的生成难度。另一方面,通过数据集可以对不同应用暴露不同的字段组合,从而实现灵活的访问控制。
是否可以定制few-shot示例? #
A: 当前,配置few-shot示例门槛相对较高,涉及question、schema、sql多个信息的手动编辑,所以系统暂时不开放。取而代之的更简便方案,是在助理层面设置【示例问题】,系统会自动在后台对每个示例问题运行问答,将自动生成的中间schema和结果sql以【记忆】形式保存下来。如果助理开启了【记忆评估】,可经过【LLM】和【人工】两种方式对记忆做审核,以决定是否开启作为后续问答的few-shot。
使用ollama时,问答出现"在Python中xxxx"的如下图错误? #
A: 请升级ollama到最新版本