## **私有语料库**
**单条新增**
点击“新增问题”,在新打开的页面里补充标准问题(不超过64个字符)、标准答案(不超过500个字符)。
* * * * *
**语料库空间**
语料库空间为语料存储总量,根据版本不同存储总量也不同:
免费版存储总量100条,每日可导入数量100条;
标准版存储总量1000条,每日可导入数量1000条;
专业版存储总量10000条,每日可导入数量5000条;
* * * * *
**匹配度**
是一个客户可自定义设置知识库语义相似度的开关,不同阈值有不同的效果:
如果阈值设置为100%,则为完全匹配,即当用户问题与知识库问题完全一致的情况下才能触发相应答案。该阈值下准确率高,但适用于业务问答且对准确度要求较高的用户。
如果阈值设置为60%,则为模糊匹配,即当用户问题与知识库问题相似度达到60%,即可触发相应答案。该阈值覆盖率与准确率适中,适用于大部分用户。
如果阈值设置为10%,即当用户问题与知识库相似度达到10%,就会触发相应答案,虽然该阈值回复知识库内容的几率增加,但准确率较低。适用于知识库问题较少,且关键词重复率低的用户。
* * * * *
**语料库纯净度**
对用户上传的问题和答案,图灵盾会做违规词检测,如果发现有涉黄、涉暴、涉政等违规词,图灵盾会对该问题或答案高亮显示,并标记出具体的违规词,便于用户快速定位并修改违规词。
高亮显示说明:
橙色代表疑似违规词,建议修改,但仍可以对外输出;
红色代表严重违规词,必须修改,否则无法对外输出。
* * * * *
**批量导入**
批量导入主要为用户提供便捷的导入方式。在用户下载“语料库模板”后,可按语料库模板的格式设置问题、答案和相似问法。
请注意:
1.导入条数与收费版本相关,文件大小不超过5M。
2.如新导入的问题与原问题一致,导入的问题只会新增,不会覆盖。
* * * * *
**批量操作**
可对语料进行批量删除、停用和启用,停用即为暂时不使用该语料,但不会删除。
* * * * *
**语料库导出**
语料库导出主要为方便用户批量修改问题和答案。目前只有标准版以上权限才可导出语料库,标准版导出次数1次/周;专业版不限导出次数。
* * * * *
**关键词**
该功能主要为了增加长句中关键词的匹配权重,从而提高回复的准确率。关键词工作逻辑主要为加权+完全匹配,所以在设置关键词时尽量遵循以下原则:
* 多个关键词的情况下,不要设置近义词,要设置会在一句话里同时出现的词;
* 如果需要通过关键词设置来提升匹配精度,那么关键词粒度要细,如“AAA价格”“AAA选型”这两个问题,可分别将“价格”“选型”设置为关键词,如果还有“BBB的价格”“BBB的选型”这些问题,那么就要将”AAA”,”BBB”也分别设置为关键词;
* 避免使用短语,尽量使用单词作为关键词,提升关键词的命中率。
## **同义词库**
**同义词库说明**
同义词是指相同语义的关键词,主要用来提高私有语料被命中的概率。如“苹果”的同义词为“iphone”,则当用户说“苹果多少钱”或“iphone多少钱”时,都能匹配到同一个答案进行回复。
**同义词库使用方式**
* 未设置同义词回复
![](https://box.kancloud.cn/448936b4f5f6cfa48c4a51355948a727_513x414.png)
* 设置相关同义词
![](https://box.kancloud.cn/3d72951d044db0afefe617e1cb6c16c8_654x255.png)
* 设置同义词回复
![](https://box.kancloud.cn/f935245bc90a8e2b692a7f681919edcd_500x377.png)
## **素材库**
**素材库说明**
素材可以用在私有语料库中作为答案回复给用户,系统会定期自动检索更新您微信公众号中的素材。如果你在微信平台中添加了素材,最多需要十五分钟即可完成同步。
**素材库使用流程**
* 绑定微信公众号
![](https://box.kancloud.cn/d503c519891b7b64c6928d4ef20d2c7a_605x287.png)
* 素材库会自动同步公众号图文、图片等信息
![](https://box.kancloud.cn/6ee2f499214af0f0d6be31797c6a341f_1446x1002.png)
* 新增语料库图文内容
![](https://box.kancloud.cn/e91d7905ee6a352d767251c0d2c58921_1440x709.png)
* 回复用户图文
![](https://box.kancloud.cn/f24986631e819ed7328ccb712a36647c_593x660.png)
* * * * *
## **知识雷达**
**知识雷达说明**
知识雷达使私有语料库里的回答设置更准确,如嗅探词为“学习”,则当用户说“怎么学习”或“如何学习”时,都能被捕捉到表格中。嗅探词可设置多个,但不能对多个嗅探词同时进行捕捉。
**知识雷达使用方式**
* 开启知识雷达,设置嗅探词语
![](https://box.kancloud.cn/1094db1c5e74c212b27e35c7407bed71_1056x432.png)
* 自动捕捉用户与机器人对话中包含嗅探词的语料
![](https://box.kancloud.cn/738ca891e6fef0404ed35dd919e03222_1651x739.png)
* 可将未覆盖到的语料,添加为新问题
![](https://box.kancloud.cn/260dc578fb7f3738fa767935eb731b57_986x663.png)