## **私有语料库** **单条新增** 点击“新增问题”,在新打开的页面里补充标准问题(不超过64个字符)、标准答案(不超过500个字符)。 * * * * * **语料库空间** 语料库空间为语料存储总量,根据版本不同存储总量也不同: 体验版存储总量1000条,每日可导入数量1000条; 标准版存储总量5万条,每日可导入数量5000条; 专业版存储总量20万条,每日可导入数量20000条; * * * * * **匹配度** 是一个客户可自定义设置知识库语义相似度的开关,不同阈值有不同的效果: 如果阈值设置为100%,则为完全匹配,即当用户问题与知识库问题完全一致的情况下才能触发相应答案。该阈值下准确率高,但适用于业务问答且对准确度要求较高的用户。 如果阈值设置为60%,则为模糊匹配,即当用户问题与知识库问题相似度达到60%,即可触发相应答案。该阈值覆盖率与准确率适中,适用于大部分用户。 如果阈值设置为10%,即当用户问题与知识库相似度达到10%,就会触发相应答案,虽然该阈值回复知识库内容的几率增加,但准确率较低。适用于知识库问题较少,且关键词重复率低的用户。 * * * * * **语料库纯净度** 对用户上传的问题和答案,图灵盾会做违规词检测,如果发现有涉黄、涉暴、涉政等违规词,图灵盾会对该问题或答案高亮显示,并标记出具体的违规词,便于用户快速定位并修改违规词。 高亮显示说明: 橙色代表疑似违规词,建议修改,但仍可以对外输出; 红色代表严重违规词,必须修改,否则无法对外输出。 * * * * * **批量导入** 批量导入主要为用户提供便捷的导入方式。在用户下载“语料库模板”后,可按语料库模板的格式设置问题、答案和相似问法。 请注意: 1.导入条数与收费版本相关,文件大小不超过5M。 2.如新导入的问题与原问题一致,导入的问题只会新增,不会覆盖。 * * * * * **批量操作** 可对语料进行批量删除、停用和启用,停用即为暂时不使用该语料,但不会删除。 * * * * * **语料库导出** 语料库导出主要为方便用户批量修改问题和答案。目前只有标准版以上权限才可导出语料库,标准版导出次数1次/周;专业版不限导出次数。 * * * * * **关键词** 该功能主要为了增加长句中关键词的匹配权重,从而提高回复的准确率。关键词工作逻辑主要为加权+完全匹配,所以在设置关键词时尽量遵循以下原则: * 多个关键词的情况下,不要设置近义词,要设置会在一句话里同时出现的词; * 如果需要通过关键词设置来提升匹配精度,那么关键词粒度要细,如“AAA价格”“AAA选型”这两个问题,可分别将“价格”“选型”设置为关键词,如果还有“BBB的价格”“BBB的选型”这些问题,那么就要将”AAA”,”BBB”也分别设置为关键词; * 避免使用短语,尽量使用单词作为关键词,提升关键词的命中率。 ## **同义词库** **同义词库说明** 同义词是指相同语义的关键词,主要用来提高私有语料被命中的概率。如“苹果”的同义词为“iphone”,则当用户说“苹果多少钱”或“iphone多少钱”时,都能匹配到同一个答案进行回复。 **同义词库使用方式** * 未设置同义词回复 ![](https://box.kancloud.cn/448936b4f5f6cfa48c4a51355948a727_513x414.png) * 设置相关同义词 ![](https://box.kancloud.cn/3d72951d044db0afefe617e1cb6c16c8_654x255.png) * 设置同义词回复 ![](https://box.kancloud.cn/f935245bc90a8e2b692a7f681919edcd_500x377.png) ## **素材库** **素材库说明** 素材可以用在私有语料库中作为答案回复给用户,系统会定期自动检索更新您微信公众号中的素材。如果你在微信平台中添加了素材,最多需要十五分钟即可完成同步。 **素材库使用流程** * 绑定微信公众号 ![](https://box.kancloud.cn/d503c519891b7b64c6928d4ef20d2c7a_605x287.png) * 素材库会自动同步公众号图文、图片等信息 ![](https://box.kancloud.cn/6ee2f499214af0f0d6be31797c6a341f_1446x1002.png) * 新增语料库图文内容 ![](https://box.kancloud.cn/e91d7905ee6a352d767251c0d2c58921_1440x709.png) * 回复用户图文 ![](https://box.kancloud.cn/f24986631e819ed7328ccb712a36647c_593x660.png) * * * * * ## **知识雷达** **知识雷达说明** 知识雷达使私有语料库里的回答设置更准确,如嗅探词为“学习”,则当用户说“怎么学习”或“如何学习”时,都能被捕捉到表格中。嗅探词可设置多个,但不能对多个嗅探词同时进行捕捉。 **知识雷达使用方式** * 开启知识雷达,设置嗅探词语 ![](https://box.kancloud.cn/1094db1c5e74c212b27e35c7407bed71_1056x432.png) * 自动捕捉用户与机器人对话中包含嗅探词的语料 ![](https://box.kancloud.cn/738ca891e6fef0404ed35dd919e03222_1651x739.png) * 可将未覆盖到的语料,添加为新问题 ![](https://box.kancloud.cn/260dc578fb7f3738fa767935eb731b57_986x663.png)