ThinkChat🤖让你学习和工作更高效,注册即送10W Token,即刻开启你的AI之旅 广告
# 功能板块简介 [**分段识别**]该板块的**录音以及视频转文字**功能,是按照说话的的**语气停顿**,而进行自动切割的,优点为,方便用户**制作字幕,生成歌词**文件,而且修改识别文字非常的便利,软件默认为[字幕模式],您也可以根据需求,切换成[分段模式]并自定义每段的时间 ***** **功能提示**: 1.如果**原始声音**比较小,需要通过设置VAD的灵敏度,来**提高**每句话的长度 2.如果您的录音或者视频有**背景音乐**,会**影响**到软件的识别**正确率** 3.软件默认识别语言为[**中文**],如您的录音为其他语言,请在**识别前**修改 4.该功能**不支持**大文件进行识别,**建议**录音或者视频**小于**500MB ***** **视频教程** ```[video] src: 'https://file.luyinla.com/video/%E5%88%86%E6%AE%B5%E8%AF%86%E5%88%AB.mp4' autoplay: true ``` ***** ## 1.运行软件后,点击[**分段识别**]功能 ![](https://img.kancloud.cn/e4/6a/e46a8da071fc87f65e042dbe60909de5_1041x683.png) ## 2.在文件选择中,添加“录音”或者是“视频”文件,软件会自动根据语气停顿,对音频进行分段处理 ![](https://img.kancloud.cn/30/37/3037054b66c83a1adb2df3652070f465_1041x683.png) 小提示: 1.如音频的声音过小,可能导致每段录音的持续时间过短,可通过VAD设置改善 2.如音频的声音过大,默认的识别设置,也有可能导致单段录音过长的现象出现 3.时间轴为自动刷新呈现,可手动进行更新,呈现方式为声音的开始和结束部分 ***** ## 3.调整到合适的识别参数(设置后自动记忆,无需每次都调整) ![](https://img.kancloud.cn/c5/40/c540c9fbd216c572ce0d212f3ed9e07b_316x251.png)![](https://img.kancloud.cn/a7/d7/a7d72f913113c818e97c26fc1f9d4024_268x176.png) ***** ## 4.点击“开始识别”按钮后,文字逐渐识别出来,可以随时双击文字进行编辑 ![](https://img.kancloud.cn/51/59/5159177c8238336a4729c2b983420a59_1041x683.png)