
语音转写功能需求分析:

系统介绍:
智能语音转写系统
• 智能语音转写系统提供实时语音识别和录音文件识别能力。无缝嵌入传统会议室系统,让会议更高效便捷。
• 适用场景:办公会议、政府报告、新闻发布、学术讲座等各行业领域会议场景。
语音实时转写
实时字幕
实时上屏
会议纪要
角色分离
录音转写
纪要导出
……

产品:

硬件:在线版和离线版
在线版:

离线版:

产品特点:
在线版产品特点:
1.高准确性:在线部署,采用云服务器,数据更新快,对于网络词汇更准确
2.转写准确率高:中文普遍话≥95%,Native 英文≥90%
3.翻译效果佳:智能断句、先进声学模型和语言模型训练
4.处理效率高:实时转写,200ms内返回结果
5.历史音频处理,1小时音频10分钟完成
在线版采用科大讯飞的云服务器,他们是按服务量收费的

离线版产品特点:
1.安全性高:离线部署,数据安全
2.转写准确率高:中文普遍话≥95%,Native 英文≥90%
3.翻译效果佳:智能断句、先进声学模型和语言模型训练
4.处理效率高:实时转写,200ms内返回结果
5.历史音频处理,1小时音频10分钟完成
系统拓扑图:

界面展示:

功能介绍:

大屏实时字幕:集成会议发言字幕实时投屏。可实现拓展屏投屏或独立大屏投屏。优质的低延时流式语音识别技术,让实时字幕展示更实时。

角色分离:实现在会议过程中对会议的发起方、参与方、主席、主持人、秘书等将各方发言的内容进行角色分离并自动实时识别成文字,并把语音转写成的文本以字幕的形式投放到大屏显示。

展板展示转写结果:语音转写展板展示语音转写文本内容,可对展板字体进行放大缩小和重点标记。自动同步展板纪要内容,实时展示语音转写文本。
重点标记:针对一些有疑问的内容重点标记高亮显示,方便会后整理文稿。

禁忌词屏蔽:可以将不适宜展示的敏感词添加禁忌词列表中,屏蔽此禁忌词,当识别到此类词汇时,系统提供不显示、*号和空格三种显示方式供选择。

关键词优化:针对每场会议需要提高识别效果的关键词,按要求添加入关键词列表中,会议开始前和会议过程中均可进行添加。如添加人名、地名、公司名等。
语气词过滤:在实时语音转写开始前或者进行文稿整理时,根据需要选择是否开启“语气词过滤”功能,若开启则能可将语气词和多余的词汇去除,以保证文稿的规整。

编辑会议纪要:会议纪要可对比语音转写结果进行编辑会议纪要,复制语音转写文本内容到会议纪要中,更加高效快捷记录会议内容。
会后纪要归档:会议结束后,自动归档会议纪要文件。管理人员可前往历史会议中查看会议纪要文件,下载会议纪要文件;会议纪要可通过二维码分享。

音频文件导入转写:主要用于对历史音频转写的场景,用户可通过录音设备进行录音,将音频数据导入录音整理客户端后,可进行快速转写。系统支持最多每次上传50条音频,总大小不超过5GB,单条数据时长小于18小时;目前系统支持mp3\wav\pcm\wma\mp4\avi等格式的音频,上传成功后点击开始转写即可开始转写。

词汇替换:批量替换音频导入语音转写文本的内容,修正转写有误的文本。





功能介绍-用户管理
人员列表:将参会人员设为默认人员,无需每场会议重复添加。支持批量导入、导出人员。
组织架构:三级组织架构功能,自定义单位、部门、职务。选择参会人员可按照组织架构排列选择。

功能介绍-会议管理
会议列表:查看当前已创建的未开始、开会中的会议。
历史会议:支持克隆历史会议功能,无需重复配置会议信息,节省开会效率。

多会议模式:
多会议室时配语音转写服务网络版,统一提供语音转写服务能力,支持多达32间会议室同时使用。每间会议室只需配备一台管理电脑和会议相关设备。

文本分段:
具备智能语义分段、停顿时间、字数、关键字多种组合模式文本分段,配置更灵活。

字音同步:
具备字音对照功能,可对照文字拖动音频或指定文字跳转对应音频进度。

多格式导出:文本导出支持TXT、DOC、LRC、SRT多种格式文件导出。

手动角色分离:绑定音源后,手动操作F1-F12可进行12个角色的手动分离。

优势亮点:

智能断句:
分段分句:通过提取上下文相关的语义特征,同时结合停顿、基频信息等语音特征,来进行子句与段落的划分;综合运用上下文相关语义特征和语音学特征,解决分句与分段问题。
文本顺滑:通过使用泛化特征并结合上下文相关语义特征和语音学特征,剔除转写结果中的停顿词、语气词、重复词,使顺滑后的文本更易于阅读。
适用多种场景:适合办公会议、政府报告、新闻发布、学术讲座等各行业领域会议场景。非常适用政府企业、银行部门等无法使用公网语音识别服务的行业。
