医疗智慧语音系统

  • 医疗智慧语音系统已关闭评论
  • 342 views
  • A+
所属分类:杂志 解决方案

医疗智慧语音系统

医疗智慧语音系统是应用于医院内部人工智能服务的基础平台,作为语音一种语音服务,为应用终端提供语音服务,通过集成标准的SDK控件,为最终用户提供语音识别、语音合成、声纹识别、自然语言理解算法及模型,实现医疗业务场景下的自由接入,提高语音在院内使用效果。

医疗智慧语音系统作为底层的技术平台,提供语音能力。相比于传统的院内集成平台或区域卫生信息平台,该语音平台不提供数据采集、数据交换、数据集成等功能,两者服务对象和服务内容区别较大。医疗智慧语音系统

平台整体分为平台服务层、能力层、接入层:

  1. 平台服务层

整个平台的运营提供统一管理,包含授权管理、运营分析、运营监控以及面向开发者的统一开发者平台。

  1. 能力层

机器人系统的核心是服务能力层,为业务应用层的开发和运行提供能力支撑,并具有灵活的可扩充性和高度的可配置管理性,主要提供语音合成、语音识别、语义理解、人脸识别、文本挖掘和麦克风阵列等核心能力。

  1. 接入层

机器人系统不仅支持机器人接入,也支持Web、微信、IM、智能硬件等多渠道接入。

多模态输入架构设计

在医院门急诊诊室、病房、医技科室,医生面对患者,针对症状、病情、治疗方案与患者进行沟通,针对病症进行检查和处置;医患沟通、检查、处置过程中,采用定制医疗智能语音输入套件全程录音,医生以口述的方式描述电子文本内容,后台经过语音识别+自然语言理解,在医生工作站实时智能展现自动生成的非结构化或结构化电子文本;医生回到工作站,只需对文本内容进行简单修改确认,即可打印提供给患者,并完成电子档保存。医疗智慧语音系统

(1)基础层

医疗多模态输入系统支持院内私有云/公有云部署,采用业界领先的智能语音识别、语音合成和自然语音理解等人工智能技术,为语音应用提供基础的语音技术支撑和相应的自然语言理解技术。

数据以数据库等多种存储方式进行存储,在存储架构设计中重点考虑数据的存储、归档、检索的效率,以及所涉及的数据备份与恢复。根据信息的分类,医疗多模态输入系统数据存储层分为三个存储库:医疗文本数据库、医学语音库、模型资源库。

(2)服务层

医疗多模态输入系统的核心是服务能力层,为业务应用层的开发和运行提供能力支撑,并具有灵活的可扩充性和高度的可配置管理性,主要提供语音识别、语义理解、电磁感压、负载服务四个核心能力,构建在医疗语音云平台上(院内支持),用于将医生的语音以机器转写的方式识别为文字,手写笔迹的留存、建索。

(3)接口层

第三方应用系统采用终端经由服务端接入到引擎的串联链路式架构,继承了成熟的语音平台高稳定的特点,可以满足企业级应用的可靠性、可用性要求。针对传统语音应用集成开发困难,业务设计繁琐的问题,接口层大大简化了集成开发和业务开发的复杂度,提供简单易用的SDK/WEBAPI组件,为系统集成人员和业务开发人员提供了便捷、高效的开发环境。

(4)业务应用层

医疗多模态输入系统的业务应用层满足用户的功能和性能要求,稳定、可靠、实用;人机界面友好,输出、输入方便,图表生成美观,检索、查询简单快捷;包括智能语音输入、智能手写输入、超声科语音助理等功能。

技术特点

医学AI能力医疗智慧语音系统是面向业务应用系统的基础平台,采用领先的人工智能技术方案,以服务的方式为应用终端提供智能语音服务,通过集成标准的SDK控件,提供语音识别、语音合成、声纹识别、自然语言处理等服务,支持与第三方厂商调用平台上的语音能力。

基于智能医疗语音私有云提供的语音技术,结合智能鼠标、麦克风,实现软硬件一体化,使用专业级的定向麦克风主动降噪,医生以口述的方式描述文书内容,后台通过语音识别+自然语言理解,在医生工作站实时智能展现。针对有经验但不改变手写习惯的医生,多模态输入系统提供晓医智能手写板,随时随地记录专家笔迹,建索、存档、批注,实时同步到临床业务系统中。