抽取知识图谱打造“医疗大脑”,这家公司用”AI+数据”让医患沟通更加高效

抽取知识图谱打造“医疗大脑”,这家公司用”AI+数据”让医患沟通更加高效

2019-01-22 13:20宁泽西 新芽记者
根据国际惯例的服务标准,一个家庭医生对应服务2000个居民,但个人精力有限,这就需要机器人医生担任助手的角色。张超告诉新芽记者,康夫子的左手医生机器人医生承担了中间的桥梁的角色,释放家庭医生的服务能力,帮助一个家庭医生能够服务2000-3000人。

在“AI+医疗”这条赛道上,人工智能的应用大多体现在影像资料和数据分析上,但人工智能如何通过与病人的直接接触和互动交流来实现诊断和治疗,仍是一道亟需攻坚的难题。

解题过程中衍生出众多破局者,北京康夫子科技有限公司便是其中一家。

康夫子成立于2015年,专注于人工智能技术在医疗健康领域应用研发,凭借知识抽取和知识推理、表示等知识图谱构建技术,通过建立“医疗大脑”知识图谱,打造了“左手医生智能机器人全科医生”,希望通过“AI+数据”提升医疗行业的效率和体验。

创始人张超告诉新芽(微信公众号ID:pelink)记者,左手医生机器人医生有两个不同的场景,一个是以开放平台为主,搭载了智能自诊、智能导诊、智能预问诊、智能问药和智能问答五大板块功能,为第三方(医院、互联网医疗公司、智能硬件厂商等)赋能,。另一个场景是专门针对普通用户的“左手医生APP”,患者可以直接向“机器人医生”描述病状,通过这位“机器人医生”,了解到自己可能患有的疾病,以及常规用药方案。

机器人医生弥补中国医疗需求缺口

中国老百姓的健康问题需求有多大?

数据显示,每天有6000万人在搜索引擎上搜索医疗健康类问题,而每天全国医院的门诊量是2000万人次。张超认为,从6000万到2000万,是非常大的差距,所以未来的机器人医生可以弥补这一空间。而现在互联网线上问诊产品,加在一起的问诊量不足100万,机器人医生发展空间巨大。

从政策层面看,医改十三五规划将建立“分级诊疗制度”置于5项重点医改任务之首,分级诊疗成为医改的重中之重。近年来,不少地方开展了一系列促进分级诊疗的改革探索。

根据国际惯例的服务标准,一个家庭医生对应服务2000个居民,但个人精力有限,这就需要机器人医生担任助手的角色。张超告诉新芽记者,康夫子的左手医生机器人医生承担了中间的桥梁的角色,释放家庭医生的服务能力,帮助一个家庭医生能够服务2000-3000人。

针对中国医疗需求缺口巨大、基层医疗能力不足的痛点,康夫子的左手医生智能机器人全科医生还可以协助医生做智能分诊导诊、智能预问诊。在接入左手医生开放平台的医院里,患者可以通过机器人医生获得诊前与诊后的疾病预问诊、分诊、导诊、挂号、问药、健康咨询等服务;医生可以通过系统的多轮对话,采集到患者的主诉、病情等信息,并由系统整理成的电子病历推送给医生。另外,左手医生开放平台还可以作为底层技术,不仅能提供病历结构化等数据结构化服务,还可以嵌入到具有AI和大数据需求的服务模块中进行赋能。

抽取知识图谱打造“医疗大脑”

医生端最关心的问题是:准确率有多高?医院往往会先做测试,导诊准确率超过95%才能取得进入医院的资格。

张超告诉记者,左手医生的导诊机器人准确率能够达到95%以上,病历改动率小于25%,背后依靠的是其打造的医疗知识图谱,相当于一个“医疗大脑”。它通过计算机去阅读医疗文献,构建完整的医疗知识库,进而模拟真实医生的成长过程,赋予知识库逻辑推理能力,最后达到辅助医生诊断、帮助患者提前问诊、问药、健康问答等目的。

左手医生APP界面

知识图谱的构建需要通过信息抽取技术(Information Extraction, IE)来实现,张超告诉新芽记者,信息抽取实际是学习人的语言习惯,因为人们在描述某个信息或者知识的时候,会按照特定的方法、规则去描述,把它枚举后,就可以抽取了。

从技术原理上来说,其智能诊断是经过3大步骤训练出来的:

1、知识抽取:类似医生记忆医学知识。医疗AI的首要任务是构建医疗知识图谱进而支撑一系列的应用。知识图谱一直是各大AI公司的必争之地,相比较Google、Baidu等巨头基于Wikipedia、百科等半结构化站点来构建知识图谱,左手医生采取的是基于无结构化文本抽取来构建知识图谱。这是因为医学的复杂性,导致其知识还存在于教科书籍、论文、科普文章等无结构化文本中。

在知识抽取方面,左手医生有自己的原创技术,系统可以自动从海量文献中学习到书写某种知识的“规律”后进行二次大规模自动抽取,同时设计了一套高性能计算框架来缓解复杂计算。

2、知识表示:类似医生在积累医疗经验。在得到结构化的医学知识后,左手医生要让这些知识具备推理的能力。这里分为两方面:

一是知识向量化表示,基于深度学习技术,把疾病、症状向量化表示,进而实现一些推理的行为,如患者说“胃不舒服”,系统会交互,是“恶心”、“胃酸”还是“胃胀”。

二是知识关系权重表示。很多传统的概率统计模型是建立在独立假设上面的,但实际上这个是不合理的,比如在根据一组症状推导可能疾病时,就必须要考虑到症状之间的演变逻辑。

3、逻辑应用:类似医生在做问诊服务。受限与医学的复杂性以及知识壁垒,不仅仅是患者,有时候连医生都无法考虑周全。这时候就需要系统能智能交互,分析患者的病情,并进行智能的提问来获取更多的患者特征。

让每一个人都有机器人医生服务

相比于同类创业公司,左手医生具备的首先是技术优势,团队成员多来自百度:创始人兼CEO张超,曾任百度NLP资深研发工程师,是文本知识发掘方向技术负责人,知识图谱实体建模方面专家;技术合伙人张冲负责整体架构,是前百度高级研发工程师;技术合伙人栗晓华是前百度NLP高级研发工程师……有很强的技术领跑的时间窗口。

其次是数据积累形成的规模优势,左手医生的数据主要来源于四个方面:权威的医学文献,如海量的医学数据、诊疗指南、相关论文等;千万人次的住院病历脱敏数据;互联网的科普资讯、医患问答数据以及每天数十万人次的产品使用反馈数据等。目前,左手医生已经学习了近万本医学书籍、2000万篇医学论文,针对近1万多种疾病、数千种症状、化验指标、用药反应等知识构建了知识图谱。

左手医生的商业模式是收软件授权的费用,未来希望通过流量变现,把保险、药品等第三方服务加进来,撮合患者需求和医疗服务。已落地的医院包括北京协和医院、301医院、济南市儿童医院、南京鼓楼医院、宜昌市中心人民医院、福建医科大学孟超肝胆医院,合作伙伴包括东华软件、东软、联众智慧、天健、创业软件、北大医疗信息技术有限公司、卫宁健康、老百姓大药房、健客网等等。

张超表示,左手医生希望通过机器人医生,让每一个老百姓都有一位私人的机器人医生提供服务。希望未来的2-3年,有20%的患者在去医院就诊时,首次见到的是一名机器人医生。甚至网上搜索的医疗信息30-40%都是由机器人提供的。

*本文为新芽NewSeed原创,网页转载须在文首注明新芽NewSeed(微信公众号ID:pelink)及作者名字。微信转载须在文章评论区联系授权。如不遵守,新芽NewSeed将向其追究法律责任。