NEWS
新闻中心
依托康夫子医疗知识图谱及智能对话交互技术研发而成的问诊机器人可以极大地帮助B端医疗服
返回列表页
获晨兴天使投资 他养智能医生消化2400万医疗数据 诊3千常见病
来源 : 孙娇 时间 : 2017-04-13

张超想把总结在文献上、论文中以及病例上的数据作为饲料,喂给计算机。

◆康夫子创始团队 右一为创始人张超。

文| 铅笔道 记者 孙娇

导语

培养一名合格的医生,或许需要十年。但医疗资源紧缺的当下,这一切显得太慢。

张超想把那些总结在文献上、论文中以及病例上的数据作为饲料,喂给计算机,让其成长为博览群书(医疗文献、论文、病例等)的全科智能医生,辅助医院提高诊疗效率。

信心来源于团队的技术积累。公司超过50%的人员为百度背景,在文本、自然语意处理方面有多年经验。他们碾碎超2000万本医疗文献、400多万份病例,梳理其中的书写规律,从而在系统内部构建知识图谱,输出针对病人的导诊、自诊报告以及面向医生的临床决策辅助报告。

截至目前,康夫子智能诊疗系统可在喂养材料(如文献、论文、病例)中提取50%~90%的知识点(根据内容复杂程度有所差别),知识准确率超过99%,覆盖3000种常见疾病。

系统已在四家医院内测,在不断学习医生的行为数据之后,康夫子诊疗系统正在变得更加聪明。

注:张超承诺文中数据无误,为其真实性负责,铅笔道已备份录音速记,为内容客观性背书。

试错后寻找刚需

“不想让谨慎把激情给磨没了。”在百度五年之后,张超对创业跃跃欲试。

他盯上的是营养建议。“搜索数据中,人们对于吃什么能让皮肤变好、吃什么更健康的关心居高不下。而搜索结果常常往上翻几页都打不住,信息十分分散。”

想法虽然模糊,但百度的标签让张超和小伙伴们在辞职创业之初便获得了来自唯猎资本的种子轮投资。

那时候没有办公室,初创团队就在哈根达斯的店面碰头,点上一壶茶,几个人一聊就是一个下午。

想法逐渐成型,团队以孕妇的饮食分析为切入口,上线孕食App。用户记录饮食情况后,系统根据内化的营养学知识图谱输出分析报告以及饮食建议。

但这次尝试并不成功。能坚持记录的孕妇寥寥无几,用户对App依赖不大。

半年后,团队选择放弃。张超牢牢记住了一个词——“刚需”。当对于用户来说,产品可有可无时,成功的几率也就不大了。

但接下来做什么,他陷入了迷茫。文本分析、知识图谱构建是团队的强项,健康领域也是团队一直比较看好的方向,张超就蒙着头朝这个方向想,一点一点地碰,一点一点地敲,看哪一扇门能够打开。

“如果饮食建议不是刚需,看病该是刚需了吧。我头疼,疼一天能忍,疼一周肯定得往医院跑。”张超把看病的环节都想了一遍,从刚开始挂号到医生诊断、开药,他脑海中零零碎碎拼凑了一些产品的功能,如指导患者定位合适的医院、科室,缩短就医路径;辅助医生诊疗,规避错误发生等。

那段时间,他和小伙伴隔三差五往医院跑,有时候假装患者去“窥探”一下医生的工作流程,或者找认识的医生朋友寻求建议。团队也会帮一些医疗文献机构梳理文本,跑跑数据。

构建医疗知识图谱

“我们从病例中抽取症状数据,总是抽不准,你们有办法吗?”在朋友的介绍下,康夫子团队获得与一家医院信息系统服务方合作的机会。

文本处理虽是团队优势所在,但医疗文献、病例中书写逻辑复杂,一字之差往往意思大相径庭。比如“感冒中有咯血”与“感冒时出现咯血”,虽然有诸多相似元素,但完全是不同的意思,一个描述症状,一个描述诱因,需要机器在学习过程中不断校正,理清书写逻辑。

张超将机器学习的评价指标分为两类,一种是召回率,即计算机能在文本中提取多少知识点;一种是准确率,即知识点的内在逻辑是否正确。

除了医院病例之外,他让计算机学习大量的医学文献以及论文,梳理其中的书写逻辑,如感冒分为风热和风寒,则对于计算机而言,此句式代表的知识点为感冒、风热、风寒三个专有名次,以及包含的内在逻辑关系。

但知识点的构建并不能成为图谱,在计算机吸收了疾病、症状、检验结果、医院、医生、诱因、遗传史、过敏史等不同种类的知识点之后,需要对其中的关系进行逻辑推理,并作出定义才能称之为图谱。如某种疾病包含某种症状,某种疾病由某个诱因产生等。

计算机在消化被喂养的饲料即医疗文献、论文、病例等后,在内部构建知识图谱,针对病人输出初步的自诊报告以及就诊医院、科室建议;针对医生,则可以输出临床决策辅助报告,以提高医生的诊断效率。

◆康夫子系统自诊演示

这样一来,出现在张超脑海中的碎片化需求通过知识图谱被串了起来,他希望找到更多的数据来喂养智能诊疗系统,以提高其召回率和准确率。

获晨兴天使轮投资

去年下半年,有很多投资人找到康夫子团队。人工智能加医疗健康成为热门赛道,张超感受到了资本的热情。

与晨兴资本的初次见面是在对方最大的一间会议室里,椭圆的会议桌边围坐了20多人。张超打开PPT,从团队优势一路讲到知识图谱。对于能否融资成功,他心里没底,但他觉得“对方至少听懂了”。

“很多人把机器学习说得很玄乎,其实讲明白了也就那么回事,关键得有靠谱的团队。”张超对靠谱有一套衡量指标,他称为“熟练工种的数量”,即团队中有多少人在该领域有深厚的技术积累。

康夫子团队50%的百度技术背景让张超自觉还算靠谱。去年10月,项目获得来自晨兴资本的天使轮投资。

随后,团队通过与医院信息系统服务商合作,铺进了更多医疗机构。今年年初,康夫子面向C端用户的导诊和自诊系统上线某搜索引擎,用户可在线使用,通过问答以及症状填写等,获得就诊科室指导以及初步诊查报告,而在背后坐诊的正是消化了大量医学文献以及病例的康夫子智能系统。

截至目前,康夫子智能诊疗系统已吸收2000多万本医疗文献、超400万份病例报告,可在其中提取50%~90%的知识点(根据内容复杂程度有所差别),知识准确率超过99%,覆盖3000种常见疾病。

系统已在四家医院内测,张超希望这样的医院数量能够更多。他认为智能系统在学习医生的行为数据之后,将会变得更加聪明。