“我们的症状诊断系统针对常见病典型症状的命中率已超过90%,已超过对标的梅奥医疗集团的症状诊断工具symptom checker10个百分点。”康夫子创始人兼CEO张超说。

他表示,这是因为传统的诊断学思维,使用人工编辑的知识库,知识库规模较小,在知识和信息更新上比较滞后,不能以自然语言处理,且大多采用决策树的结构,在诊断效果上很快就会达到瓶颈。而康夫子基于知识图谱推出的智能诊断系统在技术上会更有优势。

从技术原理上来说,康夫子智能诊断是经过3大步骤训练出来的。

  • 知识抽取:让计算机阅读理解海量医疗文献,抽取针对某种知识总结出上万条书写规律。如针对”疾病<—>症状”的关系,文献中描述方式为:“(X疾病)的症状有(Y症状) ”,“(X疾病)临床表现为(Y症状)”,“(X疾病)容易引起(Y症状)等不适症状”等等。 “知识规律”自动发现技术和高性能抽取工具,正是康夫子的技术壁垒。

  • 知识表示:包括知识向量化(即医学专业术语与大众语言的对应,比如“厌食”属于医学专业术语,对应的大众语言是“吃不下饭”)表示和知识关系概率化(一种疾病可能包括多种症状,一种症状也可能是多种疾病共同拥有的,二者的对应关系有一定概率)表示。

  • 逻辑应用:当用户搜索某种症状后,是否还会有其他伴随症状?这就涉及到查询分析和人机交互,最终呈现搜索结果。

实际上,除了symptom checker,国内也有类似的产品,比如多美小壹半个医生。从内测Demo上来看,康夫子诊断表现形式和半个医生相似度很高。但除了症状,康夫子用户还可以输入辅助检查结果(如白细胞数、AFP、TSH等数千种化验指标)来获取更科学的诊断。但张超表示,此Demo主要供B端用户调研使用,并不直接面向患者端。

康夫子微信服务号截图

目前,康夫子已经学习了近万本医学书籍、2000万篇医学论文,针对近1万多种疾病、数千种症状、化验指标、用药反应等知识构建了知识图谱。在7月中旬上线的康夫子1.0.1版本中,覆盖热门症状5000种,ICD10常见疾病4000种。

在后期,康夫子计划考虑患者群体特征(年龄、性别、孕妇、高血压等等)、患者病史、生活习惯等,让诊断变得更智能。不过,张超表示,智能诊断只是医疗大脑(医学知识图谱+推理逻辑)的一部分。康夫子想以这条线,把很多工作串起来。比如先诊断,再提供治疗建议、用药建议、预后管理等。

不过,当前所有的智能诊断产品还普遍面临一个技术难题,即假设患者只患有一种病。然而,一个人很大可能会同时患多种疾病。不过针对此类问题,张超认为,将输入症状进行时间序列化,可以得到较好地解决。

值得一提的是,2C的智能诊断因为变现难的问题,似乎都最终会走上B2B2C之路。相较于多美小壹和半个医生,起步较晚的康夫子也少走了一些弯路。不过,在做智能诊断之前,康夫子是做食物的营养健康分析和食谱推荐的,其构建营养健康知识图谱还在天使医生中粮数字等业务中得到了付费应用。他们认为老百姓在这块的痛点不强、依从性略差,于是转移了业务重心。

张超透露,康夫子智能诊断的B端目标客户分为三大类:搜索引擎类(借助大平台提供服务,同时共享流量)、智能硬件类(嵌入智能硬件,提升它们软能力)、以及医疗服务类(辅助全科或基层医生做医疗诊断)。

据了解,张超毕业于电子科技大学计算数学专业,曾任新加坡国大Prof. Tat-Seng Chua多媒体搜索实验室研究助理,后为前百度自然语言处理部资深研发工程师、知识挖掘方向负责人,知识图谱、实体建模方面专家;CTO张冲毕业与山大计算机系,也是前百度高级研发工程师,拥有丰富的架构、工程开发经验;CMO李志朋本科毕业于北医,是澳大利亚新南威尔士大学硕士,前地坛医院主治医师,后成卫计委疾控司处长,在20余年医疗从业经历中积累了大量的临床经验&医疗资源。

从智能诊断着手,康夫子欲建设“知识图谱+推理逻辑”的医疗大脑

发表评论

电子邮件地址不会被公开。 必填项已用*标注