介绍

英文题目：EHR Coding with Multi-scale Feature Attention and Structured Knowledge Graph Propagation

中文题目：基于多尺度特征关注和结构化知识图传播的 EHR 编码

论文地址：https://sci-hubtw.hkvisa.net/10.1145/3357384.3357897

领域：自然语言处理，生物医疗，ICD 编码

发表时间：2019

作者：Xiancheng Xie 等，复旦大学

出处：ACM CIKM

被引量：25

阅读时间：2022.06.16

读后感

很好地结合了现有的资源和方法：利用编码的内在关系，结合了注意力机制，知识图谱，密连接网络等方法。

泛读

针对问题：ICD 自动编码
核心方法：
- 通过对每个词上下文邻居的 n-gram，选择多尺度特征
- 利用 ICD 标签的语义：编码越相近，含义越相近，利用图卷积网络捕捉 ICD 编码的层次关系和语义
- 基于 ICD 标签的注意力；结合多尺度特征，用注意力选择信息量最大的 n-gram 特征
理解程度：
- 一个半小时精读，又花了约两小时整理成文。

方法

概览

论文将问题定义为多标签分类问题。方法由三部分组成：

提取多尺度特征（图上）
两层注意力机制更好地计算输入文本的表征（图中）
用知识图谱迭代计算 ICD 表征（图下）

符号定义

其它符号：m 表示医生输入串的长度，n 表示 ICD 编码描述文本的长度，d 表示维度。

嵌入层

用 X 表示词嵌入，利用 word2vec 的连续词袋 (CBOW) 对训练集中的所有文本进行预训练，词嵌入大小为 100，窗口为 5，5 次迭代。

密连接卷积层

CNN 由 K 个卷积块通过密连接堆叠而成，用 Xk 表示第 k 个卷积块的输出，Xk 计算方法如下：

其中中括号表示串联，Xk 由前 k-1 层输出串联 (图中红线) 后，与参数 W 通过函数 F 计算出 Xk，W 是卷积核。为了保持字符串的长度一致，使用 zero-padding 填充。由于使用了卷积，Xk 可被视为 n-gram 特征，通过卷积逐层抽象；再用 concat 将各层抽象连接起来，生成了多尺度特征。