avatar
Articles
913
Tags
294
Categories
199

Yan 的杂物志_个人主页分享
Search
论文阅读_关系抽取_CASREL
Created2022-06-19|2_Note0_Technic2_算法6_自然语言特定功能模型
介绍 英文题目:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction 中文题目:抽取关系三元组的级联二元标注框架 论文地址:https://aclanthology.org/2020.acl-main.136.pdf 领域:自然语言处理,知识抽取 发表时间:2019 作者:Zhepei Wei, 吉林大学 出处:ACL 被引量:3 代码和数据: https://github.com/xiangking/ark-nlp https://github.com/weizhepei/CasRel 阅读时间:2022.06.17 读后感 主要解决了三元组重叠问题,相较之前模型,在架构上进行了大调整。 介绍 知识抽取 Information extraction (IE)是从文本构建知识图谱的重要环节。具体操作是从文中抽取关系三元组,它包含:主语 s,关系 r,宾语 o。早期一般使用管道 pipeline 方法:先识别句中的实体,然后对每个实体对建立关系,这可能引起错误的传播;后来出现了基于人工构建特征的 ...
论文阅读_ICD编码_TLSTM
Created2022-06-18|2_Note0_Technic1_医学医学_技术论文
介绍 英文题目:A Neural Architecture for Automated ICD Coding 中文题目:ICD 自动编码的神经体系结构 论文地址:http://www.cs.cmu.edu/~epxing/papers/2018/Xie_etal_acl18.pdf 领域:自然语言处理,生物医疗 发表时间:2018 作者:Pengtao Xie 等,卡内基梅隆大学,北京大学 出处:ACL 2018 被引量:55 阅读时间:2022.06.18 读后感 论文主要挖掘了ICD 编码之间的层级和相关性,同时还考虑到人工描述和 ICD 标准文本不同的语言风格,一对多的情况下,多个对应项的重要性排序,以及编码的协同和互斥。 泛读 针对问题:ICD 自动编码 核心方法: 使用树和序列 LSTM 计算基于语义的 ICD 编码表示 使用对抗学习协调人工输入和 ICD 描述的语言风格 利用等张约束做重要性排序 利用注意力机制实现一对多、多对一映射 泛读后理解程度: 一个半小时精读,两个小时整理。 方法 概览 Pasted image 20220618143519.png ...
论文阅读_ICD编码_MSATT-KG
Created2022-06-16|2_Note0_Technic1_医学医学_技术论文
介绍 英文题目:EHR Coding with Multi-scale Feature Attention and Structured Knowledge Graph Propagation 中文题目:基于多尺度特征关注和结构化知识图传播的 EHR 编码 论文地址:https://sci-hubtw.hkvisa.net/10.1145/3357384.3357897 领域:自然语言处理,生物医疗,ICD 编码 发表时间:2019 作者:Xiancheng Xie 等,复旦大学 出处:ACM CIKM 被引量:25 阅读时间:2022.06.16 读后感 很好地结合了现有的资源和方法:利用编码的内在关系,结合了注意力机制,知识图谱,密连接网络等方法。 泛读 针对问题:ICD 自动编码 核心方法: 通过对每个词上下文邻居的 n-gram,选择多尺度特征 利用 ICD 标签的语义:编码越相近,含义越相近,利用图卷积网络捕捉 ICD 编码的层次关系和语义 基于 ICD 标签的注意力;结合多尺度特征,用注意力选择信息量最大的 n-gram 特征 理解程度: 一个半小时精读,又花了约两 ...
论文阅读_ICD编码_MSMN
Created2022-06-14|2_Note0_Technic1_医学医学_技术论文
介绍 英文题目:Code Synonyms Do Matter: Multiple Synonyms Matching Network for Automatic ICD Coding 中文题目:自动 ICD 编码的同义词匹配网络 论文地址:https://export.arxiv.org/pdf/2203.01515.pdf 领域:自然语言处理、生物医疗 发表时间:2022 作者:Zheng Yuan 等,清华大学,阿里巴巴 出处:ACL 代码和数据:https://github.com/GanjinZero/ICD-MSMN 阅读时间:2022.06.14 读后感 通过代入外部资源 UMLS,论文收集了每个编码的同义词,从而弥补了电子病历与 ICD 编码描述中同义不同词的问题。 其算法并没有像之前一些模型那么精巧,但引入外部资源后,效果的确提升不少。 泛读 针对问题:ICD 编码中一义多词问题 核心方法: 提出了多同义词匹配网络 (MSMN) 使用LSTM+ 多头注意力 将编码的同义词作为 query 以关注描述中的不同短语,从而生成与 ICD 编码相关的表示。 使用双仿射的 ...
论文阅读_中文NLP精减模型ELECTRA
Created2022-06-14|2_Note0_Technic2_算法11_优化模型蒸馏
介绍:ELECTRA 由 Manning 联合谷歌发布,后来哈工大讯飞联合实验室训练了相应的中文模型。精减后的模型效果和 BERT 差不太多,而模型大小只有 BERT 的 1/10,ELECTRA-small 只有 46M。 代码&模型下载&详细说明:https://github.com/ymcui/Chinese-ELECTRA 使用:LTP 使用它为基础模型。 原理:使用生成对抗网络训练自然语言模型,时间短,参数少。模型分为两部分:生成器和判别器,生成实现 MLM,判别器用于识别每一个单词是否为模型生成。 效果:以中文阅读理解为例,其效果对比如下,其它实验详见 github Pasted image 20220620181324.png
论文阅读_BEVSegFormer
Created2022-06-05|2_Note0_Technic2_算法8_图形图像自动驾驶
介绍 英文题目:BEVSegFormer: Bird’s Eye View Semantic Segmentation From Arbitrary Camera Rigs 中文题目:BEVSegFormer: 基于任意相机的鸟瞰图语义分割 论文地址:https://arxiv.org/abs/2203.04050 领域:机器视觉,自动驾驶 发表时间:2022 年 3 月 作者:来自上海的自动驾驶创业公司 Nullmax 阅读时间:2022.05.28 其它相关网文:https://blog.csdn.net/Yong_Qi2015/article/details/124311369 介绍 之前从摄像机视图转成 BEV 的方法多以 IPM 为主,该方法需要知道摄像机的内外参数以及位置信息。在有遮挡及距离比较远的情况下,都无法达到很好的效果。近年来更多应用了深度学习方法。 优点 不需要摄像机的参数 有效聚合多摄像头数据 优化了图像分割效果 核心算法 (论文正文第 3 页) 三个步骤: 从一个共享 Backbone 处理各摄像机,输出 Feature map。 基于 Transfor ...
论文阅读_一对多的手术名称规范化
Created2022-06-04|2_Note0_Technic1_医学医学_技术论文
介绍 英文题目:A Knowledge-driven Generative Model for Multi-implication Chinese Medical Procedure Entity Normalization 中文题目:知识驱动的多含义中文医疗实体规范化生成模型 论文地址:https://www.aclweb.org/anthology/2020.emnlp-main.116.pdf 领域:自然语言处理,实体规范化,医疗 发表时间:2020 作者:Jinghui Yan 等,北京交通大学,中国科学院,繁宇科技有限公司 出处:EMNLP 被引量:4 阅读时间:22.06.04 针对问题:中文 ICD9 手术名称的规范化 结果:支持手术名称一对多规范化 核心方法:使用生成模型;利用知识约束;用子类数据精调模型 读后感 如果单纯依赖数据和模型,极可能产生一些完全不靠谱的匹配,文本规范化优化方法,多是针对这一问题的改进,比如代入知识。论文使用生成模型解决文本规范化问题,想法比较有意思,另外,使用约束的方式把知识代入了深度学习模型。 介绍 命名实体规范化(Named entity ...
论文阅读_图神经网络GIN
Created2022-06-01|2_Note0_Technic2_算法12_图神经网络
介绍 英文题目:How Powerful are Graph Neural Networks? 中文题目:图神经网络有多强大? 论文地址:https://arxiv.org/pdf/1810.00826.pdf 领域:图神经网络,知识表示 发表时间:2018 作者:Keyulu Xu 等,MIT,斯坦福大学 出处:ICLR 被引量:1506 阅读时间:22.06.11 读后感 这也是一篇引用量很大的图神经网络精典论文。之前研究方法着重于表示节点,引文着眼于表征图的结构。作者认为之前方法难以区分不同的图结构,并提出了一种基于 GNN 的方法 GIN,它的区分效果与 WL-Test 效果相当。 介绍 一般情况下一个节点的表式通过聚合它 k 跳之内的邻近节点计算,而全图的表示则通过对所有节点的池化计算。 近年来新型 GNN 的设计主要基于经验直觉、启发式和实验试错法,而对神经网络的性质和局限性的理论较少。文中提出理论框架来分析 GNN 的能力,这里主要是评价模型是否能够区分网络结构。 文中使用了 WL-test 方法,即图同构测试,它是一个区分网络结构的强效方法,也是通过迭代聚合邻居的方法来 ...
论文阅读_BEVFormer
Created2022-05-28|2_Note0_Technic2_算法8_图形图像自动驾驶
介绍 英文题目:BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers 中文题目:BEVFormer: 通过时空 Transformers 从多摄像头图像学习鸟瞰图表示 论文地址:https://arxiv.org/pdf/2203.17270v1.pdf 领域:机器视觉,自动驾驶 发表时间:2022 年 3 月 作者:Zhiqi Li 等 出处:南京大学,上海人工智能实验室,香港大学 代码和数据:https://github.com/zhiqi-li/BEVFormer 阅读时间:2022.05.22 读后感 文中方法和特斯拉视频(特斯拉2021人工智能日AI Day完整视频)架构相似。比较有意思的地方是在BEV 层面结合了时间和空间信息。 介绍 在 3D 感知领域,雷达已取得了很好效果,机器视觉近几年也受到关注,除了成本低,相对雷达,它还能感知远距离物体,以及识别道路标识。 BEV 鸟瞰图从多个摄像头信息计算表征,用于描述周 ...
论文阅读_中文生物医学语言理解评价CBLUE
Created2022-05-15|2_Note0_Technic1_医学医学_技术论文
介绍 英文题目:CBLUE: A Chinese Biomedical Language Understanding Evaluation 中文题目:CBLUE:中文生物医学语言理解评价基准 论文地址:https://arxiv.org/pdf/2106.08087.pdf 领域:自然语言处理,知识图谱 发表时间:2021 年 作者:Ningyu Zhang,医渡云、平安医疗科技、阿里夸克、鹏城实验室、北京大学、哈尔滨工业大学 (深圳)、同济大学、郑州大学等共同协办 出处:ACL(自然语言处理顶级会议) 被引量:3 数据:https://tianchi.aliyun.com/dataset/dataDetail?dataId=95414 (需要提交申请) 代码:https://github.com/CBLUEbenchmark/CBLUE 阅读时间:2022.05.09 读后感 训练和评测数据非常全面,还可以在天池打榜。 介绍 之前生物医学方面数据以英文为主,本文收集了真实世界的生物医学数据,提出了第一个中文生物医学语言理解评估标准 CBLUE。其内容覆盖命名实体识别,知识抽取,诊断标 ...
1…495051…92
avatar
Yan.xie
顺流而下还是逆流而上?
Articles
913
Tags
294
Categories
199
Follow Me
Announcement
This is my Blog
Recent Post
FreeCAD用于3D建模2026-01-05
第一次买拓竹 3D 打印机,该选 A1 还是 P2S2026-01-05
3D打印常用软件2026-01-05
3D打印盘清洁与涂胶技巧2026-01-05
玩3D打印花多少钱?从设备到耗材的真实花费2026-01-04
Categories
  • 0_IMO90
    • 工作1
    • 方法1
      • 工作1
    • 说给一个人听88
      • 01_自我建构36
        • 实修3
        • 思考与觉悟17
Tags
版本管理 插件推荐 Agent 生活 深度学习 行为模式 智能家居 宗教 投资 项目管理 Pytorch 视频生成 心理学 自然 菜谱 大模型 数据安全 工作思考 语音 程序员 Paper 卡片 2023年 加密货币 卷积神经网络 多代理系统 多模态 心理调节 指标 模型工具 情绪表达 美食 基金 人生哲学 概率 开发 技术 佛教 社会评价 #论文阅读
Archives
  • January 20266
  • December 202525
  • November 202512
  • October 20259
  • September 20255
  • August 202517
  • July 202538
  • June 202537
Info
Article :
913
Total Count :
1269.4k
UV :
PV :
Last Push :
©2020 - 2026 By Yan.xie
Framework Hexo|Theme Butterfly
京公网安备11010802043346号
京ICP备2023029600号-1
Search
Loading the Database