avatar
Articles
834
Tags
257
Categories
173

Yan 的杂物志_个人主页分享
Search
论文阅读_关系抽取_CASREL
Created2022-06-19|2_Note0_Technic2_算法6_自然语言特定功能模型
介绍 英文题目:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction 中文题目:抽取关系三元组的级联二元标注框架 论文地址:https://aclanthology.org/2020.acl-main.136.pdf 领域:自然语言处理,知识抽取 发表时间:2019 作者:Zhepei Wei, 吉林大学 出处:ACL 被引量:3 代码和数据: https://github.com/xiangking/ark-nlp https://github.com/weizhepei/CasRel 阅读时间:2022.06.17 读后感 主要解决了三元组重叠问题,相较之前模型,在架构上进行了大调整。 介绍 知识抽取 Information extraction (IE)是从文本构建知识图谱的重要环节。具体操作是从文中抽取关系三元组,它包含:主语 s,关系 r,宾语 o。早期一般使用管道 pipeline 方法:先识别句中的实体,然后对每个实体对建立关系,这可能引起错误的传播;后来出现了基于人工构建特征的 ...
论文阅读_ICD编码_TLSTM
Created2022-06-18|2_Note0_Technic1_医学医学_技术论文
介绍 英文题目:A Neural Architecture for Automated ICD Coding 中文题目:ICD 自动编码的神经体系结构 论文地址:http://www.cs.cmu.edu/~epxing/papers/2018/Xie_etal_acl18.pdf 领域:自然语言处理,生物医疗 发表时间:2018 作者:Pengtao Xie 等,卡内基梅隆大学,北京大学 出处:ACL 2018 被引量:55 阅读时间:2022.06.18 读后感 论文主要挖掘了ICD 编码之间的层级和相关性,同时还考虑到人工描述和 ICD 标准文本不同的语言风格,一对多的情况下,多个对应项的重要性排序,以及编码的协同和互斥。 泛读 针对问题:ICD 自动编码 核心方法: 使用树和序列 LSTM 计算基于语义的 ICD 编码表示 使用对抗学习协调人工输入和 ICD 描述的语言风格 利用等张约束做重要性排序 利用注意力机制实现一对多、多对一映射 泛读后理解程度: 一个半小时精读,两个小时整理。 方法 概览 Pasted image 20220618143519.png ...
论文阅读_ICD编码_MSATT-KG
Created2022-06-16|2_Note0_Technic1_医学医学_技术论文
介绍 英文题目:EHR Coding with Multi-scale Feature Attention and Structured Knowledge Graph Propagation 中文题目:基于多尺度特征关注和结构化知识图传播的 EHR 编码 论文地址:https://sci-hubtw.hkvisa.net/10.1145/3357384.3357897 领域:自然语言处理,生物医疗,ICD 编码 发表时间:2019 作者:Xiancheng Xie 等,复旦大学 出处:ACM CIKM 被引量:25 阅读时间:2022.06.16 读后感 很好地结合了现有的资源和方法:利用编码的内在关系,结合了注意力机制,知识图谱,密连接网络等方法。 泛读 针对问题:ICD 自动编码 核心方法: 通过对每个词上下文邻居的 n-gram,选择多尺度特征 利用 ICD 标签的语义:编码越相近,含义越相近,利用图卷积网络捕捉 ICD 编码的层次关系和语义 基于 ICD 标签的注意力;结合多尺度特征,用注意力选择信息量最大的 n-gram 特征 理解程度: 一个半小时精读,又花了约两 ...
论文阅读_ICD编码_MSMN
Created2022-06-14|2_Note0_Technic1_医学医学_技术论文
介绍 英文题目:Code Synonyms Do Matter: Multiple Synonyms Matching Network for Automatic ICD Coding 中文题目:自动 ICD 编码的同义词匹配网络 论文地址:https://export.arxiv.org/pdf/2203.01515.pdf 领域:自然语言处理、生物医疗 发表时间:2022 作者:Zheng Yuan 等,清华大学,阿里巴巴 出处:ACL 代码和数据:https://github.com/GanjinZero/ICD-MSMN 阅读时间:2022.06.14 读后感 通过代入外部资源 UMLS,论文收集了每个编码的同义词,从而弥补了电子病历与 ICD 编码描述中同义不同词的问题。 其算法并没有像之前一些模型那么精巧,但引入外部资源后,效果的确提升不少。 泛读 针对问题:ICD 编码中一义多词问题 核心方法: 提出了多同义词匹配网络 (MSMN) 使用LSTM+ 多头注意力 将编码的同义词作为 query 以关注描述中的不同短语,从而生成与 ICD 编码相关的表示。 使用双仿射的 ...
论文阅读_中文NLP精减模型ELECTRA
Created2022-06-14|2_Note0_Technic2_算法11_优化模型蒸馏
介绍:ELECTRA 由 Manning 联合谷歌发布,后来哈工大讯飞联合实验室训练了相应的中文模型。精减后的模型效果和 BERT 差不太多,而模型大小只有 BERT 的 1/10,ELECTRA-small 只有 46M。 代码&模型下载&详细说明:https://github.com/ymcui/Chinese-ELECTRA 使用:LTP 使用它为基础模型。 原理:使用生成对抗网络训练自然语言模型,时间短,参数少。模型分为两部分:生成器和判别器,生成实现 MLM,判别器用于识别每一个单词是否为模型生成。 效果:以中文阅读理解为例,其效果对比如下,其它实验详见 github Pasted image 20220620181324.png
论文阅读_BEVSegFormer
Created2022-06-05|2_Note0_Technic2_算法8_图形图像自动驾驶
介绍 英文题目:BEVSegFormer: Bird’s Eye View Semantic Segmentation From Arbitrary Camera Rigs 中文题目:BEVSegFormer: 基于任意相机的鸟瞰图语义分割 论文地址:https://arxiv.org/abs/2203.04050 领域:机器视觉,自动驾驶 发表时间:2022 年 3 月 作者:来自上海的自动驾驶创业公司 Nullmax 阅读时间:2022.05.28 其它相关网文:https://blog.csdn.net/Yong_Qi2015/article/details/124311369 介绍 之前从摄像机视图转成 BEV 的方法多以 IPM 为主,该方法需要知道摄像机的内外参数以及位置信息。在有遮挡及距离比较远的情况下,都无法达到很好的效果。近年来更多应用了深度学习方法。 优点 不需要摄像机的参数 有效聚合多摄像头数据 优化了图像分割效果 核心算法 (论文正文第 3 页) 三个步骤: 从一个共享 Backbone 处理各摄像机,输出 Feature map。 基于 Transfor ...
论文阅读_一对多的手术名称规范化
Created2022-06-04|2_Note0_Technic1_医学医学_技术论文
介绍 英文题目:A Knowledge-driven Generative Model for Multi-implication Chinese Medical Procedure Entity Normalization 中文题目:知识驱动的多含义中文医疗实体规范化生成模型 论文地址:https://www.aclweb.org/anthology/2020.emnlp-main.116.pdf 领域:自然语言处理,实体规范化,医疗 发表时间:2020 作者:Jinghui Yan 等,北京交通大学,中国科学院,繁宇科技有限公司 出处:EMNLP 被引量:4 阅读时间:22.06.04 针对问题:中文 ICD9 手术名称的规范化 结果:支持手术名称一对多规范化 核心方法:使用生成模型;利用知识约束;用子类数据精调模型 读后感 如果单纯依赖数据和模型,极可能产生一些完全不靠谱的匹配,文本规范化优化方法,多是针对这一问题的改进,比如代入知识。论文使用生成模型解决文本规范化问题,想法比较有意思,另外,使用约束的方式把知识代入了深度学习模型。 介绍 命名实体规范化(Named entity ...
论文阅读_图神经网络GIN
Created2022-06-01|2_Note0_Technic2_算法12_图神经网络
介绍 英文题目:How Powerful are Graph Neural Networks? 中文题目:图神经网络有多强大? 论文地址:https://arxiv.org/pdf/1810.00826.pdf 领域:图神经网络,知识表示 发表时间:2018 作者:Keyulu Xu 等,MIT,斯坦福大学 出处:ICLR 被引量:1506 阅读时间:22.06.11 读后感 这也是一篇引用量很大的图神经网络精典论文。之前研究方法着重于表示节点,引文着眼于表征图的结构。作者认为之前方法难以区分不同的图结构,并提出了一种基于 GNN 的方法 GIN,它的区分效果与 WL-Test 效果相当。 介绍 一般情况下一个节点的表式通过聚合它 k 跳之内的邻近节点计算,而全图的表示则通过对所有节点的池化计算。 近年来新型 GNN 的设计主要基于经验直觉、启发式和实验试错法,而对神经网络的性质和局限性的理论较少。文中提出理论框架来分析 GNN 的能力,这里主要是评价模型是否能够区分网络结构。 文中使用了 WL-test 方法,即图同构测试,它是一个区分网络结构的强效方法,也是通过迭代聚合邻居的方法来 ...
论文阅读_BEVFormer
Created2022-05-28|2_Note0_Technic2_算法8_图形图像自动驾驶
介绍 英文题目:BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers 中文题目:BEVFormer: 通过时空 Transformers 从多摄像头图像学习鸟瞰图表示 论文地址:https://arxiv.org/pdf/2203.17270v1.pdf 领域:机器视觉,自动驾驶 发表时间:2022 年 3 月 作者:Zhiqi Li 等 出处:南京大学,上海人工智能实验室,香港大学 代码和数据:https://github.com/zhiqi-li/BEVFormer 阅读时间:2022.05.22 读后感 文中方法和特斯拉视频(特斯拉2021人工智能日AI Day完整视频)架构相似。比较有意思的地方是在BEV 层面结合了时间和空间信息。 介绍 在 3D 感知领域,雷达已取得了很好效果,机器视觉近几年也受到关注,除了成本低,相对雷达,它还能感知远距离物体,以及识别道路标识。 BEV 鸟瞰图从多个摄像头信息计算表征,用于描述周 ...
论文阅读_中文生物医学语言理解评价CBLUE
Created2022-05-15|2_Note0_Technic1_医学医学_技术论文
介绍 英文题目:CBLUE: A Chinese Biomedical Language Understanding Evaluation 中文题目:CBLUE:中文生物医学语言理解评价基准 论文地址:https://arxiv.org/pdf/2106.08087.pdf 领域:自然语言处理,知识图谱 发表时间:2021 年 作者:Ningyu Zhang,医渡云、平安医疗科技、阿里夸克、鹏城实验室、北京大学、哈尔滨工业大学 (深圳)、同济大学、郑州大学等共同协办 出处:ACL(自然语言处理顶级会议) 被引量:3 数据:https://tianchi.aliyun.com/dataset/dataDetail?dataId=95414 (需要提交申请) 代码:https://github.com/CBLUEbenchmark/CBLUE 阅读时间:2022.05.09 读后感 训练和评测数据非常全面,还可以在天池打榜。 介绍 之前生物医学方面数据以英文为主,本文收集了真实世界的生物医学数据,提出了第一个中文生物医学语言理解评估标准 CBLUE。其内容覆盖命名实体识别,知识抽取,诊断标 ...
1…414243…84
avatar
Yan.xie
顺流而下还是逆流而上?
Articles
834
Tags
257
Categories
173
Follow Me
Announcement
This is my Blog
Recent Post
优化阅读过程2025-07-14
对谈_250706_关系中的尊严2025-07-14
稳定币2025-07-14
MCP_实用场景讨论2025-07-14
国内外云主机价格对比2025-07-12
Categories
  • 0_IMO78
    • 工作1
    • 方法1
      • 工作1
    • 说给一个人听76
      • 01_自我建构29
        • 实修3
        • 思考与觉悟14
Tags
社会评价 认知建构 知识图/图神经网络 叙事心理学 效率 开源许可 机器学习/算法 自然语言处理/BERT android 阅读心理学 加密货币 跨境支付 舞台感 自我构建 社会文化 嵌入技术 心理调节 笔记工具 #后端 大型语言模型 Docker 机器学习/XGBoost 笔记 编程 多代理系统 语言模型 自我表达 公众号 机器学习/自动建模 稳定币 编程语言/前端 佛教 自我反思 远程桌面 网络服务 情绪表达 多模态 量化回测 编程语言/JNI 生物医学/重症
Archives
  • July 202528
  • June 202539
  • May 202530
  • April 202516
  • March 20259
  • February 20252
  • January 20256
  • December 20242
Info
Article :
834
Total Count :
1154.1k
UV :
PV :
Last Push :
©2020 - 2025 By Yan.xie
Framework Hexo|Theme Butterfly
京公网安备11010802043346号
京ICP备2023029600号-1
Search
Loading the Database