基于标签交互Seq2Seq模型的多标签文本分类方法
胡鹏 ,鄢艳玲,王佳帅 ,赵婷婷 ,杨巨成
天津科技大学,普迈康(天津)精准医疗科技有限公司
2024-08-22
多标签文本分类任务可被建模为文本序列到标签序列的映射任务。然而,现有的序列到序列(Seq2Seq)模型仅从嘈杂文本中提取粗粒度的文本级表示,忽略了标签与单词之间细粒度的交互线索, 导致类别理解偏差。对此,提出基于编码器—解码器结构的标签语义交互Seq2Seq模型。在文本语义提取 阶段,使用门控机制融合粗粒度的文本级表示和细粒度的交互线索,最终得到类别理解纠正的文本表示。 在2个标准数据集上,与LEAM,LSAN,SGM等6个算法进行对比实验,结果表明,本文模型在2个主要评价指标上均得到显著提升。
  • 标签交互
被引用: 712次
年份: 2024年
下载文档 2.00元
引用
分享
来源期刊
内容目录
  • 引言

  • 1、相关工作

    • 1.1 Seq2Seq模型

    • 1.2 文本表示学习

  • 2、标签语义交互Seq2Seq模型

    • 2.1 问题描述

    • 2.2 模型框架

    • 2.3 编码器

      • 2.3.1 BiLSTM

      • 2.3.2 交互编码块

      • 2.3.3 自适应门

    • 2.4 解码器

      • 2.4.1 注意力机制

      • 2.4.2 隐含层

      • 2.4.3 分类层

  • 3、实验与结果分析

    • 3.1 数据集

    • 3.2 实验设置

    • 3.3 评价指标

    • 3.4 对比方法

    • 3.5 实验结果

    • 3.6 消融实验

    • 3.7 不同融合策略

  • 4、结束语

核心点推荐
  • 多标签文本分类
  • 序列到序列
  • 自适应门
  • 多头注意力
  • 标签嵌入