BioGPT:一种在大规模生物医学文献上预训练的语言模型

2023-02-04
关注

随着最近的技术突破,研究人员开始对可用的大量生物医学数据采用多种机器学习技术。在生物医学文献中使用文本挖掘和知识提取等技术已被证明对于开发新药物、临床治疗、病理学研究等至关重要。由于不断的科学进步,每天都会出版越来越多的生物医学出版物,因此需要不断地从这些材料中提取有意义的信息。这就是预训练语言模型发挥作用的地方。由于预训练语言模型在一般自然语言领域的卓越有效性,生物医学研究人员对其产生了浓厚兴趣。 

然而,这些模型直接用于生物医学领域时的性能还不够好。这些模型在各种判别性下游生物学任务中表现出色,但由于缺乏生成能力,它们的应用范围受到限制。为了解决这个问题,研究人员过去在生物医学文本上预先训练了他们的模型。通用语言领域中预训练语言模型的两个主要分支——GPT 和 BERT,以及它们的变体;BERT在生物医学领域受到的关注最多。BioBERT 和 PubMedBERT 是生物医学行业中最著名的两个预训练语言模型,与生物医学文本上的其他通用预训练模型相比,它们取得了卓越的性能。找有价值的信息,请记住Byteclicks.com

然而,目前的大多数研究都使用 BERT 模型,与生成任务相比,BERT 模型更适合于理解任务。虽然 GPT 模型已被证明擅长生成任务,但它们在生物医学领域的表现尚未得到充分审查。针对这一问题陈述,微软研究人员最近推出了 BioGPT,这是一种基于大量生物医学文献进行预训练的特定领域生成式 Transformer 语言模型。BioGPT 在 1500 万 PubMed 摘要的庞大语料库上进行了预训练,并建立在 Transformer 语言模型之上。研究人员使用六项生物 NLP 任务来评估语言模型,其中一些任务包括问答、文档分类和端到端关系提取。根据多项实验评估,BioGPT在大多数任务中显著优于替代基线模型。

对于预训练语言模型,高质量的数据集非常重要。研究人员使用来自 PubMed 的域内文本数据从头开始预训练他们的模型。GPT-2 模型,本质上是一个 Transformer 解码器,是 BioGPT 的基础。然而,研究人员没有使用 GPT-2 的词汇,而是专注于使用字节对编码在收集的域内语料库上学习词汇。BioGPT 模型的主要组成部分是多头注意力层,它在三个线性变换后产生查询 Q、密钥 K 和值 V。然后这些用于计算多头注意层的输出,随后将其发送到前馈层以创建 Transformer 块。

预训练模型后来经过微调以适应下游任务,如文本生成、问答和端到端关系提取。虽然所有这些活动的输入类型(即序列)保持不变,但输出格式各不相同。因此,在将预训练的 BioGPT 应用于这些任务时,研究人员仔细研究了提示和目标序列格式。BioGPT 在三项端到端关系提取任务和一项问答任务上实现了最先进的性能。此外,它在生物医学文本生成技能方面的文本生成任务优于 GPT-2。为了使 BioGPT 适应更多的下游活动,微软研究团队打算在未来使用更大规模的生物医学数据对其进行训练。BioGPT的基本实现可以在下面找到。

查看论文Github。

版权声明:除特殊说明外,本站所有文章均为 字节点击 原创内容,采用 BY-NC-SA 知识共享协议。原文链接:https://byteclicks.com/46191.html 转载时请以链接形式标明本文地址。转载本站内容不得用于任何商业目的。本站转载内容版权归原作者所有,文章内容仅代表作者独立观点,不代表字节点击立场。报道中出现的商标、图像版权及专利和其他版权所有的信息属于其合法持有人,只供传递信息之用,非商务用途。如有侵权,请联系 gavin@byteclicks.com。我们将协调给予处理。

您觉得本篇内容如何
评分

相关产品

Honeywell 霍尼韦尔智能工业 在线/便携烟气分析仪专用传感器 气体传感器

CO 传感器;SO2传感器;NO2 传感器;NO传感器;氧气传感器

微著科技 高性能传感器ASIC解决方案 MEMS传感器

微著科技是国内为数不多能够给传感器厂商提供定制高性能传感器解决方案的团队,目前已为国内众多院所及知名传感器公司提供了十余个传感器解决方案并已经实现量产。微著传感器ASIC方案的特点:成熟的仪表信号模块IP易于快速搭建;系统方案超低噪声;成熟的24ADC可同时实现模拟数字传感器方案设计;高效率及丰富的方案设计经验。

南方泰科 TGM 压力传感器

TGM是一款SOP8封装的压阻式MEMS压力传感器,其压力传感器芯片封装在 SOP8 塑封壳内。在传感器压力量程内,当用固定电压供电时,传感器产生毫伏输出电压,正比于输入压力。压力传感器芯片为绝压,可提供不同的压力量程的SOP8 压力传感器。

鑫精诚传感器 XJC-T001 压力传感器

◆传感器激光焊接密封,环境适应性较强 ◆球形联接件,始终保持模块的垂直称重状态 ◆支撑螺栓,防止设备倾覆且方便维护 ◆接地装置,保护传感器免受电源浪涌冲击 ◆过载保护装置,保护传感器免受冲击力

Huba Control 富巴 525系列 压力传感器

525系列压力传感器采用集公司20多年研发经验的陶瓷压力传感器芯片技术。该系列压力传感器可选压力范围大,电气连接形式多。最小量程为50mbar。大批量使用具有很好的性价比。

佰测传感 MS71 传感器

MS71差压传感器

Cubic 四方光电 PM3009BP 室外粉尘传感器

PM3009BP是一款专门针对餐饮油烟监测的油烟传感器,其采用旁流采样方式,自带除水雾装置,结合智能颗粒物识别算法,确保传感器能够快速准确的检测油烟浓度的变化,同时创新的镜头自清洁技术的应用,能够长效防护传感器油烟污染,大幅度延长传感器的使用寿命。

评论

您需要登录才可以回复|注册

提交评论

广告
提取码
复制提取码
点击跳转至百度网盘