当前位置:首页 > 医疗电子 > 医疗电子技术文库
[导读] (文章来源:人人都是产品经理) 人工智能正处于非常火热的时期,自然语言处理(NLP)领域也令人兴奋了十年。在阅读理解、语言翻译和创意写作等复杂的任务上,计算机的表现将会和人类一样出色。语

(文章来源:人人都是产品经理)

人工智能正处于非常火热的时期,自然语言处理(NLP)领域也令人兴奋了十年。在阅读理解、语言翻译和创意写作等复杂的任务上,计算机的表现将会和人类一样出色。语言理解能力受益于免费的深度学习库(如Pytext和BERT这样的语言模型),大数据(Hadoop,Spark,Spark NLP),以及云计算(提供GPU和与服务商的NLP服务功能)。

目前市面上做自然语言处理领域的公司有:腾讯、科大讯飞、微软、思必驰、华为等。在医疗领域,一些应用已经从科幻小说变为现实。人工智能系统通过了中国和英国的医学执照考试 ,而且它们比普通医生考得更好。最新的系统比初级医生能更好地诊断出55种儿科疾病。但是,这些系统比第一批计算机视觉深度学习应用中的一些更难构建,因为它们需要具有更广泛常见的医学知识,要处理更多种类的输入,并且必须理解上下文。

自然语言处理由自然语言理解(NLU)和自然语言生成(NLG)构成。NLG是计算机的“编写语言”,它将结构化数据转换为文本,以人类语言表达。即能够根据一些关键信息及其在机器内部的表达形式,经过一个规划过程,来自动生成一段高质量的自然语言文本。如今的数据量巨大,人们根本处理不过来;NLG把数据人性化,帮助人们处理。

NLG系统使用数据分析和人工智能技术来分析复杂的数据集,并采用计算语言学技术在高品质的文字说明来交流分析结果。NLG的工作原理:输入抽象的命题,然后对你输入的自然语言进行语义分析、语法分析进行语言组织然后生成无限接近你想要的文本。例子:输入麦当娜,接下来通过NLG自然语言生成:麦当娜 “歌星”

NLG可以用来帮助患者,让他们了解自己的健康状况,并对自身的医疗保健作出更好的选择;NLG还可以帮助患者更好地照顾自己:包括改变生活方式、自我管理慢性疾病、并配合治疗方案。

最重要的是用NLG来加强病人对病情的了解和支持病人,更好的作出治疗方案。在系统构建的实践中,为中文构建的现成的NLP库和算法在医疗行业的这种“不同的语言”上会遇到各种挫败。不仅是因为命名实体识别或实体解析模型会失败,甚至像符号化、词性标注和句子分割这样的基本任务,现成的模型对大多数医疗行业的句子都没用。

再者医疗行业有数百种语言,千万不要去建立通用的医疗NLP系统。现实是,每个子专业和它的沟通形式都和别专业根本不同,你根本无法做到统一通用。而且,每个医学专业都有很多变化。例如,对于决定是否批准针对MRI的预授权请求,针对植入式脊髓刺激器,需要从预授权表格中查看的项目内容就和别的请求完全不同。另一个例子是在病理学中使用不同的术语来讨论不同类型的癌症。

这些对实际问题会带来影响:我所工作的公司正在进行一个项目,该项目需要训练不同的NLP模型,以从病理报告中提取有关肺癌、乳腺癌和结肠癌的事实。到目前为止,亚马逊的Comprehend Medical仅关注药物价值的正规化(参见上面最后一个“阿司匹林”的例子)。该服务还具有标准的医疗命名实体识别功能,但不能满足任何特定应用的需求。

构建一个AI系统有一种方法是从构建标注验证数据集。例如,如果你对自动化门诊病例成ICD-10编码感兴趣,请让临床医生定义一些代表性样本,对样本进行脱敏,并让专业的临床编码人员对其进行标注(分配正确的代码)。如果你有兴趣从放射学报告中提取关键事件或从患者病例中找出被忽视的安全事件,请首先让临床医生定义一些样本,并正确标注。

这样做通常会在让数据科学团队加入(并浪费很多时间)前提前发现一些“坑”。如果你无法获得足够的数据,或者无法大规模地进行脱敏,那就无法构建可靠的模型。如果在某些情况下临床医生不能一致同意正确的标注,那么要解决的第一个问题是就临床指南达成一致,而不是让数据科学家参与尝试去自动化这种不一致。

最后,如果你发现自己面临非常不平衡的类别(比如你寻找的是每年只有少数人患病的情况),那么在引入数据科学家之前修改问题的定义可能是明智之举。标注的验证集以及数据集其目标是使用标准库或云服务来发现它们能达到的满足用户特定需求的最高准确度。这样做就可以评估下面每项服务的难易程度,包括:训练自定义的模型、定义领域专有的特征、解决方案所需的pipeline步骤和把结果解释给客户。

一旦有了一个有代表性的和已商定并正确标注的验证集,你就可以开始用它来测试现有的库和云服务提供商的服务了。很可能的是,这个测试将立即发现每个产品与你的需求之间的差距。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

北京——2024年4月30日 亚马逊云科技持续引领云上数据服务创新,助力企业构建全面的数据基座以充分发挥数据潜力,加速生成式AI技术落地。在生成式AI时代,数据是企业脱颖而出的关键——基础模型依赖于大规模高质量数据集,生...

关键字: 生成式AI 数据 模型

上海2024年4月16日 /美通社/ -- 4月14日,为期四天的第89届中国国际医疗器械博览会(CMEF)盛大收官。澳鹏Appen很荣幸再次作为唯一的人工智能训练数据参展商参与此次"航母级"规模医疗...

关键字: APP 医疗器械 PEN 模型

福州2024年4月16日 /美通社/ -- 4月15日,第61届中国高等教育博览会(以下简称“高博会”)于福州隆重开幕。索贝以“视听新体验•数智向未来,让知识传递更加精准高效”为主题,携全新升级的智慧教育资源管理平台、课...

关键字: 模型 数字化 AI算法 质量评估

在这篇文章中,小编将对机器学习的相关内容和情况加以介绍以帮助大家增进对它的了解程度,和小编一起来阅读以下内容吧。

关键字: 机器学习 语音识别 自然语言处理

未知语音经过话筒变换成电信号后加在识别系统的输入端,首先经过预处理,再根据人的语音特点建立语音模型,对输入的语音信号进行分析。

关键字: 语音识别 语音 模型

通过大量的数据,训练出一个能处理此类数据的模型,使得这个模型可以根据已知的数据,准确率很高的判断出未知的数据,从而使得人类能够采取正确的方法去处理某些事情。

关键字: 机器学习 模型 图像

作为全球领先的显示屏生产商,三星和LG最近越来越紧张,因为中国电视-手机屏幕攻城略地,韩国OLED技术优势不断缩小。为求生存,2021年三星关闭中国LCD工厂,转而向竞争对手LG采购屏幕。

关键字: OLED屏幕 三星 LG

AI技术可以为教育领域提供个性化的学习资源和学习路径。通过自然语言处理和机器学习算法,AI可以分析学生的学习习惯、需求和兴趣,为他们提供定制化的学习内容和建议。同时,AI还可以帮助教师进行教学辅助、课程推荐和学生管理等方...

关键字: AI技术 自然语言处理 机器学习

全球正面临着严峻的人口老龄化问题,伴随而来的是与老龄化密切相关的神经退行性疾病,如帕金森病,以及各种脑损伤(包括脑出血、脑梗塞、脑外伤等)。随着老龄化程度的增加,老年人跌倒的风险逐渐升高,从而导致脑外伤发病率的增加。这些...

关键字: 脑机接口 智慧医疗 脑卒中 上海傲意信息 芯原股份

康复医疗,作为现代四大医学之一,不仅改善患者预后、提高医疗机构运营效率,还涵盖全生命周期和多种疾病,包括老龄、慢性病、残疾、重疾、儿童康复等多个治疗领域。这一领域对比疾病治疗中心的临床医学,更侧重于疗愈功能障碍,通过改善...

关键字: 智慧医疗 康复机器人 芯原股份
关闭
关闭