本篇文章2717字,读完约7分钟

昂贵,稀有,难以控制,具有破坏性,人生没有一帆风顺的。 人工智能的“一生”也会遇到难以“训练”的场景,也就是无法通过大量常规数据进行训练的场景。

就像拍电影一样,要拍《少年派的奇幻漂流》,老虎需要成为演员。 我该怎么办?买很多这种新奇的动物,让驯兽师教你演戏,到最后因为剧情需要而死,可以吗?

这一定不行。 于是李安让特长团队“制作”相似度99%的虚拟虎,解决了高价稀少、难以控制、破坏性的问题,以其为代表的作品虚拟场景构建技术也成为了过渡学习的一种做法。

日前,一家媒体转载了《日本经济信息》的报道,报道称日本在人工智能的“迁移学习”研究方面取得了进步。 东北大学将迁移学习应用于模仿语气的对话系统,松下将其应用于特定人群病情判断软件,视为加速人工智能应用落地的研究进展。

“迁移学习:教AI提取抽象知识”

ai学习为什么要迁移,如何迁移? 如何让ai变得更聪明呢? 1月3日,科技日报记者采访了北京语言大学教授荀恩东、智能企业cto莫瑜等领域的专家,听取了他们的解读。

一反三:用常规数据处理特殊问题

“有些模型的识别率已经超过了人的识别率。 ”荀东说,人们越来越擅长深入的神经网络训练,但高精度是在符合现实和训练情况的基础上,即实战和演习相一致的。

除了默认值以外,要达到预期的识别精度并不容易。 “机器有机器预设之外”荀东先生以声音识别为例,说太强的声调、太大的背景噪音等与人类“困难的场景”一致,但机器受远视噪音的影响,“如太大空广,

那是不是每次遇到特殊场景都要重新建模,输入大量样本让机器重新学习? 答案当然是否定的。

因为我们必须首先考虑价格因素,这就是文案开头提到的“昂贵和破坏性”的好处。 其次是“难以控制”的问题。 虽然我们可以不吝惜金钱重复建模和学习新样本,但是一些特殊场景的样本很少见,无法控制产生的价格,就无法满足组成训练集的要求。 例如《日本经济信息》报道的那样,罕见疾病的诊断分解例只有几十件,在这种情况下,如何使人工智能具有评价能力?

“迁移学习:教AI提取抽象知识”

“现实世界真的很混乱”,当ai从模特训练来到“尘世”的时候,它可能会有这样的感慨。 大量的新场景蜂拥而至,“生的门槛”无法使用。

虽然成功的模型目前仍严重依赖数据,但获得大量可用数据的情况因行业而异,分布非常不均匀。 资料显示,目前少数数据是公开的,拥有专利的数据也不少,或者购买后价格昂贵,剩下的行业数据无法获取或没有积累。 也就是说,ai的“训练题库”完全不能涵盖“考试题库”。

“迁移学习:教AI提取抽象知识”

为了处理新的任务,“迁移学习”已经成为人们对人工智能所追求的能力。 “用常规数据处理特殊问题,用易获取的数据处理数据难收集的问题”北京语言大学教授荀恩东说,可以扩大人工智能的实用范围。

莫瑜解释说:“就是给你倒三的能力。” 例如,为了使机器识别猫之后能够容易地识别狗,有必要构建识别猫的模型。 包含尾巴、腿、胡子等特征,在识别狗时被机器利用。

简言之,这意味着神经网络具有“概念性”的东西,也就是积累和提取抽象知识的能力,荀恩东说:“不局限于数据和产生结果那样的端到端输入输出。”

眼花缭乱:不同行业需要不同的战略

“数据级、特征级、模型级的拷贝都可以迁移,”荀东说,迁移学习不是固定的算法和具体的技术,而是处理问题的战略越来越多。

迁移学习之前被称为适应性学习。 的初衷是为了节省手动标记示例的时间,以便可以将模型从现有标签数据迁移到无标签数据。 “某个特定模型的标签数据是机器可以识别的,如果机器根据标签捕捉识别的优势,成功将模型转移到无标签数据上,这些数据就可以不用重新建模。 ”荀恩东说。

“迁移学习:教AI提取抽象知识”

迁移学习具体该怎么办?

“迁移学习是开发如何迁移的一套算法。 ”莫瑜解释说,如何利用少量的新数据将在一个行业中运行的算法应用于新行业。 例如,不需要改造,听懂普通话的ai开发后,可能有直接听懂粤语的算法。 “机器学习算法通常研究问题的处理方法,但迁移学习需要编写迁移算法,以实现从一个行业的问题处理程序到另一个类似行业的迁移。 ’据说在过去的20年里,科学家积累了数百种迁移学习的算法。

“迁移学习:教AI提取抽象知识”

随着研究的深入,迁移学习的战略也变多了,取得了不小的进展。 第四范式首席科学家杨强在一次演讲中介绍,将机器学习的目标问题“解散”,即分离问题的结构和副本,从而发现不同问题之间的共性。 根据《科学》杂志刊登的副本,在区分了手写字体识别上的结构和手写方法之后,结构学习可以通过一个数据进行训练。 另外,分层系统可以很容易地构建机器学习的过渡。 据解释,从分阶段培训的行业向新行业的多步骤导电性转移也是适用的战略。

“迁移学习:教AI提取抽象知识”

《过渡大法》的基本是在实现从a行业向b行业的过渡时,尽可能“平稳”地推进。 两个域的表现应尽可能相似,或通过一次操作提高两个域表现的相似性,建立“共同”的表现。 例如,imagenet消耗多年,用数千小时制作而成,“基于imagenet数据集的图像识别深度神经网络模型,多作为图像特征提取,应用于其他图像任务”。 莫瑜说。 “基于深度学习和迁移学习的知识花实践”这个文案进行了类似“百度经验”的分享。 这展示了一种基于imagenet数据集,将原本只能识别花的图像深度卷积到互联网上,从而过渡到识别花的种类、具体品种的新任务的方法。 通过“图像特征提取”、“训练集准备、验证集和测试集”、“训练互联网”等步骤,该“迁移”获得了88%的识别正确率,计算时间几乎为30分钟,与从零开始重新建模相比

“迁移学习:教AI提取抽象知识”

久弥新:或者成为机器学习商业的新驱动力

事实上,迁移学习并不是和人工智能一样的新概念,近年来,研究热正在恢复。 年,前百度首席科学家吴恩达表示,迁移学习将成为继督导学习之后下一次机器学习业务成功的动力。 杨强也认为,机器学习的明天在小数据、个性化、可靠性方面,有赖于迁移学习的快速发展。

“迁移学习:教AI提取抽象知识”

国际巨头也致力于迁移学习的实践,alphago的开发团队deepmind正在尝试机器人的迁移学习训练。 他们先从单臂开始。 在模拟环境中训练机械臂的移动,训练后将知识转移到实际的机械臂上。 实际的机器人手臂稍微训练一下,就会得到和模拟一样的效果。

“迁移学习:教AI提取抽象知识”

谷歌通过模拟系统训练无人驾驶汽车,并将其付诸实际驾驶。 教授硅谷公司课程的在线大学优达学城也提供了开源进行无人驾驶汽车工程纳米学位教育的模拟器,模拟容易获取不同类型的数据,容易多因素并行训练学习。

“我们的对话机器人也有同样的问题。 由一个顾客训练的对话系统不是从零开始,而是如何应用于新顾客? ”。 莫瑜说,迁移学习的应用范围很广。

荀恩东说:“迁移学习多处理实际问题,多复制ai应用水平。” “实践中也有各种各样的方法,我国在ai的应用场景开发上还是不落后于人”。 (记者张佳星)

来源:人民视窗网

标题:“迁移学习:教AI提取抽象知识”

地址:http://www.rm19.com/xbzx/42447.html