首页 > 技术知识 > 正文

使用多标签分类数据训练 AI 的方法-使用多标签分类数据训练 ai 的方法有哪些

该图显示了每次输入数据分布时如何学习新信息,同时保留过去学到的信息

物联网 (IoT) 技术的进步使我们能够轻松、持续地获取大量不同的数据。人工智能技术作为利用这些大数据的工具而受到关注。

传统的机器学习主要处理单标签分类问题,其中数据与相应的现象或对象(标签信息)处于一对一的关系中。但是,在现实世界中,数据和标签信息很少具有一对一的关系。

因此,近年来,人们的注意力集中在多标签分类问题上,该问题处理的数据与标签信息之间存在一对多关系。例如,一张风景照片可能包含天空、山脉和云等元素的多个标签。此外,为了有效地从不断获得的大数据中学习,还需要在不破坏以前学到的东西的情况下随着时间的推移学习的能力。

由大阪都立大学研究生院信息学研究科的增山直树副教授和野岛雄介教授领导的研究小组开发了一种新方法,该方法将具有多个标签的数据分类性能与持续学习数据的能力相结合。在真实世界多标签数据集上的数值实验表明,所提方法优于传统方法。

这种新算法的简单性使得设计可以与其他算法集成的进化版本变得容易。由于底层聚类方法根据数据条目之间的相似性对数据进行分组,因此有望成为持续大数据预处理的有用工具。

此外,分配给每个集群的标签信息是使用基于贝叶斯方法的方法不断学习的。通过分别连续学习数据和学习数据对应的标签信息,既实现了较高的分类性能,又实现了持续的学习能力。

“我们相信我们的方法能够从多标签数据中不断学习,并具有未来大数据社会中人工智能所需的能力,”Masuyama教授总结道。

猜你喜欢