jensen不等式-石高峰经验网

2025-04-1618:15:03综合资讯0

机器之心专栏

近日，浙江大学、威斯康星大学麦迪逊分校等机构的最新工作PiCO取得了重大突破，相关论文已被ICLR 2022录用（Oral，Top 1.59%！）！

偏标签学习（Partial Label Learning，PLL）是一个经典的弱监督学习问题。当每个训练样本关联一个候选的标签集合时，该方法适用于许多具有标签不确定性的现实世界数据标注场景。现存的PLL算法与完全监督下的方法依然存在较大差距。

为了解决这一问题，本文提出一个协同的框架解决PLL中的两个关键研究挑战——表征学习和标签消歧。具体地，PiCO由一个对比学习模块和一个基于类原型的标签消歧算法组成。PiCO为来自同一类的样本生成紧密对齐的表示，同时促进标签消歧。

项目主页：/hbzju/pico

背景

深度学习的兴起依赖于大量的准确标注数据，但在许多场景下，数据标注本身存在较大的不确定性。例如，大部分非专业标注者都无法确定一只狗到底是阿拉斯加还是哈士奇。这种问题称为标签歧义（Label Ambiguity），源于样本本身的模糊性和标注者的知识不足，在更需要专业性的标注场景中十分普遍。

为了减少这类问题的标注成本，本文研究偏标签学习。在偏标签学习问题中，允许样本关联一个候选标签集合，其中包含了真实的标签。

在偏标签学习问题中，最重要的部分是标签消歧（Disambiguation），即从候选标签集合中识别得到真实的标签。为了解决偏标签学习问题，现有的工作通常假设样本具有良好的表征，然后基于平滑假设进行标签消歧。对表征的依赖可能导致表征-消歧困境：标注的不确定性会严重影响表征学习，而表征的质量又反向影响了标签消歧。

为了解决这一问题，研究者提出了一个协同的框架PiCO，引入了对比学习技术（Contrastive Learning，CL），来同时解决表示学习和标签消歧这两个高度相关的问题。

方法与贡献

方法：本论文率先探索了部分标签学习的对比学习，并提出了一个名为PiCO的新框架。作为算法的一个组成部分，研究者还引入了一种新的基于原型的标签消歧机制，有效利用了对比学习的embeddings。

实验：研究者提出的PiCO框架在多个数据集上取得了state-of-the-art（SOTA）的结果。研究者首次尝试在细粒度分类数据集上进行实验，与CUB-200数据集的最佳基线相比，分类性能提高了9.61%。

理论：在理论上，研究者证明了PiCO等价于以Expectation-Maximization（期望最大化）过程最大化似然。研究者的推导也可推广到其他对比学习方法，证明了CL中的对齐（Alignment）性质在数学上等于经典聚类算法中的M步。

框架详解

PiCO包含两个关键组件：表示学习组件和标签消歧组件。这两个组件系统性地作为一个整体运行并相互反哺。在Emperor’s New Clothes的理论角度，研究者也从EM算法的角度对PiCO进行了严格的理论解释。

分类损失与伪标签更新

给定数据集，每个元组包含一个候选标签集合。为了有效解决PLL问题，研究者为每个样本维护一个伪标签向量。在训练过程中，研究者会不断更新这个伪标签向量，而模型则会优化以下损失进行更新分类器。

对比表征学习

受到监督对比学习（SCL）的启发，研究者引入对比学习机制，为来自同一类的样本学习相近的表征。PiCO的基本结构和MoCo类似，均由Query网络和Key网络构成。研究者利用随机数据增强技术获得两个增广样本，分别称为Query View和Key View。它们会被分别输入两个网络获得一对归一化的embeddings。

基于原型的标签消歧

在学习过程中，研究者首先将S初始化为Uniform向量。接着实验室概览

欢迎来到浙江大学数据智能实验室，这里是由卓越的研究者博老师领导的M3 Group（该名字与宝马的那款跑车无关）。实验室受到计算机学院院长陈刚老师的鼎力支持，多次在VLDB、ICLR、ICML、ACL、KDD、WWW等顶级学术会议和期刊上发表高质量的研究成果，并荣获了众多级和省级的荣誉。博老师是浙江大学百人计划中的杰出研究员，担任博士生导师，并师从于享誉全球的学者Yann LeCun。其学术影响力广泛，被Google引用的次数超过一万，同时在知乎平台上拥有众多粉丝，是AI领域的连续创业者。

博老师的主页可访问/。

登录 找回密码

登录找回密码