Post

李宏毅-ML2022-HW11-Adaptation

李宏毅-ML2022-HW11-Adaptation

Task Description

本次作业的主题是Domain Adaptation,即领域自适应

假设你要执行与真实3D场景相关的任务,但是真实环境3D图像很难标记并且价格昂贵,而模拟图像(例如GTA-5上的模拟场景)易于标记。如果将模拟图像作为训练集,真实环境图像作为测试集,这样作会有什么问题?

模型会将真实环境图像识别为“异常”,因为训练数据和测试数据来自不同的domain。

如何解决这个问题哪?需要进行Domain Shift,我们旨在找到一个特征提取器,它接收输入数据并输出特征空间。这个特征提取器能够滤掉domain相关的信息,只保留不同domain之间共享的特征(详情参见课程录影)。

具体的任务是:给定真实图像(with labels)和涂鸦图像(without labels),使用Domain Adaptation技术预测手绘图像的label。

Dataset

  • Label: 10 classes (numbered from 0 to 9).
  • Training : 5000 (32, 32) RGB real images (with label).
  • Testing : 100000 (28, 28) gray scale drawing images.

Data Format

Unzip real_or_drawing.zip, the data format is as below:

  • real_or_drawing/
    • train_data/
      • 0/
        • 0.bmp, 1.bmp … 499.bmp
      • 1/
        • 500.bmp, 501.bmp … 999.bmp
      • … 9/
    • test_data/
      • 0/
        • 00000.bmp
        • 00001.bmp
        • … 99999.bmp

思路

Code

Report

Reference

This post is licensed under CC BY 4.0 by the author.