Может ли Caffe напрямую классифицировать пиксели изображения?

Я хотел бы классифицировать пиксели изображения как «это улица» или «не улица». У меня есть некоторые данные тренировок изНабор данных KITTI и я видел, что у Кафе естьIMAGE_DATA тип слоя. Ярлыки представлены в виде изображений того же размера, что и входное изображение.

Помимо Caffe, моей первой идеей для решения этой проблемы было предоставление участков изображения вокруг пикселя, которые должны быть классифицированы (например, 20 пикселей сверху / слева / справа / снизу, что приводит к 41 × 41 = 1681 элементам на пиксель, которые я хочу классифицировать ,
Однако, если бы я мог рассказать caffe, как использовать метки, не создавая эти патчи изображения вручную (и тип слояIMAGE_DATA кажется, предположить, что это возможно) Я бы предпочел это.

Может ли Caffe напрямую классифицировать пиксели изображения? Как будет выглядеть такое определение сети с прототекстом? Как я могу дать Caffe информацию о ярлыках?

Я думаю, что входной слой будет что-то вроде

layers {
  name: "data"
  type: IMAGE_DATA
  top: "data"
  top: "label"
  image_data_param {
    source: "path/to/file_list.txt"
    mean_file: "path/to/imagenet_mean.binaryproto"
    batch_size: 4
    crop_size: 41
    mirror: false
    new_height: 256
    new_width: 256
  }
}

Однако я не уверен, чтоcrop_size точно значит. Это действительно по центру? Как кофе справляется с угловыми пикселями? Что такоеnew_height а такжеnew_width хорош для?

Ответы на вопрос(1)

Ваш ответ на вопрос