Может ли Caffe напрямую классифицировать пиксели изображения?
Я хотел бы классифицировать пиксели изображения как «это улица» или «не улица». У меня есть некоторые данные тренировок изНабор данных KITTI и я видел, что у Кафе естьIMAGE_DATA
тип слоя. Ярлыки представлены в виде изображений того же размера, что и входное изображение.
Помимо Caffe, моей первой идеей для решения этой проблемы было предоставление участков изображения вокруг пикселя, которые должны быть классифицированы (например, 20 пикселей сверху / слева / справа / снизу, что приводит к 41 × 41 = 1681 элементам на пиксель, которые я хочу классифицировать ,
Однако, если бы я мог рассказать caffe, как использовать метки, не создавая эти патчи изображения вручную (и тип слояIMAGE_DATA
кажется, предположить, что это возможно) Я бы предпочел это.
Может ли Caffe напрямую классифицировать пиксели изображения? Как будет выглядеть такое определение сети с прототекстом? Как я могу дать Caffe информацию о ярлыках?
Я думаю, что входной слой будет что-то вроде
layers {
name: "data"
type: IMAGE_DATA
top: "data"
top: "label"
image_data_param {
source: "path/to/file_list.txt"
mean_file: "path/to/imagenet_mean.binaryproto"
batch_size: 4
crop_size: 41
mirror: false
new_height: 256
new_width: 256
}
}
Однако я не уверен, чтоcrop_size
точно значит. Это действительно по центру? Как кофе справляется с угловыми пикселями? Что такоеnew_height
а такжеnew_width
хорош для?