¿Cómo puedo trabajar con mi propio conjunto de datos en scikit-learn (para visión de computadora)?

¿Cómo puedo trabajar con mi propio conjunto de datos en scikit-learn? Scikit Tutorial siempre toma como ejemplo para cargar su conjunto de datos (conjunto de datos de dígitos, conjunto de datos de flores ...)

http://scikit-learn.org/stable/datasets/index.html es decir: desde sklearn.datasets import load_iris

Tengo mis imágenes y no tengo idea de cómo crear una nueva.

Particularmente, para comenzar, uso este ejemplo que encontré (uso biblioteca opencv):

img =cv2.imread('telamone.jpg')

# Convert them to grayscale
imgg =cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# SURF extraction
surf = cv2.SURF()
kp, descritors = surf.detect(imgg,None,useProvidedKeypoints = False)

# Setting up samples and responses for kNN
samples = np.array(descritors)
responses = np.arange(len(kp),dtype = np.float32)

Me gustaría extraer las características de un conjunto de imágenes, de una manera útil para implementar un algoritmo de aprendizaje automático.

Respuestas a la pregunta(1)

Su respuesta a la pregunta