@Jatentaki Чтобы уточнить, я имел в виду разницу между двумя случаями в записной книжке IPython. Один, где я загружаю значения как тип 'float32' (приводит к значениям Черный 0 - Белый 255), делит значения на стандартное и среднее значения набора данных (33 и 78), а другой, где я загружаю значения как тип ' uint8 '(приводит к значениям Black 0 - White 1) и разделите значения на стандартное и среднее значения в этом представлении (0,13 и 0,30).

Question

Dec 06, 2018, 01:58 PM

@Jatentaki Чтобы уточнить, я имел в виду разницу между двумя случаями в записной книжке IPython. Один, где я загружаю значения как тип 'float32' (приводит к значениям Черный 0 - Белый 255), делит значения на стандартное и среднее значения набора данных (33 и 78), а другой, где я загружаю значения как тип ' uint8 '(приводит к значениям Black 0 - White 1) и разделите значения на стандартное и среднее значения в этом представлении (0,13 и 0,30).

ного новичок в этой области и поэтому решил работать над набором данных MNIST. Я в значительной степени адаптировал весь кодhttps://github.com/pytorch/examples/blob/master/mnist/main.pyтолько с одним значительным изменением: загрузка данных. Я не хотел использовать предварительно загруженный набор данных в Torchvision. Так что я использовалMNIST в CSV.

Я загрузил данные из CSV-файла, унаследовав его от Dataset и сделав новый загрузчик данных. Вот соответствующий код:

mean = 33.318421449829934
sd = 78.56749081851163
# mean = 0.1307
# sd = 0.3081
import numpy as np
from torch.utils.data import Dataset, DataLoader

class dataset(Dataset):
    def __init__(self, csv, transform=None):
        data = pd.read_csv(csv, header=None)
        self.X = np.array(data.iloc[:, 1:]).reshape(-1, 28, 28, 1).astype('float32')
        self.Y = np.array(data.iloc[:, 0])

        del data
        self.transform = transform

    def __len__(self):
        return len(self.X)

    def __getitem__(self, idx):
        item = self.X[idx]
        label = self.Y[idx]

        if self.transform:
            item = self.transform(item)

        return (item, label)

import torchvision.transforms as transforms
trainData = dataset('mnist_train.csv', transform=transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((mean,), (sd,))
]))
testData = dataset('mnist_test.csv', transform=transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((mean,), (sd,))
]))

train_loader = DataLoader(dataset=trainData,
                         batch_size=10, 
                         shuffle=True,
                         )
test_loader = DataLoader(dataset=testData, 
                        batch_size=10, 
                        shuffle=True,
                        )

Однако этот код дает мне абсолютно странный график ошибок обучения, который вы видите на рисунке, и окончательную ошибку проверки в 11%, поскольку он классифицирует все как «7».

Мне удалось отследить проблему до того, как я нормализую данные, и если я использую значения, приведенные в примере кода (0.1307 и 0.3081) для преобразований. Нормализация, наряду с чтением данных как типа «uint8», работает отлично. Обратите внимание, что есть оченьминимальная разница в данных что предусмотрено в этих двух случаях. Нормализация на 0,1307 и 0,3081 для значений от 0 до 1 имеет тот же эффект, что и нормализация на 33,31 и 78,56 для значений от 0 до 255. Значения даже в основном одинаковы (черный пиксель соответствует -0,4241 в первом случае и -0,4242 В секунду).

Если вы хотите увидеть IPython Note, книгу, где эта проблема видна четко, пожалуйста, ознакомьтесь сhttps://colab.research.google.com/drive/1W1qx7IADpnn5e5w97IcxVvmZAaMK9vL3

Я не могу понять, что вызвало такую огромную разницу в поведении этих двух немного разных способов загрузки данных. Любая помощь будет высоко ценится.

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы