Я использую CNN для идентификации изображений в наборе данных CiFar10, и до добавления исключения точность cnn достигала 58%, но после его добавления она упала до 52%. Может быть, сеть не переоснащается? потому что я сомневаюсь, что это так. После добавления еще двух отказов точность выросла до 55%, но я все еще не понимаю, почему она вообще упала. Вот мой код:
class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.conv1 = nn.Conv2d(3, 12, 3, padding=1)
self.pool = nn.MaxPool2d(2, 2)
self.conv2 = nn.Conv2d(12, 24, 3, padding=1)
self.conv3 = nn.Conv2d(24, 48, 3, padding=1)
self.conv4 = nn.Conv2d(48, 48, 3, padding=1)
self.dropout1 = nn.Dropout(p=0.2)
self.dropout2 = nn.Dropout(p=0.2)
self.dropout3 = nn.Dropout(p=0.3)
self.fc1 = nn.Linear(48 * 2 * 2, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)
def forward(self, x):
x = self.pool(self.dropout1(F.relu(self.conv1(x))))
x = self.pool(self.dropout2(F.relu(self.conv2(x))))
x = self.pool(self.dropout3(F.relu(self.conv3(x))))
x = self.pool(F.relu(self.conv4(x)))
x = x.view(-1, 48 * 2 * 2)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x
Вам также нужно быть осторожным при сравнении прогонов, если вы тренируетесь и инициализируете с нуля. Инициализация случайного веса может иногда приводить к наблюдаемым вами вариациям, особенно если другие гиперпараметры (например, скорость обучения, размер пакета и т. Д.) Еще не оптимизированы. Даже в этом случае тасование пакетов может вызвать отклонения. Вы должны установить случайное начальное число и / или сохранить параметры веса при отладке всего этого.