Так что я пытаюсь обучить OR-gate с в основном Perceptron. Проблема в том, что она не работает. Неправильное - 0 0 -> желательно = 0, фактическое = 1. И это не меняется.ANN Perceptron OR-Gate тренировки не работает правильно
Кроме того, когда я помещаю весы, которые я тестировал, они, похоже, тоже не работают, но это может быть что-то неправильное в моей функции testOut.
public class Temp {
double[][] data = {{0.d, 0.d}, {0.d, 1.d}, {1.d, 0.d}, {1.d, 1.d}};
double[] outputs = {0.d, 1.d, 1.d, 1.d};
double[][] weights = {
{ThreadLocalRandom.current().nextDouble(-.5, .5),
ThreadLocalRandom.current().nextDouble(-.5, .5)},
{ThreadLocalRandom.current().nextDouble(-.5, .5),
ThreadLocalRandom.current().nextDouble(-.5, .5)},
{ThreadLocalRandom.current().nextDouble(-.5, .5),
ThreadLocalRandom.current().nextDouble(-.5, .5)},
{ThreadLocalRandom.current().nextDouble(-.5, .5),
ThreadLocalRandom.current().nextDouble(-.5, .5)}
};
public double[][] train(int maxEpoch, double threshhold) {
for (int i = 0; i < maxEpoch; i++) {
System.out.println("EPOCH " + i);
double sum = 0.0d;
double actualOutput = 0.0d;
double[] ep = new double[outputs.length];
for (int j = 0; j < data.length; j++) {
for (int k = 0; k < data[j].length; k++) {
sum += data[j][k] * weights[j][k];
}
actualOutput = step(sum - threshhold);
ep[j] = outputs[j] - actualOutput;
for (int k = 0; k < data[j].length; k++) {
weights[j][k] = weights[j][k] + .1 * data[j][k] * ep[j];
}
System.out.println("output " + j + " " + actualOutput + " " + outputs[j] +" - " + ep[j]);
}
}
return weights;
}
public void testOut(double[][] data, double[][] weights, double threshhold){
double sum = 0;
double[] actualOutput = new double[data.length];
for (int j = 0; j < data.length; j++) {
for (int k = 0; k < data[j].length; k++) {
sum += data[j][k] * weights[j][k];
}
actualOutput[j] = step(sum - threshhold);
}
System.out.println(Arrays.toString(actualOutput));
}
public static void main(String[] args) {
Temp t = new Temp();
double[][] weights = t.train(200, 0);
t.testOut(t.data, weights, .5);
}
}
Любая помощь оценена.
Редактирование: шаг (сумма - порог) - это функция шага.
public static int step(double x) {
return x >= 0.d ? 1 : 0;
}
Можете ли вы также указать определение методов()? –
public static int step (double x) { \t \t return x> = 0.d? 1: 0; \t} –
O/p - это что-то вроде: EPOCH 0 ..........., EPOCH 1 ........, ---- EPOCH 199. Тогда где ru возникает проблема? ? Что именно ты хочешь? –