Suchergebnisse für Anfrage "gradient-descent"

4 die antwort

Gradientenabstieg und normale Gleichungsmethode zum Lösen der linearen Regression ergeben unterschiedliche Lösungen

1 die antwort

Multi variabler Gefälle-Abstieg im Matlab

4 die antwort

Warum sollten Gewichte neuronaler Netze mit Zufallszahlen initialisiert werden?

TOP-Veröffentlichungen

3 die antwort

Ist meine Implementierung des stochastischen Gradientenabfalls korrekt?

Ich versuche, einen stochastischen Gradientenabstieg zu entwickeln, aber ich weiß nicht, ob er zu 100% korrekt ist. Die Kosten, die durch meinen Algorithmus für den stochastischen Gradientenabstieg entstehen, sind manchmal sehr weit von denen ...

1 die antwort

Sklearn SGDClassifier teilweise fit

Ich versuche, SGD zu verwenden, um einen großen Datensatz zu klassifizieren. Da die Daten zu groß sind, um in den Speicher zu passen, möchte ich die verwendenTeil_Fit Methode zum Trainieren des Klassifikators. Ich habe eine Stichprobe des ...

4 die antwort

Was ist `lr_policy` in Caffe?

Ich versuche nur herauszufinden, wie ich @ verwenden ka Caffe [http://caffe.berkeleyvision.org/]. Dazu habe ich mir einfach die verschiedenen.prototxt Dateien im Beispielordner. Es gibt eine Option, die ich nicht verstehe: # The learning rate ...

2 die antwort

Spark mllib sagt seltsame Zahl oder NaN voraus

Ich bin neu in Apache Spark und versuche, mithilfe der maschinellen Lernbibliothek einige Daten vorherzusagen. Mein Datensatz im Moment ist nur etwa 350 Punkte. Hier sind 7 dieser Punkte: "365","4",41401.387,5330569 ...

4 die antwort

Was ist der Meta-Parameter "weight_decay" in Caffe?

Ein Beispiel anschauen'solver.prototxt' [https://github.com/BVLC/caffe/blob/tutorial/examples/cifar10/cifar10_full_solver.prototxt#L15] , gepostet auf BVLC / caffe git, es gibt einen Trainings-Meta-Parameter weight_decay: 0.04Was bedeutet ...

8 die antwort

äufige Ursachen von Nans während des Trainin

Ich habe bemerkt, dass ein häufiges Auftreten während des TrainingsNANs wird vorgestellt. ft scheint es, als würden Gewichte in das Innere des Produkts / vollständig verbundene Schichten oder Faltungsschichten gespreng Tritt dies auf, weil ...

4 die antwort

Kostenfunktion in der logistischen Regression ergibt NaN als Ergebnis

Ich implementiere eine logistische Regression mit Batch-Gradientenabstieg. Es gibt zwei Klassen, in die die Eingangsstichproben eingeteilt werden sollen. Die Klassen sind 1 und 0. Während ich die Daten trainiere, benutze ich die ...