Wat is het verschil tussen convolutioneel neuraal netwerk (CNN) en recursief neuraal netwerk (ReNN)?


Antwoord 1:

Convolutionele neurale netwerken (CNN) en recursieve neurale netwerken zijn nogal verschillend.

Convolutional Layer is gewoon de convolutionele operator (sommigen noemen het filter) aangebracht over een 2D / 3D-laag.

operator wordt 'sliding dot-product' of 'cross-correlation' genoemd.

Dit is een leuke manier om te zien hoe deze filters werken

Lees deze pagina als u wilt weten hoe opvulling, passen en dilatatie werken.

Afgezien hiervan is er de maximale poollaag. Wiskundig verwijst de term "pooling" naar dimensionaliteitsreductie in de context van convolutionele neurale netwerken?

Recursive Neural Networks is een op boom gebaseerde architectuur. Omdat het meestal wordt gebruikt om de reeksen voor woorden te verwerken, kan het het beste worden begrepen in de context van tekstverwerking. Stel dat u de parse-bomen al voor uw zinnen hebt.

((de rat) (at (kaas)))

In het bovenstaande voorbeeld kan een eenvoudig Tree Long Short-term Memory (LSTM) woordvectoren nemen voor afzonderlijke woorden en deze combineren met behulp van gedeelde gewichten (gedeeld via het netwerk) om ouderknooppunten te genereren. Eventuele gecombineerde vector kan worden gebruikt om classificatie te doen.

Ik hoop dat dit helpt. Dit zijn technische vragen en ik vind het altijd moeilijk om het onder woorden te brengen.


Antwoord 2:

Een convolutionele netwerklaag (met kerngrootte 2) zou draaien

NN

ingangen in

N1N-1

uitgangen. Elke uitgang

ii

neemt input

ii

en

i+1i+1

van de invoerlagen.

Een recursief netwerk verandert de hele uitgang in een enkele uitgang, door de eerste twee ingangen te combineren, vervolgens die uitgang te combineren met de derde ingang, enzovoort totdat er een enkele uitgang over is.


Antwoord 3:

Een convolutionele netwerklaag (met kerngrootte 2) zou draaien

NN

ingangen in

N1N-1

uitgangen. Elke uitgang

ii

neemt input

ii

en

i+1i+1

van de invoerlagen.

Een recursief netwerk verandert de hele uitgang in een enkele uitgang, door de eerste twee ingangen te combineren, vervolgens die uitgang te combineren met de derde ingang, enzovoort totdat er een enkele uitgang over is.