J’ai lu beaucoup d’articles qui expliquent la nécessité d’un ensemble initial de textes classés comme «positifs» ou «négatifs» avant qu’un système d’parsing des sentiments ne fonctionne vraiment. Ma question est la suivante: quelqu’un a-t-il tenté de faire une vérification rudimentaire d’adjectifs «positifs» par rapport à des adjectifs «négatifs», en tenant compte de simples négateurs pour […]
J’ai un exemple de réseau neuronal à deux couches. La première couche prend deux arguments et a une sortie. Le second devrait prendre un argument comme résultat de la première couche et un argument supplémentaire. Cela devrait ressembler à ceci: x1 x2 x3 \ / / y1 / \ / y2 Donc, j’ai créé un […]
Je joue avec un ANN qui fait partie du cours Udacity DeepLearning. J’ai un devoir qui consiste à introduire la généralisation sur le réseau avec une couche ReLU cachée utilisant la perte L2. Je me demande comment l’introduire correctement pour que TOUS les poids soient pénalisés, pas seulement les poids de la couche de sortie. […]
J’ai essayé de comprendre les bases de Support Vector Machines, j’ai téléchargé et lu de nombreux articles en ligne. Mais je ne peux toujours pas le saisir. J’aimerais savoir s’il y en a beau tutoriel exemple de code pouvant être utilisé pour comprendre ou quelque chose que vous pouvez penser, et qui me permettra d’apprendre […]
Étant donné un dataset séparables linéairement, vaut-il nécessairement mieux utiliser un SVM à marge dure sur un SVM à marge souple?
J’essaie de comprendre les LSTM et comment les construire avec Keras. J’ai découvert qu’il y a principalement les 4 modes pour exécuter un RNN (les 4 bons sur la photo) Source d’image: Andrej Karpathy Maintenant, je me demande comment un extrait de code minimaliste pour chacun d’entre eux ressemblerait à Keras. Donc quelque chose comme […]
Je lis l’article ci-dessous et j’ai du mal à comprendre le concept de l’échantillonnage négatif. http://arxiv.org/pdf/1402.3722v1.pdf Quelqu’un peut-il aider s’il vous plaît?
J’ai remarqué qu’un événement fréquent lors de la formation est le NAN . Souvent, il semble être introduit par des poids dans les couches internes du produit / entièrement connectées ou de convolution. Est-ce que cela se produit parce que le calcul du gradient explose? Ou est-ce à cause de l’initialisation du poids (si oui, […]
Dans la plupart des modèles, il existe un paramètre d’ étapes indiquant le nombre d’étapes à exécuter sur les données . Mais pourtant, dans la plupart des cas, nous réalisons la fonction d’ajustement N époques . Quelle est la différence entre exécuter 1000 pas avec 1 époque et exécuter 100 pas avec 10 époques? Lequel […]
Est-ce que quelqu’un connaît les travaux académiques récents qui ont été réalisés sur la reconnaissance du logo en images? S’il vous plaît répondre que si vous êtes familier avec ce sujet spécifique (je peux rechercher Google pour “reconnaissance de logo” moi-même, merci beaucoup). Toute personne connaissant bien la vision par ordinateur et ayant travaillé sur […]