/** * @file methods/ann/gan/wgan_impl.hpp * @author Shikhar Jaiswal * * mlpack is free software; you may redistribute it and/or modify it under the * terms of the 3-clause BSD license. You should have received a copy of the * 3-clause BSD license along with mlpack. If not, see * http://www.opensource.org/licenses/BSD-3-Clause for more information. */ #ifndef MLPACK_METHODS_ANN_GAN_WGAN_IMPL_HPP #define MLPACK_METHODS_ANN_GAN_WGAN_IMPL_HPP #include "gan.hpp" #include #include #include #include #include namespace mlpack { namespace ann /** Artifical Neural Network. */ { template< typename Model, typename InitializationRuleType, typename Noise, typename PolicyType > template typename std::enable_if::value, double>::type GAN::Evaluate( const arma::mat& /* parameters */, const size_t i, const size_t /* batchSize */) { if (parameter.is_empty()) { Reset(); } if (!deterministic) { deterministic = true; ResetDeterministic(); } currentInput = arma::mat(predictors.memptr() + (i * predictors.n_rows), predictors.n_rows, batchSize, false, false); currentTarget = arma::mat(responses.memptr() + i, 1, batchSize, false, false); discriminator.Forward(currentInput); double res = discriminator.outputLayer.Forward( boost::apply_visitor( outputParameterVisitor, discriminator.network.back()), currentTarget); noise.imbue( [&]() { return noiseFunction();} ); generator.Forward(noise); predictors.cols(numFunctions, numFunctions + batchSize - 1) = boost::apply_visitor(outputParameterVisitor, generator.network.back()); discriminator.Forward(predictors.cols(numFunctions, numFunctions + batchSize - 1)); responses.cols(numFunctions, numFunctions + batchSize - 1) = -arma::ones(1, batchSize); currentTarget = arma::mat(responses.memptr() + numFunctions, 1, batchSize, false, false); res += discriminator.outputLayer.Forward( boost::apply_visitor( outputParameterVisitor, discriminator.network.back()), currentTarget); return res; } template< typename Model, typename InitializationRuleType, typename Noise, typename PolicyType > template typename std::enable_if::value, double>::type GAN:: EvaluateWithGradient(const arma::mat& /* parameters */, const size_t i, GradType& gradient, const size_t /* batchSize */) { if (parameter.is_empty()) { Reset(); } if (gradient.is_empty()) { if (parameter.is_empty()) Reset(); gradient = arma::zeros(parameter.n_elem, 1); } else gradient.zeros(); if (this->deterministic) { this->deterministic = false; ResetDeterministic(); } if (noiseGradientDiscriminator.is_empty()) { noiseGradientDiscriminator = arma::zeros( gradientDiscriminator.n_elem, 1); } else { noiseGradientDiscriminator.zeros(); } gradientGenerator = arma::mat(gradient.memptr(), generator.Parameters().n_elem, 1, false, false); gradientDiscriminator = arma::mat(gradient.memptr() + gradientGenerator.n_elem, discriminator.Parameters().n_elem, 1, false, false); // Get the gradients of the Discriminator. double res = discriminator.EvaluateWithGradient(discriminator.parameter, i, gradientDiscriminator, batchSize); noise.imbue( [&]() { return noiseFunction();} ); generator.Forward(noise); predictors.cols(numFunctions, numFunctions + batchSize - 1) = boost::apply_visitor(outputParameterVisitor, generator.network.back()); responses.cols(numFunctions, numFunctions + batchSize - 1) = -arma::ones(1, batchSize); // Get the gradients of the Generator. res += discriminator.EvaluateWithGradient(discriminator.parameter, numFunctions, noiseGradientDiscriminator, batchSize); gradientDiscriminator += noiseGradientDiscriminator; gradientDiscriminator = arma::clamp(gradientDiscriminator, -clippingParameter, clippingParameter); if (currentBatch % generatorUpdateStep == 0 && preTrainSize == 0) { // Minimize -D(G(noise)). // Pass the error from Discriminator to Generator. responses.cols(numFunctions, numFunctions + batchSize - 1) = arma::ones(1, batchSize); discriminator.outputLayer.Backward( boost::apply_visitor(outputParameterVisitor, discriminator.network.back()), discriminator.responses.cols( numFunctions, numFunctions + batchSize - 1), discriminator.error); discriminator.Backward(); generator.error = boost::apply_visitor(deltaVisitor, discriminator.network[1]); generator.Predictors() = noise; generator.Backward(); generator.ResetGradients(gradientGenerator); generator.Gradient(generator.Predictors().cols(0, batchSize - 1)); gradientGenerator *= multiplier; } currentBatch++; if (preTrainSize > 0) { preTrainSize--; } return res; } template< typename Model, typename InitializationRuleType, typename Noise, typename PolicyType > template typename std::enable_if::value, void>::type GAN:: Gradient(const arma::mat& parameters, const size_t i, arma::mat& gradient, const size_t batchSize) { this->EvaluateWithGradient(parameters, i, gradient, batchSize); } } // namespace ann } // namespace mlpack # endif