/** * @file minibatch_discrimination_impl.hpp * @author Saksham Bansal * * Implementation of the MiniBatchDiscrimination layer class. * * mlpack is free software; you may redistribute it and/or modify it under the * terms of the 3-clause BSD license. You should have received a copy of the * 3-clause BSD license along with mlpack. If not, see * http://www.opensource.org/licenses/BSD-3-Clause for more information. */ #ifndef MLPACK_METHODS_ANN_LAYER_MINIBATCH_DISCRIMINATION_IMPL_HPP #define MLPACK_METHODS_ANN_LAYER_MINIBATCH_DISCRIMINATION_IMPL_HPP // In case it hasn't yet been included. #include "minibatch_discrimination.hpp" namespace mlpack { namespace ann /** Artificial Neural Network. */ { template MiniBatchDiscrimination::MiniBatchDiscrimination() : A(0), B(0), C(0), batchSize(0) { // Nothing to do here. } template MiniBatchDiscrimination::MiniBatchDiscrimination( const size_t inSize, const size_t outSize, const size_t features) : A(inSize), B(outSize - inSize), C(features), batchSize(0) { weights.set_size(A * B * C, 1); } template void MiniBatchDiscrimination::Reset() { weight = arma::mat(weights.memptr(), B * C, A, false, false); } template template void MiniBatchDiscrimination::Forward( const arma::Mat& input, arma::Mat& output) { batchSize = input.n_cols; tempM = weight * input; M = arma::cube(tempM.memptr(), B, C, batchSize, false, false); distances.set_size(B, batchSize, batchSize); output.set_size(B, batchSize); for (size_t i = 0; i < M.n_slices; i++) { output.col(i).ones(); for (size_t j = 0; j < M.n_slices; j++) { if (j < i) { output.col(i) += distances.slice(j).col(i); } else if (i == j) { continue; } else { distances.slice(i).col(j) = arma::exp(-arma::sum(abs(M.slice(i) - M.slice(j)), 1)); output.col(i) += distances.slice(i).col(j); } } } output = join_cols(input, output); // (A + B) x batchSize } template template void MiniBatchDiscrimination::Backward( const arma::Mat& /* input */, const arma::Mat& gy, arma::Mat& g) { g = gy.head_rows(A); arma::Mat gM = gy.tail_rows(B); deltaM.zeros(B, C, batchSize); for (size_t i = 0; i < M.n_slices; i++) { for (size_t j = 0; j < M.n_slices; j++) { if (i == j) { continue; } arma::mat t = arma::sign(M.slice(i) - M.slice(j)); t.each_col() %= distances.slice(std::min(i, j)).col(std::max(i, j)) % gM.col(i); deltaM.slice(i) -= t; deltaM.slice(j) += t; } } deltaTemp = arma::mat(deltaM.memptr(), B * C, batchSize, false, false); g += weight.t() * deltaTemp; } template template void MiniBatchDiscrimination::Gradient( const arma::Mat& input, const arma::Mat& /* error */, arma::Mat& gradient) { gradient = arma::vectorise(deltaTemp * input.t()); } template template void MiniBatchDiscrimination::serialize( Archive& ar, const unsigned int /* version */) { ar & BOOST_SERIALIZATION_NVP(A); ar & BOOST_SERIALIZATION_NVP(B); ar & BOOST_SERIALIZATION_NVP(C); // This is inefficient, but we have to allocate this memory so that // WeightSetVisitor gets the right size. if (Archive::is_loading::value) { weights.set_size(A * B * C, 1); } } } // namespace ann } // namespace mlpack #endif