mlpack-git/doxygen/training__config_8hpp_source.html

 #ifndef MLPACK_METHODS_RL_TRAINING_CONFIG_HPP
 #define MLPACK_METHODS_RL_TRAINING_CONFIG_HPP

 namespace mlpack {
 namespace rl {

 class TrainingConfig
 {
  public:
   TrainingConfig() :
       numWorkers(1),
       updateInterval(1),
       stepLimit(0),
       explorationSteps(1),
       gradientLimit(40),
       doubleQLearning(false)
   { /* Nothing to do here. */ }

   TrainingConfig(
       size_t numWorkers,
       size_t updateInterval,
       size_t targetNetworkSyncInterval,
       size_t stepLimit,
       size_t explorationSteps,
       double stepSize,
       double discount,
       double gradientLimit,
       bool doubleQLearning) :
       numWorkers(numWorkers),
       updateInterval(updateInterval),
       targetNetworkSyncInterval(targetNetworkSyncInterval),
       stepLimit(stepLimit),
       explorationSteps(explorationSteps),
       stepSize(stepSize),
       discount(discount),
       gradientLimit(gradientLimit),
       doubleQLearning(doubleQLearning)
   { /* Nothing to do here. */ }

   size_t NumWorkers() const { return numWorkers; }
   size_t& NumWorkers() { return numWorkers; }

   size_t UpdateInterval() const { return updateInterval; }
   size_t& UpdateInterval() { return updateInterval; }

   size_t TargetNetworkSyncInterval() const
   { return targetNetworkSyncInterval; }
   size_t& TargetNetworkSyncInterval() { return targetNetworkSyncInterval; }

   size_t StepLimit() const { return stepLimit; }
   size_t& StepLimit() { return stepLimit; }

   size_t ExplorationSteps() const { return explorationSteps; }
   size_t& ExplorationSteps() { return explorationSteps; }

   double StepSize() const { return stepSize; }
   double& StepSize() { return stepSize; }

   double Discount() const { return discount; }
   double& Discount() { return discount; }

   double GradientLimit() const { return gradientLimit; }
   double& GradientLimit() { return gradientLimit; }

   bool DoubleQLearning() const { return doubleQLearning; }
   bool& DoubleQLearning() { return doubleQLearning; }

  private:
   size_t numWorkers;

   size_t updateInterval;

   size_t targetNetworkSyncInterval;

   size_t stepLimit;

   size_t explorationSteps;

   double stepSize;

   double discount;

   double gradientLimit;

   bool doubleQLearning;
 };

 } // namespace rl
 } // namespace mlpack

 #endif
mlpack::rl::TrainingConfig::Discount
double & Discount()
Modify the discount rate for future reward.
Definition: training_config.hpp:89

mlpack::rl::TrainingConfig::ExplorationSteps
size_t ExplorationSteps() const
Get the exploration steps.
Definition: training_config.hpp:77

mlpack
strip_type.hpp
Definition: add_to_po.hpp:21

mlpack::rl::TrainingConfig::NumWorkers
size_t NumWorkers() const
Get the amount of workers.
Definition: training_config.hpp:53

mlpack::rl::TrainingConfig::TrainingConfig
TrainingConfig(size_t numWorkers, size_t updateInterval, size_t targetNetworkSyncInterval, size_t stepLimit, size_t explorationSteps, double stepSize, double discount, double gradientLimit, bool doubleQLearning)
Definition: training_config.hpp:31

mlpack::rl::TrainingConfig::StepLimit
size_t StepLimit() const
Get the maximum steps of each episode.
Definition: training_config.hpp:69

mlpack::rl::TrainingConfig::TargetNetworkSyncInterval
size_t TargetNetworkSyncInterval() const
Get the interval for syncing target network.
Definition: training_config.hpp:63

mlpack::rl::TrainingConfig::StepLimit
size_t & StepLimit()
Modify the maximum steps of each episode.
Definition: training_config.hpp:74

mlpack::rl::TrainingConfig::TargetNetworkSyncInterval
size_t & TargetNetworkSyncInterval()
Modify the interval for syncing target network.
Definition: training_config.hpp:66

mlpack::rl::TrainingConfig
Definition: training_config.hpp:19

mlpack::rl::TrainingConfig::UpdateInterval
size_t UpdateInterval() const
Get the update interval.
Definition: training_config.hpp:58

mlpack::rl::TrainingConfig::Discount
double Discount() const
Get the discount rate for future reward.
Definition: training_config.hpp:87

mlpack::rl::TrainingConfig::NumWorkers
size_t & NumWorkers()
Modify the amount of workers.
Definition: training_config.hpp:55

mlpack::rl::TrainingConfig::DoubleQLearning
bool DoubleQLearning() const
Get the indicator of double q-learning.
Definition: training_config.hpp:97

mlpack::rl::TrainingConfig::TrainingConfig
TrainingConfig()
Definition: training_config.hpp:22

mlpack::rl::TrainingConfig::ExplorationSteps
size_t & ExplorationSteps()
Modify the exploration steps.
Definition: training_config.hpp:79

mlpack::rl::TrainingConfig::DoubleQLearning
bool & DoubleQLearning()
Modify the indicator of double q-learning.
Definition: training_config.hpp:99

mlpack::rl::TrainingConfig::GradientLimit
double GradientLimit() const
Get the limit of update gradient.
Definition: training_config.hpp:92

mlpack::rl::TrainingConfig::UpdateInterval
size_t & UpdateInterval()
Modify the update interval.
Definition: training_config.hpp:60

mlpack::rl::TrainingConfig::GradientLimit
double & GradientLimit()
Modify the limit of update gradient.
Definition: training_config.hpp:94

mlpack::rl::TrainingConfig::StepSize
double StepSize() const
Get the step size of the optimizer.
Definition: training_config.hpp:82

mlpack::rl::TrainingConfig::StepSize
double & StepSize()
Modify the step size of the optimizer.
Definition: training_config.hpp:84