main/cpp/TrainingSpec_8hpp_source.html

#pragma once


#include "models/strategies/pp/ProjectionPursuit.hpp"

#include "models/strategies/vars/VariableSelection.hpp"

#include "models/strategies/cutpoint/Cutpoint.hpp"

#include "models/strategies/stop/StopRule.hpp"

#include "models/strategies/binarize/Binarization.hpp"

#include "models/strategies/grouping/Grouping.hpp"

#include "models/strategies/leaf/LeafStrategy.hpp"


#include <algorithm>

#include <memory>

#include <thread>

#include <nlohmann/json.hpp>


namespace ppforest2 {


  class TrainingSpec {

  public:

    using Ptr = std::shared_ptr<TrainingSpec>;


    pp::ProjectionPursuit::Ptr const pp;

    vars::VariableSelection::Ptr const vars;

    cutpoint::Cutpoint::Ptr const cutpoint;

    stop::StopRule::Ptr const stop;

    binarize::Binarization::Ptr const binarization;

    grouping::Grouping::Ptr const grouping;

    leaf::LeafStrategy::Ptr const leaf;


    types::Mode const mode;


    int const size;

    int const seed;

    int const threads;

    int const max_retries;


    class Builder {

    public:


      struct Config {

        pp::ProjectionPursuit::Ptr pp            = nullptr;

        vars::VariableSelection::Ptr vars        = nullptr;

        cutpoint::Cutpoint::Ptr cutpoint         = nullptr;

        stop::StopRule::Ptr stop                 = nullptr;

        binarize::Binarization::Ptr binarization = nullptr;

        grouping::Grouping::Ptr grouping         = nullptr;

        leaf::LeafStrategy::Ptr leaf             = nullptr;


        int size        = 0;

        int seed        = 0;

        int threads     = 0;

        int max_retries = 3;

      };


      Config config;

      types::Mode const mode;


      explicit Builder(types::Mode mode)

          : mode(mode) {}


      Builder& pp(pp::ProjectionPursuit::Ptr v) {

        config.pp = std::move(v);

        return *this;

      }


      Builder& vars(vars::VariableSelection::Ptr v) {

        config.vars = std::move(v);

        return *this;

      }


      Builder& cutpoint(cutpoint::Cutpoint::Ptr v) {

        config.cutpoint = std::move(v);

        return *this;

      }


      Builder& stop(stop::StopRule::Ptr v) {

        config.stop = std::move(v);

        return *this;

      }


      Builder& binarization(binarize::Binarization::Ptr v) {

        config.binarization = std::move(v);

        return *this;

      }


      Builder& grouping(grouping::Grouping::Ptr v) {

        config.grouping = std::move(v);

        return *this;

      }


      Builder& leaf(leaf::LeafStrategy::Ptr v) {

        config.leaf = std::move(v);

        return *this;

      }


      Builder& size(int v) {

        config.size = v;

        return *this;

      }


      Builder& seed(int v) {

        config.seed = v;

        return *this;

      }


      Builder& threads(int v) {

        config.threads = v;

        return *this;

      }


      Builder& max_retries(int v) {

        config.max_retries = v;

        return *this;

      }


      Builder& apply_defaults();


      TrainingSpec build();


      Ptr make();

    };


    static Builder builder(types::Mode mode) { return Builder{mode}; }


    TrainingSpec(

        pp::ProjectionPursuit::Ptr pp,

        vars::VariableSelection::Ptr vars,

        cutpoint::Cutpoint::Ptr cutpoint,

        stop::StopRule::Ptr stop,

        binarize::Binarization::Ptr binarization,

        grouping::Grouping::Ptr grouping,

        leaf::LeafStrategy::Ptr leaf,

        types::Mode mode,

        int size,

        int seed,

        int threads,

        int max_retries

    );


    // -- Forwarding methods (delegate to the underlying strategy) -----------


    void find_projection(NodeContext& ctx, stats::RNG& rng) const;


    void select_vars(NodeContext& ctx, stats::RNG& rng) const;


    void find_cutpoint(NodeContext& ctx, stats::RNG& rng) const;


    bool should_stop(NodeContext const& ctx, stats::RNG& rng) const;


    void regroup(NodeContext& ctx, stats::RNG& rng) const;


    void group(NodeContext& ctx, stats::RNG& rng) const;


    stats::GroupPartition init_groups(types::OutcomeVector const& y) const { return grouping->init(y); }


    TreeNode::Ptr create_leaf(NodeContext const& ctx, stats::RNG& rng) const { return leaf->create_leaf(ctx, rng); }


    bool is_forest() const { return size > 0; }


    nlohmann::json to_json() const;


    static Ptr from_json(nlohmann::json const& j);


    template<typename... Args> static Ptr make(Args&&... args) {

      return std::make_shared<TrainingSpec>(std::forward<Args>(args)...);

    }


    int resolve_threads() const {

      // hardware_concurrency() may return 0 when it cannot be determined;

      // passing a non-positive count to omp_set_num_threads is undefined.

      return threads > 0 ? threads : std::max(1, static_cast<int>(std::thread::hardware_concurrency()));

    }


  };


  inline bool is_classification(TrainingSpec const& spec) {

    return types::is_classification(spec.mode);

  }


  inline bool is_regression(TrainingSpec const& spec) {

    return types::is_regression(spec.mode);

  }


  inline bool is_classification(TrainingSpec::Ptr const& spec) {

    return spec != nullptr && is_classification(*spec);

  }


  inline bool is_regression(TrainingSpec::Ptr const& spec) {

    return spec != nullptr && is_regression(*spec);

  }


}

Binarization.hpp

Cutpoint.hpp

Grouping.hpp

LeafStrategy.hpp

ProjectionPursuit.hpp

StopRule.hpp

VariableSelection.hpp

Strategy< ProjectionPursuit >::Ptr
std::shared_ptr< ProjectionPursuit > Ptr
Definition Strategy.hpp:95

ppforest2::TrainingSpec::Builder
Fluent builder for TrainingSpec.
Definition TrainingSpec.hpp:103

ppforest2::TrainingSpec::Builder::leaf
Builder & leaf(leaf::LeafStrategy::Ptr v)
Definition TrainingSpec.hpp:157

ppforest2::TrainingSpec::Builder::seed
Builder & seed(int v)
Definition TrainingSpec.hpp:166

ppforest2::TrainingSpec::Builder::cutpoint
Builder & cutpoint(cutpoint::Cutpoint::Ptr v)
Definition TrainingSpec.hpp:141

ppforest2::TrainingSpec::Builder::threads
Builder & threads(int v)
Definition TrainingSpec.hpp:170

ppforest2::TrainingSpec::Builder::binarization
Builder & binarization(binarize::Binarization::Ptr v)
Definition TrainingSpec.hpp:149

ppforest2::TrainingSpec::Builder::max_retries
Builder & max_retries(int v)
Definition TrainingSpec.hpp:174

ppforest2::TrainingSpec::Builder::size
Builder & size(int v)
Definition TrainingSpec.hpp:162

ppforest2::TrainingSpec::Builder::make
Ptr make()
Shorthand for std::make_shared<TrainingSpec>(build()).

ppforest2::TrainingSpec::Builder::Builder
Builder(types::Mode mode)
Definition TrainingSpec.hpp:130

ppforest2::TrainingSpec::Builder::mode
types::Mode const mode
Definition TrainingSpec.hpp:128

ppforest2::TrainingSpec::Builder::pp
Builder & pp(pp::ProjectionPursuit::Ptr v)
Definition TrainingSpec.hpp:133

ppforest2::TrainingSpec::Builder::build
TrainingSpec build()
Finalize the builder into a TrainingSpec.

ppforest2::TrainingSpec::Builder::vars
Builder & vars(vars::VariableSelection::Ptr v)
Definition TrainingSpec.hpp:137

ppforest2::TrainingSpec::Builder::apply_defaults
Builder & apply_defaults()
Fill in any null strategy fields with mode-aware defaults.

ppforest2::TrainingSpec::Builder::config
Config config
Definition TrainingSpec.hpp:127

ppforest2::TrainingSpec::Builder::stop
Builder & stop(stop::StopRule::Ptr v)
Definition TrainingSpec.hpp:145

ppforest2::TrainingSpec::Builder::grouping
Builder & grouping(grouping::Grouping::Ptr v)
Definition TrainingSpec.hpp:153

ppforest2::TrainingSpec
Training configuration for projection pursuit trees and forests.
Definition TrainingSpec.hpp:44

ppforest2::TrainingSpec::create_leaf
TreeNode::Ptr create_leaf(NodeContext const &ctx, stats::RNG &rng) const
Create a leaf node from the current node context.
Definition TrainingSpec.hpp:296

ppforest2::TrainingSpec::grouping
grouping::Grouping::Ptr const grouping
Grouping strategy.
Definition TrainingSpec.hpp:59

ppforest2::TrainingSpec::builder
static Builder builder(types::Mode mode)
Create a builder for the given mode.
Definition TrainingSpec.hpp:228

ppforest2::TrainingSpec::make
static Ptr make(Args &&... args)
Create a shared pointer to a TrainingSpec.
Definition TrainingSpec.hpp:308

ppforest2::TrainingSpec::TrainingSpec
TrainingSpec(pp::ProjectionPursuit::Ptr pp, vars::VariableSelection::Ptr vars, cutpoint::Cutpoint::Ptr cutpoint, stop::StopRule::Ptr stop, binarize::Binarization::Ptr binarization, grouping::Grouping::Ptr grouping, leaf::LeafStrategy::Ptr leaf, types::Mode mode, int size, int seed, int threads, int max_retries)
Construct a training specification.

ppforest2::TrainingSpec::group
void group(NodeContext &ctx, stats::RNG &rng) const
Split observations into two child partitions.

ppforest2::TrainingSpec::binarization
binarize::Binarization::Ptr const binarization
Binarization strategy.
Definition TrainingSpec.hpp:57

ppforest2::TrainingSpec::leaf
leaf::LeafStrategy::Ptr const leaf
Leaf creation strategy.
Definition TrainingSpec.hpp:61

ppforest2::TrainingSpec::pp
pp::ProjectionPursuit::Ptr const pp
Projection pursuit optimization strategy.
Definition TrainingSpec.hpp:49

ppforest2::TrainingSpec::resolve_threads
int resolve_threads() const
Get the number of threads to use for training.
Definition TrainingSpec.hpp:320

ppforest2::TrainingSpec::find_projection
void find_projection(NodeContext &ctx, stats::RNG &rng) const
Run projection pursuit optimization. Asserts postcondition: ctx.projector and ctx....

ppforest2::TrainingSpec::to_json
nlohmann::json to_json() const
Serialize the training spec to JSON.

ppforest2::TrainingSpec::find_cutpoint
void find_cutpoint(NodeContext &ctx, stats::RNG &rng) const
Compute the split cutpoint. Asserts postcondition: ctx.cutpoint is set.

ppforest2::TrainingSpec::is_forest
bool is_forest() const
Whether this specification describes a forest (size > 0).
Definition TrainingSpec.hpp:299

ppforest2::TrainingSpec::cutpoint
cutpoint::Cutpoint::Ptr const cutpoint
Split cutpoint strategy.
Definition TrainingSpec.hpp:53

ppforest2::TrainingSpec::stop
stop::StopRule::Ptr const stop
Stop rule strategy.
Definition TrainingSpec.hpp:55

ppforest2::TrainingSpec::should_stop
bool should_stop(NodeContext const &ctx, stats::RNG &rng) const
Check whether the node should stop growing.

ppforest2::TrainingSpec::vars
vars::VariableSelection::Ptr const vars
Variable selection strategy.
Definition TrainingSpec.hpp:51

ppforest2::TrainingSpec::max_retries
int const max_retries
Maximum retry attempts for degenerate trees.
Definition TrainingSpec.hpp:73

ppforest2::TrainingSpec::size
int const size
Number of trees (0 = single tree).
Definition TrainingSpec.hpp:67

ppforest2::TrainingSpec::regroup
void regroup(NodeContext &ctx, stats::RNG &rng) const
Reduce multiclass partition to binary. Asserts postcondition: ctx.y_bin is set.

ppforest2::TrainingSpec::seed
int const seed
RNG seed.
Definition TrainingSpec.hpp:69

ppforest2::TrainingSpec::select_vars
void select_vars(NodeContext &ctx, stats::RNG &rng) const
Run variable selection. Asserts postcondition: ctx.var_selection is set.

ppforest2::TrainingSpec::from_json
static Ptr from_json(nlohmann::json const &j)
Deserialize a training spec from JSON.

ppforest2::TrainingSpec::mode
types::Mode const mode
Training mode (classification or regression).
Definition TrainingSpec.hpp:64

ppforest2::TrainingSpec::threads
int const threads
Number of threads for parallel forest training.
Definition TrainingSpec.hpp:71

ppforest2::TrainingSpec::init_groups
stats::GroupPartition init_groups(types::OutcomeVector const &y) const
Create the initial group partition from the training response.
Definition TrainingSpec.hpp:293

ppforest2::TrainingSpec::Ptr
std::shared_ptr< TrainingSpec > Ptr
Definition TrainingSpec.hpp:46

ppforest2::TreeNode::Ptr
std::unique_ptr< TreeNode > Ptr
Definition TreeNode.hpp:21

ppforest2::stats::GroupPartition
Contiguous-block representation of grouped observations.
Definition GroupPartition.hpp:40

ppforest2::stats::RNG
pcg32 RNG
Definition Stats.hpp:24

ppforest2::types::is_classification
bool is_classification(Mode mode)
Whether mode is Classification.
Definition Types.hpp:71

ppforest2::types::OutcomeVector
Eigen::Matrix< Outcome, Eigen::Dynamic, 1 > OutcomeVector
Dynamic-size column vector of predictions.
Definition Types.hpp:52

ppforest2::types::is_regression
bool is_regression(Mode mode)
Whether mode is Regression.
Definition Types.hpp:76

ppforest2::types::Mode
Mode
Training mode.
Definition Types.hpp:68

ppforest2
Binarization strategies for multiclass-to-binary reduction.
Definition Benchmark.hpp:25

ppforest2::is_classification
bool is_classification(Model const &model)
Whether model was trained for classification.
Definition Model.hpp:145

ppforest2::is_regression
bool is_regression(Model const &model)
Whether model was trained for regression.
Definition Model.hpp:155

ppforest2::NodeContext
Mutable context accumulating intermediate results during node training.
Definition NodeContext.hpp:20

ppforest2::TrainingSpec::Builder::Config
Builder state — the configuration being assembled.
Definition TrainingSpec.hpp:112

ppforest2::TrainingSpec::Builder::Config::leaf
leaf::LeafStrategy::Ptr leaf
Definition TrainingSpec.hpp:119

ppforest2::TrainingSpec::Builder::Config::max_retries
int max_retries
Definition TrainingSpec.hpp:124

ppforest2::TrainingSpec::Builder::Config::size
int size
Definition TrainingSpec.hpp:121

ppforest2::TrainingSpec::Builder::Config::cutpoint
cutpoint::Cutpoint::Ptr cutpoint
Definition TrainingSpec.hpp:115

ppforest2::TrainingSpec::Builder::Config::seed
int seed
Definition TrainingSpec.hpp:122

ppforest2::TrainingSpec::Builder::Config::grouping
grouping::Grouping::Ptr grouping
Definition TrainingSpec.hpp:118

ppforest2::TrainingSpec::Builder::Config::threads
int threads
Definition TrainingSpec.hpp:123

ppforest2::TrainingSpec::Builder::Config::vars
vars::VariableSelection::Ptr vars
Definition TrainingSpec.hpp:114

ppforest2::TrainingSpec::Builder::Config::pp
pp::ProjectionPursuit::Ptr pp
Definition TrainingSpec.hpp:113

ppforest2::TrainingSpec::Builder::Config::stop
stop::StopRule::Ptr stop
Definition TrainingSpec.hpp:116

ppforest2::TrainingSpec::Builder::Config::binarization
binarize::Binarization::Ptr binarization
Definition TrainingSpec.hpp:117