~sgould/darwin/drwnLinearRegressor_8h_source.html

 /******************************************************************************

 ** DARWIN: A FRAMEWORK FOR MACHINE LEARNING RESEARCH AND DEVELOPMENT

 ** Distributed under the terms of the BSD license (see the LICENSE file)

 ** Copyright (c) 2007-2015, Stephen Gould

 ** All rights reserved.

 **

 ******************************************************************************

 ** FILENAME:    drwnLinearRegressor.h

 ** AUTHOR(S):   Stephen Gould <stephen.gould@anu.edu.au>

 **

 *****************************************************************************/


 #pragma once


 #include <cstdlib>

 #include <vector>


 #include "drwnBase.h"

 #include "drwnFeatureMaps.h"

 #include "drwnRegression.h"

 #include "drwnOptimizer.h"


 using namespace std;


 // drwnLinearRegressorBase --------------------------------------------------


 class drwnLinearRegressorBase : public drwnRegression, protected drwnOptimizer {

  public:

     static double HUBER_BETA;

     static double REG_STRENGTH;

     static int MAX_ITERATIONS;


  protected:

     VectorXd _theta;

     int _penalty;

     double _beta;

     int _regularizer;

     double _lambda;


     // cached data for parameter estimation

     // \todo change to drwnDataset when ownership flag is implemented

     const vector<vector<double> > *_features;

     const vector<double> *_targets;

     const vector<double> *_weights;


  public:

     drwnLinearRegressorBase();

     drwnLinearRegressorBase(unsigned n);

     drwnLinearRegressorBase(const drwnLinearRegressorBase &r);

     ~drwnLinearRegressorBase();


     // access functions

     virtual const char *type() const { return "drwnLinearRegressor"; }


     // i/o

     virtual bool save(drwnXMLNode& xml) const;

     virtual bool load(drwnXMLNode& xml);


     // training

     using drwnRegression::train;

     virtual double train(const drwnRegressionDataset& dataset);


     // evaluation (regression)

     virtual double getRegression(const vector<double>& features) const = 0;


  protected:

     // drwnOptimizer interface

     double objective(const double *x) const;

     void gradient(const double *x, double *df) const;

     virtual double objectiveAndGradient(const double *x, double *df) const = 0;

 };


 // drwnTLinearRegressor -----------------------------------------------------


 template<class FeatureMap = drwnBiasFeatureMap>

 class drwnTLinearRegressor : public drwnLinearRegressorBase {

  public:

     drwnTLinearRegressor() : drwnLinearRegressorBase() { /* do nothing */ }

     drwnTLinearRegressor(unsigned n) :

         drwnLinearRegressorBase(n) { initialize(n); }

     drwnTLinearRegressor(const drwnTLinearRegressor<FeatureMap> &c) :

        drwnLinearRegressorBase(c) { /* do nothing */ }


     ~drwnTLinearRegressor() { /* do nothing */ }


     // access

     virtual drwnTLinearRegressor<FeatureMap> *clone() const {

         return new drwnTLinearRegressor<FeatureMap>(*this);

     }


     // initialization

     virtual void initialize(unsigned n);


     // evaluation (regression)

     virtual double getRegression(const vector<double>& features) const;


  protected:

     virtual double objectiveAndGradient(const double *x, double *df) const;

 };


 // drwnLinearRegressor ------------------------------------------------------


 typedef drwnTLinearRegressor<> drwnLinearRegressor;


 // drwnTLinearRegressor implementation --------------------------------------


 template<class FeatureMap>

 void drwnTLinearRegressor<FeatureMap>::initialize(unsigned n)

 {

     drwnRegression::initialize(n);

     const FeatureMap phi(_nFeatures);

     _theta = VectorXd::Zero(phi.numParameters());

 }


 template<class FeatureMap>

 double drwnTLinearRegressor<FeatureMap>::getRegression(const vector<double>& features) const

 {

     DRWN_ASSERT(features.size() == (unsigned)_nFeatures);


     vector<double> t(_theta.rows());

     Eigen::Map<VectorXd>(&t[0], t.size()) = _theta;


     const FeatureMap phi(_nFeatures);

     return phi.dot(t, features);

 }


 template<class FeatureMap>

 double drwnTLinearRegressor<FeatureMap>::objectiveAndGradient(const double *x, double *df) const

 {

     // compute gradient and objective

     double obj = 0.0;


     const unsigned m = _targets->size();

     const FeatureMap phi(_nFeatures);

     const vector<double> vx(x, x + _n);

     vector<double> vdf(_n, 0.0);


     if (_penalty == 0) {

         // L2 penalty

         for (unsigned i = 0; i < m; i++) {

             double predicted = phi.dot(vx, (*_features)[i]);

             double dist =  predicted - (*_targets)[i];

             double wdist = (_weights == NULL) ? dist : dist * (*_weights)[i];

             obj += dist * wdist;

             phi.mac(vdf, (*_features)[i], wdist);

         }


         obj *= 0.5;

     } else {

         // huber penalty

         double dh;

         for (unsigned i = 0; i < m; i++) {

             double predicted = phi.dot(vx, (*_features)[i]);

             double u = predicted - (*_targets)[i];

             if (_weights == NULL) {

                 obj += drwn::huberFunctionAndDerivative(u, &dh, _beta);

             } else {

                 obj += (*_weights)[i] * drwn::huberFunctionAndDerivative(u, &dh, _beta);

                 dh *= (*_weights)[i];

             }

             phi.mac(vdf, (*_features)[i], dh);

         }

     }


     memcpy((void *)df, (void *)&vdf[0], _n * sizeof(double));

     if (m == 0.0) return 0.0;


     obj /= (double)m;

     Eigen::Map<VectorXd>(df, _n) /= (double)m;


     // regularization

     switch (_regularizer) {

     case 0: // sum-of-squares

         {

             double weightNorm = 0.0;

             for (unsigned i = 0; i < _n; i++) {

                 weightNorm += x[i] * x[i];

                 df[i] += _lambda * x[i];

             }


             obj += 0.5 * _lambda * weightNorm;

         }

         break;


     case 1: // huber

         {

             double dh;

             for (unsigned i = 0; i < _n; i++) {

                 obj += _lambda * drwn::huberFunctionAndDerivative(x[i], &dh, 1.0e-3);

                 df[i] += _lambda * dh;

             }

         }

         break;


     default:

         DRWN_LOG_ERROR("unsupported regularizer " << _regularizer);

     }


     return obj;

 }

drwnRegression::train
virtual double train(const drwnRegressionDataset &dataset)=0
estimate the regression parameters a drwnRegressionDataset

drwnLinearRegressorBase::_penalty
int _penalty
regression penalty option
Definition: drwnLinearRegressor.h:38

drwnRegression
Implements the interface for a generic machine learning regression, e.g. see drwnLinearRegressor.
Definition: drwnRegression.h:27

drwnLinearRegressorBase::_beta
double _beta
huber penalty threshold
Definition: drwnLinearRegressor.h:39

drwnLinearRegressorBase
Common functionality for drwnLinearRegressor.
Definition: drwnLinearRegressor.h:30

drwnLinearRegressorBase::MAX_ITERATIONS
static int MAX_ITERATIONS
maximum training iterations
Definition: drwnLinearRegressor.h:34

drwnTLinearRegressor::drwnTLinearRegressor
drwnTLinearRegressor(const drwnTLinearRegressor< FeatureMap > &c)
copy constructor
Definition: drwnLinearRegressor.h:116

drwnTLinearRegressor::drwnTLinearRegressor
drwnTLinearRegressor(unsigned n)
construct a linear regressor for data of dimension n
Definition: drwnLinearRegressor.h:113

drwnRegression::initialize
virtual void initialize(unsigned n)
initialize the regressor to accept data of dimensionality n
Definition: drwnRegression.cpp:47

drwnLinearRegressorBase::HUBER_BETA
static double HUBER_BETA
beta parameter for huber penalty
Definition: drwnLinearRegressor.h:32

drwnTLinearRegressor::objectiveAndGradient
virtual double objectiveAndGradient(const double *x, double *df) const
returns value of objective function and populates gradient df at point x
Definition: drwnLinearRegressor.h:167

drwnTLinearRegressor::clone
virtual drwnTLinearRegressor< FeatureMap > * clone() const
returns a copy of the class usually implemented as virtual Foo* clone() { return new Foo(*this); } ...
Definition: drwnLinearRegressor.h:122

drwnLinearRegressorBase::_theta
VectorXd _theta
regression weights
Definition: drwnLinearRegressor.h:37

drwnTLinearRegressor::getRegression
virtual double getRegression(const vector< double > &features) const
return the estimated value for a given feature vector
Definition: drwnLinearRegressor.h:154

drwnLinearRegressorBase::REG_STRENGTH
static double REG_STRENGTH
regularization strength
Definition: drwnLinearRegressor.h:33

drwnOptimizer
Interface for solving large-scale unconstrained optimization problems using L-BFGS.
Definition: drwnOptimizer.h:68

drwnLinearRegressorBase::_regularizer
int _regularizer
regularization option
Definition: drwnLinearRegressor.h:40

drwnTLinearRegressor::initialize
virtual void initialize(unsigned n)
initialize the regressor to accept data of dimensionality n
Definition: drwnLinearRegressor.h:146

drwnDataset
Implements a cacheable dataset containing feature vectors, labels and optional weights.
Definition: drwnDataset.h:43

drwnTLinearRegressor::drwnTLinearRegressor
drwnTLinearRegressor()
default constructor
Definition: drwnLinearRegressor.h:111

drwnLinearRegressorBase::type
virtual const char * type() const
returns object type as a string (e.g., Foo::type() { return "Foo"; })
Definition: drwnLinearRegressor.h:59

drwnLinearRegressorBase::_lambda
double _lambda
regularization strength
Definition: drwnLinearRegressor.h:41

drwnTLinearRegressor
Implements linear regression optimization templated on a drwnFeatureMap.
Definition: drwnLinearRegressor.h:108

drwnLinearRegressor
drwnTLinearRegressor drwnLinearRegressor
Conveinience type declaration for linear regression with default feature mapping. ...
Definition: drwnLinearRegressor.h:141