~sgould/darwin/drwnMultiClassLogistic_8h_source.html

 /******************************************************************************

 ** DARWIN: A FRAMEWORK FOR MACHINE LEARNING RESEARCH AND DEVELOPMENT

 ** Distributed under the terms of the BSD license (see the LICENSE file)

 ** Copyright (c) 2007-2015, Stephen Gould

 ** All rights reserved.

 **

 ******************************************************************************

 ** FILENAME:    drwnMultiClassLogistic.h

 ** AUTHOR(S):   Stephen Gould <stephen.gould@anu.edu.au>

 **

 *****************************************************************************/


 #pragma once


 #include <cstdlib>

 #include <vector>


 #include "drwnBase.h"

 #include "drwnFeatureMaps.h"

 #include "drwnClassifier.h"

 #include "drwnOptimizer.h"


 using namespace std;


 // drwnMultiClassLogisticBase -----------------------------------------------


 class drwnMultiClassLogisticBase : public drwnClassifier, protected drwnOptimizer {

  public:

     static double REG_STRENGTH;

     static int MAX_ITERATIONS;


  protected:

     VectorXd _theta;

     int _regularizer;

     double _lambda;


     // cached data for parameter estimation

     // TODO: change to drwnDataset when ownership flag is implemented

     const vector<vector<double> > *_features;

     const vector<int> *_targets;

     const vector<double> *_weights;


  public:

     drwnMultiClassLogisticBase();

     drwnMultiClassLogisticBase(unsigned n, unsigned k = 2);

     drwnMultiClassLogisticBase(const drwnMultiClassLogisticBase &c);

     ~drwnMultiClassLogisticBase();


     // access functions

     virtual const char *type() const { return "drwnMultiClassLogistic"; }


     // i/o

     virtual bool save(drwnXMLNode& xml) const;

     virtual bool load(drwnXMLNode& xml);


     // training

     using drwnClassifier::train;

     virtual double train(const drwnClassifierDataset& dataset);

     virtual double train(const vector<vector<double> >& features,

         const vector<int>& targets);

     virtual double train(const vector<vector<double> >& features,

         const vector<int>& targets, const vector<double>& weights);


     // evaluation (log-probability)

     using drwnClassifier::getClassScores;

     virtual void getClassScores(const vector<double>& features,

         vector<double>& outputScores) const = 0;


  protected:

     // drwnOptimizer interface

     double objective(const double *x) const;

     void gradient(const double *x, double *df) const;

     virtual double objectiveAndGradient(const double *x, double *df) const = 0;

 };


 // drwnTMultiClassLogistic -----------------------------------------------------


 template<class FeatureMap = drwnBiasJointFeatureMap>

 class drwnTMultiClassLogistic : public drwnMultiClassLogisticBase {

  public:

     drwnTMultiClassLogistic() : drwnMultiClassLogisticBase() { /* do nothing */ }

     drwnTMultiClassLogistic(unsigned n, unsigned k = 2) :

         drwnMultiClassLogisticBase(n, k) { initialize(n, k); }

     drwnTMultiClassLogistic(const drwnTMultiClassLogistic<FeatureMap> &c) :

        drwnMultiClassLogisticBase(c) { /* do nothing */ }


     ~drwnTMultiClassLogistic() { /* do nothing */ }


     // access

     virtual drwnTMultiClassLogistic<FeatureMap> *clone() const {

         return new drwnTMultiClassLogistic<FeatureMap>(*this);

     }


     // initialization

     virtual void initialize(unsigned n, unsigned k = 2);


     // evaluation (log-probability)

     using drwnMultiClassLogisticBase::getClassScores;

     virtual void getClassScores(const vector<double>& features,

         vector<double>& outputScores) const;


  protected:

     virtual double objectiveAndGradient(const double *x, double *df) const;

 };


 // drwnMultiClassLogistic ------------------------------------------------------


 typedef drwnTMultiClassLogistic<> drwnMultiClassLogistic;


 // drwnTMultiClassLogistic implementation --------------------------------------


 template<class FeatureMap>

 void drwnTMultiClassLogistic<FeatureMap>::initialize(unsigned n, unsigned k)

 {

     drwnClassifier::initialize(n, k);

     const FeatureMap phi(_nFeatures, _nClasses);

     const int m = phi.numParameters();

     if (m == 0) {

         _theta = VectorXd();

     } else {

         _theta = VectorXd::Zero(phi.numParameters());

     }

 }


 template<class FeatureMap>

 void drwnTMultiClassLogistic<FeatureMap>::getClassScores(const vector<double>& features,

     vector<double>& outputScores) const

 {

     DRWN_ASSERT((int)features.size() == _nFeatures);


     vector<double> t(_theta.rows());

     Eigen::Map<VectorXd>(&t[0], t.size()) = _theta;


     const FeatureMap phi(_nFeatures, _nClasses);

     outputScores.resize(_nClasses);

     for (int k = 0; k < _nClasses; k++) {

         outputScores[k] = phi.dot(t, features, k);

     }

 }


 template<class FeatureMap>

 double drwnTMultiClassLogistic<FeatureMap>::objectiveAndGradient(const double *x, double *df) const

 {

     double negLogL = 0.0;

     int numTerms = 0;


     const FeatureMap phi(_nFeatures, _nClasses);

     vector<double> p(_nClasses);


     const vector<double> vx(x, x + _n);

     vector<double> vdf(_n, 0.0);


     for (unsigned n = 0; n < _features->size(); n++) {

         if ((*_targets)[n] < 0) continue; // skip missing labels

         double alpha = (_weights == NULL) ? 1.0 : (*_weights)[n];


     // compute marginal for training sample

     double maxValue = 0.0;

         for (int k = 0; k < _nClasses; k++) {

             p[k] = phi.dot(vx, (*_features)[n], k);

             maxValue = std::max(maxValue, p[k]);

         }


     // exponentiate and normalize

     double Z = 0.0;

     for (vector<double>::iterator it = p.begin(); it != p.end(); ++it) {

         Z += (*it = exp(*it - maxValue));

     }


     // increment log-likelihood

     negLogL -= alpha * log(p[(*_targets)[n]] / Z);

     numTerms += 1;


     // increment derivative

         p[(*_targets)[n]] -= Z;

         for (int k = 0; k < _nClasses; k++) {

             phi.mac(vdf, (*_features)[n], alpha * p[k] / Z, k);

         }

     }


     memcpy((void *)df, (void *)&vdf[0], _n * sizeof(double));


     if (numTerms == 0) return 0.0;

     negLogL /= (double)numTerms;

     Eigen::Map<VectorXd>(df, _n) /= (double)numTerms;


     // regularization

     switch (_regularizer) {

     case 0: // sum-of-squares

         {

             double weightNorm = 0.0;

             for (unsigned i = 0; i < _n; i++) {

                 weightNorm += x[i] * x[i];

                 df[i] += _lambda * x[i];

             }


             negLogL += 0.5 * _lambda * weightNorm;

         }

         break;


     case 1: // huber

         {

             double dh;

             for (unsigned i = 0; i < _n; i++) {

                 negLogL += _lambda * drwn::huberFunctionAndDerivative(x[i], &dh, 1.0e-3);

                 df[i] += _lambda * dh;

             }

         }

         break;


     default:

         DRWN_LOG_ERROR("unsupported regularizer " << _regularizer);

     }


     return negLogL;

 }

drwnClassifier::train
virtual double train(const drwnClassifierDataset &dataset)=0
train the parameters of the classifier from a drwnClassifierDataset object

drwnTMultiClassLogistic::getClassScores
virtual void getClassScores(const vector< double > &features, vector< double > &outputScores) const
compute the unnormalized log-probability for a single feature vector
Definition: drwnMultiClassLogistic.h:145

drwnMultiClassLogisticBase::getClassScores
virtual void getClassScores(const vector< double > &features, vector< double > &outputScores) const =0
compute the unnormalized log-probability for a single feature vector

drwnMultiClassLogisticBase::type
virtual const char * type() const
returns object type as a string (e.g., Foo::type() { return "Foo"; })
Definition: drwnMultiClassLogistic.h:56

drwnTMultiClassLogistic::drwnTMultiClassLogistic
drwnTMultiClassLogistic()
default constructor
Definition: drwnMultiClassLogistic.h:95

drwnClassifier::initialize
virtual void initialize(unsigned n, unsigned k=2)
initialize the classifier object for n features and k classes
Definition: drwnClassifier.cpp:47

drwnMultiClassLogisticBase::REG_STRENGTH
static double REG_STRENGTH
default strength of regularizer (used during construction)
Definition: drwnMultiClassLogistic.h:32

drwnTMultiClassLogistic::drwnTMultiClassLogistic
drwnTMultiClassLogistic(unsigned n, unsigned k=2)
construct a k-class logistic classifier for data of dimension n
Definition: drwnMultiClassLogistic.h:97

drwnMultiClassLogistic
drwnTMultiClassLogistic drwnMultiClassLogistic
Conveinience type declaration for multi-class logistic classifier with default feature mapping...
Definition: drwnMultiClassLogistic.h:127

drwnTMultiClassLogistic::objectiveAndGradient
virtual double objectiveAndGradient(const double *x, double *df) const
returns value of objective function and populates gradient df at point x
Definition: drwnMultiClassLogistic.h:162

drwnMultiClassLogisticBase
Common functionality for drwnMultiClassLogistic.
Definition: drwnMultiClassLogistic.h:30

drwnOptimizer
Interface for solving large-scale unconstrained optimization problems using L-BFGS.
Definition: drwnOptimizer.h:68

drwnClassifier
Implements the interface for a generic machine learning classifier.
Definition: drwnClassifier.h:31

drwnTMultiClassLogistic::drwnTMultiClassLogistic
drwnTMultiClassLogistic(const drwnTMultiClassLogistic< FeatureMap > &c)
copy constructor
Definition: drwnMultiClassLogistic.h:100

drwnMultiClassLogisticBase::_theta
VectorXd _theta
joint feature map weights
Definition: drwnMultiClassLogistic.h:36

drwnTMultiClassLogistic
Implements a multi-class logistic classifier templated on a drwnJointFeatureMap.
Definition: drwnMultiClassLogistic.h:92

drwnTMultiClassLogistic::initialize
virtual void initialize(unsigned n, unsigned k=2)
initialize the classifier object for n features and k classes
Definition: drwnMultiClassLogistic.h:132

drwnMultiClassLogisticBase::MAX_ITERATIONS
static int MAX_ITERATIONS
maximum number of training iterations
Definition: drwnMultiClassLogistic.h:33

drwnDataset
Implements a cacheable dataset containing feature vectors, labels and optional weights.
Definition: drwnDataset.h:43

drwnClassifier::getClassScores
virtual void getClassScores(const vector< double > &features, vector< double > &outputScores) const =0
compute the unnormalized log-probability for a single feature vector

drwnMultiClassLogisticBase::_regularizer
int _regularizer
regularization option
Definition: drwnMultiClassLogistic.h:37

drwnMultiClassLogisticBase::_lambda
double _lambda
regularization strength
Definition: drwnMultiClassLogistic.h:38

drwnTMultiClassLogistic::clone
virtual drwnTMultiClassLogistic< FeatureMap > * clone() const
returns a copy of the class usually implemented as virtual Foo* clone() { return new Foo(*this); } ...
Definition: drwnMultiClassLogistic.h:106