dd/df6/BNDatabaseGenerator__tpl_8h_source.html

/****************************************************************************

 *   This file is part of the aGrUM/pyAgrum library.                        *

 *                                                                          *

 *   Copyright (c) 2005-2025 by                                             *

 *       - Pierre-Henri WUILLEMIN(_at_LIP6)                                 *

 *       - Christophe GONZALES(_at_AMU)                                     *

 *                                                                          *

 *   The aGrUM/pyAgrum library is free software; you can redistribute it    *

 *   and/or modify it under the terms of either :                           *

 *                                                                          *

 *    - the GNU Lesser General Public License as published by               *

 *      the Free Software Foundation, either version 3 of the License,      *

 *      or (at your option) any later version,                              *

 *    - the MIT license (MIT),                                              *

 *    - or both in dual license, as here.                                   *

 *                                                                          *

 *   (see https://agrum.gitlab.io/articles/dual-licenses-lgplv3mit.html)    *

 *                                                                          *

 *   This aGrUM/pyAgrum library is distributed in the hope that it will be  *

 *   useful, but WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED,          *

 *   INCLUDING BUT NOT LIMITED TO THE WARRANTIES MERCHANTABILITY or FITNESS *

 *   FOR A PARTICULAR PURPOSE  AND NONINFRINGEMENT. IN NO EVENT SHALL THE   *

 *   AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER *

 *   LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE,        *

 *   ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR  *

 *   OTHER DEALINGS IN THE SOFTWARE.                                        *

 *                                                                          *

 *   See LICENCES for more details.                                         *

 *                                                                          *

 *   SPDX-FileCopyrightText: Copyright 2005-2025                            *

 *       - Pierre-Henri WUILLEMIN(_at_LIP6)                                 *

 *       - Christophe GONZALES(_at_AMU)                                     *

 *   SPDX-License-Identifier: LGPL-3.0-or-later OR MIT                      *

 *                                                                          *

 *   Contact  : info_at_agrum_dot_org                                       *

 *   homepage : http://agrum.gitlab.io                                      *

 *   gitlab   : https://gitlab.com/agrumery/agrum                           *

 *                                                                          *

 ****************************************************************************/

#pragma once


#include <agrum/base/core/timer.h>

#include <agrum/BN/database/BNDatabaseGenerator.h>


namespace gum::learning {


  template < typename GUM_SCALAR >


  BNDatabaseGenerator< GUM_SCALAR >::BNDatabaseGenerator(const BayesNet< GUM_SCALAR >& bn) :

      _bn_(bn) {

    GUM_CONSTRUCTOR(BNDatabaseGenerator)


    // get the node names => they will serve as ids

    NodeId id = 0;

    for (const auto& var: _bn_.dag()) {

      auto name = _bn_.variable(var).name();

      _names2ids_.insert(name, var);

      ++id;

    }

    _nbVars_ = id;

    _varOrder_.resize(_nbVars_);

    _discretizedLabelMode_ = DiscretizedLabelMode::RANDOM;

    std::iota(_varOrder_.begin(), _varOrder_.end(), (Idx)0);

  }


  template < typename GUM_SCALAR >


  BNDatabaseGenerator< GUM_SCALAR >::~BNDatabaseGenerator() {

    GUM_DESTRUCTOR(BNDatabaseGenerator)

  }


  template < typename GUM_SCALAR >


  double BNDatabaseGenerator< GUM_SCALAR >::drawSamples(Size nbSamples) {

    const Instantiation inst;

    return drawSamples(nbSamples, inst);

  }


  template < typename GUM_SCALAR >


  double BNDatabaseGenerator< GUM_SCALAR >::drawSamples(Size                 nbSamples,

                                                        const Instantiation& evs,

                                                        int                  timeout) {

    int progress = 0;


    if (onProgress.hasListener()) { GUM_EMIT2(onProgress, progress, 0.0); }


    _database_.clear();

    _database_.resize(nbSamples);

    for (auto& row: _database_) {

      row.resize(_nbVars_);

    }

    // get the order in which the nodes will be sampled

    const auto         topOrder = _bn_.topologicalOrder();

    gum::Instantiation particule;


    // create instantiations in advance

    for (NodeId node = 0; node < _nbVars_; ++node)

      particule.add(_bn_.variable(node));


    gum::Timer timer;

    timer.reset();


    // perform the sampling

    _log2likelihood_ = 0;

    Idx idSample     = 0;

    while (idSample < nbSamples) {

      if (onProgress.hasListener()) {

        auto p = int((idSample * 100) / nbSamples);

        if (p != progress) {

          progress = p;

          GUM_EMIT2(onProgress, progress, timer.step());

        }

      }

      std::vector< Idx >& sample = _database_.at(idSample);

      bool                reject = false;

      for (Idx rank = 0; rank < _nbVars_; ++rank) {

        const NodeId node = topOrder[rank];

        const auto&  var  = _bn_.variable(node);

        const auto&  cpt  = _bn_.cpt(node);


        const double nb    = gum::randomProba();

        double       cumul = 0.0;

        for (particule.setFirstVar(var); !particule.end(); particule.incVar(var)) {

          cumul += cpt[particule];

          if (cumul >= nb) break;

        }

        if (particule.end()) particule.setLastVar(var);


        if ((!evs.empty()) && evs.contains(var) && (evs.val(var) != particule.val(var))) {

          reject = true;

          break;

        }


        sample.at(node) = particule.val(var);

        _log2likelihood_ += std::log2(_bn_.cpt(node)[particule]);

      }

      if (timeout > 0 && timer.step() > timeout) { break; }

      if (reject) { continue; }

      idSample++;

    }


    if (idSample > 0) {

      if (idSample < nbSamples) _database_.resize(idSample);

    } else {

      _database_.clear();

    }

    _drawnSamples_ = true;


    if (onProgress.hasListener()) {

      std::stringstream ss;

      ss << "Database of size " << idSample << "(" << nbSamples << ") generated in " << timer.step()

         << " seconds. Log2likelihood : " << _log2likelihood_;

      GUM_EMIT1(onStop, ss.str());

    }


    return _log2likelihood_;

  }


  template < typename GUM_SCALAR >


  INLINE Size BNDatabaseGenerator< GUM_SCALAR >::samplesNbRows() const {

    if (!_drawnSamples_) { GUM_ERROR(OperationNotAllowed, "drawSamples() must be called first.") }


    return _database_.size();

  }


  template < typename GUM_SCALAR >


  INLINE Size BNDatabaseGenerator< GUM_SCALAR >::samplesNbCols() const {

    if (!_drawnSamples_) { GUM_ERROR(OperationNotAllowed, "drawSamples() must be called first.") }


    return _nbVars_;

  }


  template < typename GUM_SCALAR >


  INLINE Idx BNDatabaseGenerator< GUM_SCALAR >::samplesAt(Idx row, Idx col) const {

    if (!_drawnSamples_) { GUM_ERROR(OperationNotAllowed, "drawSamples() must be called first.") }

    return _database_.at(row).at(_varOrder_.at(col));

  }


  template < typename GUM_SCALAR >


  INLINE std::string BNDatabaseGenerator< GUM_SCALAR >::samplesLabelAt(Idx row, Idx col) const {

    if (!_drawnSamples_) { GUM_ERROR(OperationNotAllowed, "drawSamples() must be called first.") }

    const auto j = _varOrder_.at(col);

    return _label_(_database_.at(row), _bn_.variable(j), j);

  }


  template < typename GUM_SCALAR >


  void BNDatabaseGenerator< GUM_SCALAR >::setDiscretizedLabelModeRandom() {

    _discretizedLabelMode_ = DiscretizedLabelMode::RANDOM;

  }


  template < typename GUM_SCALAR >


  void BNDatabaseGenerator< GUM_SCALAR >::setDiscretizedLabelModeMedian() {

    _discretizedLabelMode_ = DiscretizedLabelMode::MEDIAN;

  }


  template < typename GUM_SCALAR >


  void BNDatabaseGenerator< GUM_SCALAR >::setDiscretizedLabelModeInterval() {

    _discretizedLabelMode_ = DiscretizedLabelMode::INTERVAL;

  }


  template < typename GUM_SCALAR >


  void BNDatabaseGenerator< GUM_SCALAR >::toCSV(const std::string& csvFileURL,

                                                bool               useLabels,

                                                bool               append,

                                                std::string        csvSeparator,

                                                bool               checkOnAppend) const {

    if (!_drawnSamples_) { GUM_ERROR(OperationNotAllowed, "drawSamples() must be called first.") }


    if (csvSeparator.find('\n') != std::string::npos) {

      GUM_ERROR(InvalidArgument, "csvSeparator must not contain end-line characters")

    }


    bool includeHeader = true;

    if (append) {

      std::ifstream csvFile(csvFileURL);

      if (csvFile) {

        if (auto varOrder = _varOrderFromCSV_(csvFile, csvSeparator);

            checkOnAppend && varOrder != _varOrder_)

          GUM_ERROR(OperationNotAllowed,

                    "Inconsistent variable order in csvFile when appending. You "

                    "can use setVarOrderFromCSV(url) function to get the right "

                    "order. You could also set parameter checkOnAppend=false if you "

                    "know what you are doing.")

        includeHeader = false;

      }

      csvFile.close();

    }


    auto ofstreamFlag = append ? std::ofstream::app : std::ofstream::out;


    std::ofstream os(csvFileURL, ofstreamFlag);

    bool          firstCol = true;

    if (includeHeader) {

      for (const auto& i: _varOrder_) {

        if (firstCol) {

          firstCol = false;

        } else {

          os << csvSeparator;

        }

        os << _bn_.variable(i).name();

      }

    }

    os << std::endl;


    bool firstRow = true;

    for (const auto& row: _database_) {

      if (firstRow) {

        firstRow = false;

      } else {

        os << std::endl;

      }

      firstCol = true;

      for (const auto& i: _varOrder_) {

        if (firstCol) {

          firstCol = false;

        } else {

          os << csvSeparator;

        }

        if (useLabels) {

          const auto& v = _bn_.variable(i);

          if (v.varType() == VarType::DISCRETIZED) {

            switch (_discretizedLabelMode_) {

              case DiscretizedLabelMode::MEDIAN : os << v.numerical(row.at(i)); break;

              case DiscretizedLabelMode::RANDOM :

                os << static_cast< const IDiscretizedVariable& >(v).draw(row.at(i));

                break;

              case DiscretizedLabelMode::INTERVAL : os << v.label(row.at(i)); break;

            }

          } else {

            os << v.label(row.at(i));

          }

        } else {

          os << row[i];

        }

      }

    }


    os.close();

  }


  template < typename GUM_SCALAR >


  std::string BNDatabaseGenerator< GUM_SCALAR >::_label_(const std::vector< Idx >& row,

                                                         const DiscreteVariable&   v,

                                                         Idx                       i) const {

    if (v.varType() == VarType::DISCRETIZED) {

      switch (_discretizedLabelMode_) {

        case DiscretizedLabelMode::MEDIAN : return std::to_string(v.numerical(row.at(i)));

        case DiscretizedLabelMode::RANDOM :

          return std::to_string(static_cast< const IDiscretizedVariable& >(v).draw(row.at(i)));

        case DiscretizedLabelMode::INTERVAL : return v.label(row.at(i));

      }

    }


    return v.label(row.at(i));

  }


  template < typename GUM_SCALAR >


  DatabaseTable BNDatabaseGenerator< GUM_SCALAR >::toDatabaseTable(bool useLabels) const {

    if (!_drawnSamples_) GUM_ERROR(OperationNotAllowed, "proceed() must be called first.")


    DatabaseTable              db;

    std::vector< std::string > varNames;

    varNames.reserve(_nbVars_);

    for (const auto& i: _varOrder_) {

      varNames.push_back(_names2ids_.first(i));

    }


    // create the translators

    for (std::size_t i = 0; i < _nbVars_; ++i) {

      const Variable& var = _bn_.variable(_varOrder_[i]);

      db.insertTranslator(var, i);

    }


    if (useLabels) {

      std::vector< std::string > xrow(_nbVars_);

      for (const auto& row: _database_) {

        for (Idx i = 0; i < _nbVars_; ++i) {

          const Idx j = _varOrder_.at(i);

          xrow[i]     = _label_(row, _bn_.variable(j), j);

        }

        db.insertRow(xrow);

      }

    } else {

      std::vector< DBTranslatedValueType > translatorType(_nbVars_);

      for (std::size_t i = 0; i < _nbVars_; ++i) {

        translatorType[i] = db.translator(i).getValType();

      }

      DBRow< DBTranslatedValue > xrow(_nbVars_);

      const auto                 xmiss = gum::learning::DatabaseTable::IsMissing::False;

      for (const auto& row: _database_) {

        for (Idx i = 0; i < _nbVars_; ++i) {

          const Idx j = _varOrder_.at(i);

          if (translatorType[i] == DBTranslatedValueType::DISCRETE)

            xrow[i].discr_val = std::size_t(row.at(j));

          else xrow[i].cont_val = float(row.at(j));

        }

      }

      db.insertRow(xrow, xmiss);

    }


    return db;

  }


  template < typename GUM_SCALAR >


  std::vector< std::vector< Idx > > BNDatabaseGenerator< GUM_SCALAR >::database() const {

    if (!_drawnSamples_) GUM_ERROR(OperationNotAllowed, "drawSamples() must be called first.")


    auto db(_database_);

    for (Idx i = 0; i < _database_.size(); ++i) {

      for (Idx j = 0; j < _nbVars_; ++j) {

        db.at(i).at(j) = (Idx)_database_.at(i).at(_varOrder_.at(j));

      }

    }

    return db;

  }


  template < typename GUM_SCALAR >


  void BNDatabaseGenerator< GUM_SCALAR >::setVarOrder(const std::vector< Idx >& varOrder) {

    if (varOrder.size() != _nbVars_)

      GUM_ERROR(FatalError, "varOrder's size must be equal to the number of variables")


    std::vector< bool > usedVars(_nbVars_, false);

    for (const auto& i: varOrder) {

      if (i >= _nbVars_) GUM_ERROR(FatalError, "varOrder contains invalid variables")

      if (usedVars.at(i)) GUM_ERROR(FatalError, "varOrder must not have repeated variables")

      usedVars.at(i) = true;

    }


    if (std::find(usedVars.begin(), usedVars.end(), false) != usedVars.end()) {

      GUM_ERROR(FatalError, "varOrder must contain all variables")

    }


    _varOrder_ = varOrder;

  }


  template < typename GUM_SCALAR >


  void BNDatabaseGenerator< GUM_SCALAR >::setVarOrder(const std::vector< std::string >& varOrder) {

    std::vector< Idx > varOrderIdx;

    varOrderIdx.reserve(varOrder.size());

    for (const auto& vname: varOrder) {

      varOrderIdx.push_back(_names2ids_.second(vname));

    }

    setVarOrder(varOrderIdx);

  }


  template < typename GUM_SCALAR >


  void BNDatabaseGenerator< GUM_SCALAR >::setVarOrderFromCSV(const std::string& csvFileURL,

                                                             const std::string& csvSeparator) {

    setVarOrder(_varOrderFromCSV_(csvFileURL, csvSeparator));

  }


  template < typename GUM_SCALAR >


  void BNDatabaseGenerator< GUM_SCALAR >::setTopologicalVarOrder() {

    std::vector< Idx > varOrder;

    varOrder.reserve(_nbVars_);

    for (const auto& v: _bn_.topologicalOrder()) {

      varOrder.push_back(v);

    }

    setVarOrder(varOrder);

  }


  template < typename GUM_SCALAR >


  void BNDatabaseGenerator< GUM_SCALAR >::setAntiTopologicalVarOrder() {

    std::vector< Idx > varOrder;

    varOrder.reserve(_nbVars_);

    for (const auto& v: _bn_.topologicalOrder()) {

      varOrder.push_back(v);

    }

    std::reverse(varOrder.begin(), varOrder.end());

    setVarOrder(varOrder);

  }


  template < typename GUM_SCALAR >


  void BNDatabaseGenerator< GUM_SCALAR >::setRandomVarOrder() {

    std::vector< std::string > varOrder;

    varOrder.reserve(_bn_.size());

    for (const auto& var: _bn_.dag()) {

      varOrder.push_back(_bn_.variable(var).name());

    }

    std::shuffle(varOrder.begin(), varOrder.end(), gum::randomGenerator());

    setVarOrder(varOrder);

  }


  template < typename GUM_SCALAR >


  std::vector< Idx > BNDatabaseGenerator< GUM_SCALAR >::varOrder() const {

    return _varOrder_;

  }


  template < typename GUM_SCALAR >


  std::vector< std::string > BNDatabaseGenerator< GUM_SCALAR >::varOrderNames() const {

    std::vector< std::string > varNames;

    varNames.reserve(_nbVars_);

    for (const auto& i: _varOrder_) {

      varNames.push_back(_names2ids_.first(i));

    }


    return varNames;

  }


  template < typename GUM_SCALAR >


  double BNDatabaseGenerator< GUM_SCALAR >::log2likelihood() const {

    if (!_drawnSamples_) { GUM_ERROR(OperationNotAllowed, "drawSamples() must be called first.") }

    return _log2likelihood_;

  }


  template < typename GUM_SCALAR >

  std::vector< Idx >


      BNDatabaseGenerator< GUM_SCALAR >::_varOrderFromCSV_(const std::string& csvFileURL,

                                                           const std::string& csvSeparator) const {

    std::ifstream      csvFile(csvFileURL);

    std::vector< Idx > varOrder;

    if (csvFile) {

      varOrder = _varOrderFromCSV_(csvFile, csvSeparator);

      csvFile.close();

    } else {

      GUM_ERROR(NotFound, "csvFileURL does not exist")

    }


    return varOrder;

  }


  template < typename GUM_SCALAR >

  std::vector< Idx >


      BNDatabaseGenerator< GUM_SCALAR >::_varOrderFromCSV_(std::ifstream&     csvFile,

                                                           const std::string& csvSeparator) const {

    std::string                line;

    std::vector< std::string > header_found;

    header_found.reserve(_nbVars_);

    while (std::getline(csvFile, line)) {

      std::size_t i   = 0;

      auto        pos = line.find(csvSeparator);

      while (pos != std::string::npos) {

        header_found.push_back(line.substr(i, pos - i));

        pos += csvSeparator.length();

        i   = pos;

        pos = line.find(csvSeparator, pos);


        if (pos == std::string::npos) header_found.push_back(line.substr(i, line.length()));

      }

      break;

    }


    std::vector< Size > varOrder;

    varOrder.reserve(_nbVars_);


    for (const auto& hf: header_found) {

      varOrder.push_back(_names2ids_.second(hf));

    }


    return varOrder;

  }


}   // namespace gum::learning

BNDatabaseGenerator.h

gum::DiscreteVariable
Base class for discrete random variable.
Definition discreteVariable.h:78

gum::DiscreteVariable::numerical
virtual double numerical(Idx indice) const =0
get a numerical representation of the indice-th value.

gum::DiscreteVariable::varType
VarType varType() const override=0
returns the varType of variable

gum::DiscreteVariable::label
virtual std::string label(Idx i) const =0
get the indice-th label. This method is pure virtual.

FatalError
Exception : fatal (unknown ?) error.

gum::IDiscretizedVariable
A base class for discretized variables, independent of the ticks type.
Definition IDiscretizedVariable.h:59

gum::Instantiation
Class for assigning/browsing values to tuples of discrete variables.
Definition instantiation.h:102

gum::Instantiation::end
bool end() const
Returns true if the Instantiation reached the end.
Definition instantiation_inl.h:221

gum::Instantiation::incVar
void incVar(const DiscreteVariable &v)
Operator increment for variable v only.
Definition instantiation_inl.h:640

gum::Instantiation::add
void add(const DiscreteVariable &v) final
Adds a new variable in the Instantiation.
Definition instantiation_inl.h:123

gum::Instantiation::empty
virtual bool empty() const final
Returns true if the instantiation is empty.
Definition instantiation_inl.h:765

gum::Instantiation::contains
bool contains(const DiscreteVariable &v) const final
Indicates whether a given variable belongs to the Instantiation.
Definition instantiation_inl.h:54

gum::Instantiation::setFirstVar
void setFirstVar(const DiscreteVariable &v)
Assign the first value in the Instantiation for var v.
Definition instantiation_inl.h:676

gum::Instantiation::val
Idx val(Idx i) const
Returns the current value of the variable at position i.
Definition instantiation_inl.h:184

gum::Instantiation::setLastVar
void setLastVar(const DiscreteVariable &v)
Assign the last value in the Instantiation for var v.
Definition instantiation_inl.h:682

InvalidArgument
Exception: at least one argument passed to a function is not what was expected.

NotFound
Exception : the element we looked for cannot be found.

OperationNotAllowed
Exception : operation not allowed.

gum::ProgressNotifier::onProgress
Signaler2< Size, double > onProgress
Progression (percent) and time.
Definition progressNotification.h:67

gum::ProgressNotifier::onStop
Signaler1< const std::string & > onStop
with a possible explanation for stopping
Definition progressNotification.h:70

gum::Timer
Class used to compute response times for benchmark purposes.
Definition timer.h:69

gum::Timer::reset
void reset()
Reset the timer.
Definition timer_inl.h:52

gum::Timer::step
double step() const
Returns the delta time between now and the last reset() call (or the constructor).
Definition timer_inl.h:71

gum::Variable
Base class for every random variable.
Definition variable.h:79

gum::learning::BNDatabaseGenerator::_drawnSamples_
bool _drawnSamples_
whether drawSamples has been already called.
Definition BNDatabaseGenerator.h:231

gum::learning::BNDatabaseGenerator::varOrder
std::vector< Idx > varOrder() const
returns variable order indexes
Definition BNDatabaseGenerator_tpl.h:445

gum::learning::BNDatabaseGenerator::samplesLabelAt
std::string samplesLabelAt(Idx row, Idx col) const
generate and stock database, returns log2likelihood using ProgressNotifier as notification
Definition BNDatabaseGenerator_tpl.h:189

gum::learning::BNDatabaseGenerator::toDatabaseTable
DatabaseTable toDatabaseTable(bool useLabels=true) const
generates a DatabaseVectInRAM
Definition BNDatabaseGenerator_tpl.h:310

gum::learning::BNDatabaseGenerator::setVarOrderFromCSV
void setVarOrderFromCSV(const std::string &csvFileURL, const std::string &csvSeparator=",")
change columns order according to a csv file
Definition BNDatabaseGenerator_tpl.h:403

gum::learning::BNDatabaseGenerator::samplesNbRows
Size samplesNbRows() const
generate and stock database, returns log2likelihood using ProgressNotifier as notification
Definition BNDatabaseGenerator_tpl.h:169

gum::learning::BNDatabaseGenerator::_label_
std::string _label_(const std::vector< Idx > &row, const DiscreteVariable &v, Idx i) const
return the final string for a label (taking into account the behavior for DiscretizedVariable) from a...
Definition BNDatabaseGenerator_tpl.h:293

gum::learning::BNDatabaseGenerator::database
std::vector< std::vector< Idx > > database() const
generates database according to bn into a std::vector
Definition BNDatabaseGenerator_tpl.h:358

gum::learning::BNDatabaseGenerator::setDiscretizedLabelModeRandom
void setDiscretizedLabelModeRandom()
set the behaviour of sampling for discretized variable to uniformly draw double value
Definition BNDatabaseGenerator_tpl.h:196

gum::learning::BNDatabaseGenerator::samplesAt
Idx samplesAt(Idx row, Idx col) const
generate and stock database, returns log2likelihood using ProgressNotifier as notification
Definition BNDatabaseGenerator_tpl.h:183

gum::learning::BNDatabaseGenerator::_log2likelihood_
double _log2likelihood_
log2Likelihood of generated samples
Definition BNDatabaseGenerator.h:234

gum::learning::BNDatabaseGenerator::bn
const BayesNet< GUM_SCALAR > & bn(void)
return const ref to the Bayes Net
Definition BNDatabaseGenerator.h:209

gum::learning::BNDatabaseGenerator::BNDatabaseGenerator
BNDatabaseGenerator(const BayesNet< GUM_SCALAR > &bn)
default constructor
Definition BNDatabaseGenerator_tpl.h:57

gum::learning::BNDatabaseGenerator::setDiscretizedLabelModeInterval
void setDiscretizedLabelModeInterval()
set the behaviour of sampling for discretized variable to select the label : "[min,...
Definition BNDatabaseGenerator_tpl.h:206

gum::learning::BNDatabaseGenerator::_names2ids_
Bijection< std::string, NodeId > _names2ids_
bijection nodes names
Definition BNDatabaseGenerator.h:219

gum::learning::BNDatabaseGenerator::_database_
std::vector< std::vector< Idx > > _database_
generated database
Definition BNDatabaseGenerator.h:225

gum::learning::BNDatabaseGenerator::_discretizedLabelMode_
DiscretizedLabelMode _discretizedLabelMode_
Definition BNDatabaseGenerator.h:214

gum::learning::BNDatabaseGenerator::samplesNbCols
Size samplesNbCols() const
generate and stock database, returns log2likelihood using ProgressNotifier as notification
Definition BNDatabaseGenerator_tpl.h:176

gum::learning::BNDatabaseGenerator::_bn_
const BayesNet< GUM_SCALAR > & _bn_
Bayesian network.
Definition BNDatabaseGenerator.h:216

gum::learning::BNDatabaseGenerator::setAntiTopologicalVarOrder
void setAntiTopologicalVarOrder()
set columns in antiTopoligical order
Definition BNDatabaseGenerator_tpl.h:421

gum::learning::BNDatabaseGenerator::log2likelihood
double log2likelihood() const
returns log2Likelihood of generated samples
Definition BNDatabaseGenerator_tpl.h:463

gum::learning::BNDatabaseGenerator::setTopologicalVarOrder
void setTopologicalVarOrder()
set columns in topoligical order
Definition BNDatabaseGenerator_tpl.h:410

gum::learning::BNDatabaseGenerator::setDiscretizedLabelModeMedian
void setDiscretizedLabelModeMedian()
set the behaviour of sampling for discretized variable to deterministic select double median of inter...
Definition BNDatabaseGenerator_tpl.h:201

gum::learning::BNDatabaseGenerator::drawSamples
double drawSamples(Size nbSamples)
generate and stock database, returns log2likelihood using ProgressNotifier as notification
Definition BNDatabaseGenerator_tpl.h:82

gum::learning::BNDatabaseGenerator::_varOrder_
std::vector< Idx > _varOrder_
variable order in generated database
Definition BNDatabaseGenerator.h:228

gum::learning::BNDatabaseGenerator::varOrderNames
std::vector< std::string > varOrderNames() const
returns variable order.
Definition BNDatabaseGenerator_tpl.h:451

gum::learning::BNDatabaseGenerator::_varOrderFromCSV_
std::vector< Idx > _varOrderFromCSV_(const std::string &csvFileURL, const std::string &csvSeparator=",") const
returns varOrder from a csv file
Definition BNDatabaseGenerator_tpl.h:471

gum::learning::BNDatabaseGenerator::_nbVars_
Size _nbVars_
number of variables
Definition BNDatabaseGenerator.h:222

gum::learning::BNDatabaseGenerator::setVarOrder
void setVarOrder(const std::vector< Idx > &varOrder)
change columns order
Definition BNDatabaseGenerator_tpl.h:372

gum::learning::BNDatabaseGenerator::toCSV
void toCSV(const std::string &csvFileURL, bool useLabels=true, bool append=false, std::string csvSeparator=",", bool checkOnAppend=false) const
generates csv representing the generated database
Definition BNDatabaseGenerator_tpl.h:212

gum::learning::BNDatabaseGenerator::setRandomVarOrder
void setRandomVarOrder()
set columns in random order
Definition BNDatabaseGenerator_tpl.h:433

gum::learning::BNDatabaseGenerator::~BNDatabaseGenerator
~BNDatabaseGenerator()
destructor
Definition BNDatabaseGenerator_tpl.h:76

gum::learning::BNDatabaseGenerator::DiscretizedLabelMode::RANDOM
@ RANDOM
Definition BNDatabaseGenerator.h:102

gum::learning::BNDatabaseGenerator::DiscretizedLabelMode::INTERVAL
@ INTERVAL
Definition BNDatabaseGenerator.h:102

gum::learning::BNDatabaseGenerator::DiscretizedLabelMode::MEDIAN
@ MEDIAN
Definition BNDatabaseGenerator.h:102

gum::learning::DBRow
The class for storing a record in a database.
Definition DBRow.h:75

gum::learning::DBTranslator::getValType
DBTranslatedValueType getValType() const
returns the type of values handled by the translator

gum::learning::DatabaseTable
The class representing a tabular database as used by learning tasks.
Definition databaseTable.h:200

gum::learning::DatabaseTable::insertTranslator
std::size_t insertTranslator(const DBTranslator &translator, const std::size_t input_column, const bool unique_column=true)
insert a new translator into the database table

gum::learning::DatabaseTable::translator
const DBTranslator & translator(const std::size_t k, const bool k_is_input_col=false) const
returns either the kth translator of the database table or the first one reading the kth column of th...

gum::learning::DatabaseTable::insertRow
void insertRow(const std::vector< std::string > &new_row) override
insert a new row at the end of the database

GUM_ERROR
#define GUM_ERROR(type, msg)
Definition exceptions.h:72

gum::Size
std::size_t Size
In aGrUM, hashed values are unsigned long int.
Definition types.h:74

gum::Idx
Size Idx
Type for indexes.
Definition types.h:79

gum::NodeId
Size NodeId
Type for node ids.
Definition graphElements.h:117

gum::learning::DBTranslatedValueType::DISCRETE
@ DISCRETE
Definition DBTranslatedValue.h:139

gum::randomGenerator
std::mt19937 & randomGenerator()
define a random_engine with correct seed
Definition utils_random_inl.h:96

gum::randomProba
double randomProba()
Returns a random double between 0 and 1 included (i.e.
Definition utils_random_inl.h:71

gum::learning
include the inlined functions if necessary
Definition CSVParser.h:54

gum::VarType::DISCRETIZED
@ DISCRETIZED
Definition variable.h:60

GUM_EMIT1
#define GUM_EMIT1(signal, arg1)
Definition signaler1.h:61

GUM_EMIT2
#define GUM_EMIT2(signal, arg1, arg2)
Definition signaler2.h:61

timer.h
Class used to compute response times for benchmark purposes.