Source code for leaspy.algo.fit.lme_fit

import warnings

import numpy as np
import statsmodels.api as sm
import torch
from statsmodels.regression.mixed_linear_model import MixedLM, MixedLMParams

from leaspy.exceptions import LeaspyDataInputError
from leaspy.io.data import Dataset
from leaspy.models import LMEModel

from ..base import AlgorithmName
from ..settings import AlgorithmSettings, OutputsSettings
from .base import FitAlgorithm

__all__ = ["LMEFitAlgorithm"]



[docs]
class LMEFitAlgorithm(FitAlgorithm[LMEModel, tuple]):
    """Fitting algorithm associated to :class:`~.models.LMEModel`.

    Parameters
    ----------
    settings : :class:`.AlgorithmSettings`
        * force_independent_random_effects : :obj:`bool`
            Force independence of random intercept & random slope
        * other keyword arguments passed to :meth:`statsmodels.regression.mixed_linear_model.MixedLM.fit`

    See Also
    --------
    :class:`statsmodels.regression.mixed_linear_model.MixedLM`
    """

    name: AlgorithmName = AlgorithmName.FIT_LME

    def __init__(self, settings: AlgorithmSettings):
        super().__init__(settings)
        params = settings.parameters.copy()
        # Algorithm true parameters
        self.force_independent_random_effects = params.pop(
            "force_independent_random_effects"
        )
        # Remaining parameters are parameters of statsmodels `fit` method
        self.sm_fit_parameters = params  # popped from other params

    def _run(self, model: LMEModel, dataset: Dataset, **kwargs) -> tuple:
        """Main method, refer to abstract definition in :meth:`~.algo.fit.abstract_fit_algo.AbstractFitAlgo.run`.

        Parameters
        ----------
        model : :class:`~leaspy.models.LMEModel`
            The used model.

        dataset : :class:`.Dataset`
            Dataset object

        Returns
        -------
        2-tuple:
            * None
            * noise scale (std-dev), scalar
        """
        if model.dimension != len(dataset.headers):
            raise ValueError("LME is only univariate")

        # get data
        ages = self._get_reformated(dataset, "timepoints")
        ages_mean, ages_std = np.mean(ages).item(), np.std(ages).item()
        ages_norm = (ages - ages_mean) / ages_std

        y = self._get_reformated(dataset, "values")
        subjects_with_repeat = self._get_reformated_subjects(dataset)

        # model
        X = sm.add_constant(ages_norm, prepend=True, has_constant="add")

        if model.with_random_slope_age:
            exog_re = X

            if self.force_independent_random_effects:
                free = MixedLMParams.from_components(
                    fe_params=np.ones(2), cov_re=np.eye(2)
                )
                self.sm_fit_parameters["free"] = free
                methods_not_compat_with_free = {"powell", "nm"}.intersection(
                    self.sm_fit_parameters["method"]
                )  # cf. statsmodels doc
                if len(methods_not_compat_with_free) > 0:
                    warnings.warn(
                        "<!> Methods {'powell','nm'} are not compatible with `force_independent_random_effects`"
                    )
        else:
            exog_re = None  # random_intercept only

        lme = MixedLM(y, X, subjects_with_repeat, exog_re, missing="raise")
        fitted_lme = lme.fit(**self.sm_fit_parameters)

        try:
            cov_re_unscaled_inv = np.linalg.inv(fitted_lme.cov_re_unscaled)
        except np.linalg.LinAlgError:
            raise LeaspyDataInputError(
                "Cannot predict random effects from " "singular covariance structure."
            )

        parameters = {
            "ages_mean": ages_mean,
            "ages_std": ages_std,
            "fe_params": fitted_lme.fe_params,
            "cov_re": fitted_lme.cov_re,
            "cov_re_unscaled_inv": cov_re_unscaled_inv,  # really useful for personalization
            "noise_std": fitted_lme.scale**0.5,  # statsmodels scale is variance
            "bse_fe": fitted_lme.bse_fe,
            "bse_re": fitted_lme.bse_re,
        }

        # update model parameters
        model.load_parameters(parameters)

        # return `(fitted_lme.resid ** 2).mean() ** .5` instead of scale?
        return None, parameters["noise_std"]

    @staticmethod
    def _get_reformated(dataset: Dataset, elem):
        # reformat ages
        dataset_elem = getattr(dataset, elem)
        # flatten
        flat_elem = torch.flatten(dataset_elem).numpy()
        # remove padding & nans
        final_elem = flat_elem[torch.flatten(dataset.mask > 0)]
        return final_elem

    @staticmethod
    def _get_reformated_subjects(dataset: Dataset):
        subjects_with_repeat = []
        for ind, subject in enumerate(dataset.indices):
            subjects_with_repeat += [subject] * max(
                dataset.n_visits_per_individual
            )  # [ind]
        subjects_with_repeat = np.array(subjects_with_repeat)
        # remove padding & nans
        subjects_with_repeat = subjects_with_repeat[torch.flatten(dataset.mask > 0)]
        return subjects_with_repeat


[docs]
    def set_output_manager(self, output_settings: OutputsSettings) -> None:
        """
        Not implemented.
        """
        if output_settings is not None:
            warnings.warn("Settings logs in lme fit algorithm is not supported.")
        return