aimclub · Roman223 · Aug 15, 2023 · Aug 10, 2023 · Aug 11, 2023 · Aug 11, 2023
diff --git a/bamt/networks/base.py b/bamt/networks/base.py
@@ -862,3 +862,23 @@ def plot(self, output: str):
             os.mkdir("visualization_result")
 
         return network.show(f"visualization_result/" + output)
+
+    def get_dist(self, node_name: str, pvals: Optional[dict] = None):
+        """
+        Get a distribution from node with known parent values (conditional distribution).
+
+        :param node_name: name of node
+        :param pvals: parent values
+        """
+        if not self.distributions:
+            logger_network.error("Empty parameters. Call fit_params first.")
+            return
+        node = self[node_name]
+
+        parents = node.cont_parents + node.disc_parents
+        if not parents:
+            return self.distributions[node_name]
+
+        pvals = [pvals[parent] for parent in parents]
+
+        return node.get_dist(node_info=self.distributions[node_name], pvals=pvals)
diff --git a/bamt/nodes/base.py b/bamt/nodes/base.py
@@ -86,3 +86,7 @@ def get_path_joblib(node_name: str, specific: str = "") -> str:
             os.path.join(path_to_check, f"{specific}.joblib.compressed")
         )
         return path
+
+    @staticmethod
+    def get_dist(node_info, pvals):
+        pass
diff --git a/bamt/nodes/conditional_gaussian_node.py b/bamt/nodes/conditional_gaussian_node.py
@@ -109,18 +109,7 @@ def fit_parameters(self, data: DataFrame) -> Dict[str, Dict[str, CondGaussParams
                 }
         return {"hybcprob": hycprob}
 
-    def choose(
-        self,
-        node_info: Dict[str, Dict[str, CondGaussParams]],
-        pvals: List[Union[str, float]],
-    ) -> float:
-        """
-        Return value from ConditionalLogit node
-        params:
-        node_info: nodes info from distributions
-        pvals: parent values
-        """
-
+    def get_dist(self, node_info, pvals):
         dispvals = []
         lgpvals = []
         for pval in pvals:
@@ -140,7 +129,7 @@ def choose(
                     flag = True
                     break
             if flag:
-                return np.nan
+                return np.nan, np.nan
             else:
                 if lgdistribution["regressor"]:
                     if lgdistribution["serialization"] == "joblib":
@@ -152,14 +141,30 @@ def choose(
 
                     cond_mean = model.predict(np.array(lgpvals).reshape(1, -1))[0]
                     variance = lgdistribution["variance"]
-                    return random.gauss(cond_mean, variance)
+                    return cond_mean, variance
                 else:
-                    return np.nan
+                    return np.nan, np.nan
 
         else:
-            return random.gauss(
-                lgdistribution["mean"], math.sqrt(lgdistribution["variance"])
-            )
+            return lgdistribution["mean"], math.sqrt(lgdistribution["variance"])
+
+    def choose(
+        self,
+        node_info: Dict[str, Dict[str, CondGaussParams]],
+        pvals: List[Union[str, float]],
+    ) -> float:
+        """
+        Return value from ConditionalLogit node
+        params:
+        node_info: nodes info from distributions
+        pvals: parent values
+        """
+
+        cond_mean, variance = self.get_dist(node_info, pvals)
+        if not cond_mean or not variance:
+            return np.nan
+
+        return random.gauss(cond_mean, variance)
 
     def predict(
         self,

diff --git a/bamt/nodes/conditional_logit_node.py b/bamt/nodes/conditional_logit_node.py
@@ -106,16 +106,7 @@ def fit_parameters(self, data: DataFrame) -> Dict[str, Dict[str, LogitParams]]:
         return {"hybcprob": hycprob}
 
     @staticmethod
-    def choose(
-        node_info: Dict[str, Dict[str, LogitParams]], pvals: List[Union[str, float]]
-    ) -> str:
-        """
-        Return value from ConditionalLogit node
-        params:
-        node_info: nodes info from distributions
-        pvals: parent values
-        """
-
+    def get_dist(node_info, pvals, **kwargs):
         dispvals = []
         lgpvals = []
         for pval in pvals:
@@ -140,6 +131,32 @@ def choose(
 
             distribution = model.predict_proba(np.array(lgpvals).reshape(1, -1))[0]
 
+            if not kwargs.get("inner", False):
+                return distribution
+            else:
+                return distribution, lgdistribution
+        else:
+            if not kwargs.get("inner", False):
+                return np.array([100.0])
+            else:
+                return np.array([100.0]), lgdistribution
+
+    def choose(
+        self,
+        node_info: Dict[str, Dict[str, LogitParams]],
+        pvals: List[Union[str, float]],
+    ) -> str:
+        """
+        Return value from ConditionalLogit node
+        params:
+        node_info: nodes info from distributions
+        pvals: parent values
+        """
+
+        distribution, lgdistribution = self.get_dist(node_info, pvals, inner=True)
+
+        # JOBLIB
+        if len(lgdistribution["classes"]) > 1:
             rand = random.random()
             rindex = 0
             lbound = 0
@@ -152,7 +169,6 @@ def choose(
                 else:
                     lbound = ubound
             return str(lgdistribution["classes"][rindex])
-
         else:
             return str(lgdistribution["classes"][0])
 

diff --git a/bamt/nodes/conditional_mixture_gaussian_node.py b/bamt/nodes/conditional_mixture_gaussian_node.py
@@ -113,27 +113,21 @@ def fit_parameters(
         return {"hybcprob": hycprob}
 
     @staticmethod
-    def choose(
-        node_info: Dict[str, Dict[str, CondMixtureGaussParams]],
-        pvals: List[Union[str, float]],
-    ) -> Optional[float]:
-        """
-        Function to get value from ConditionalMixtureGaussian node
-        params:
-        node_info: nodes info from distributions
-        pvals: parent values
-        """
-        dispvals = []
+    def get_dist(node_info, pvals):
         lgpvals = []
+        dispvals = []
+
         for pval in pvals:
             if (isinstance(pval, str)) | (isinstance(pval, int)):
                 dispvals.append(pval)
             else:
                 lgpvals.append(pval)
+
         lgdistribution = node_info["hybcprob"][str(dispvals)]
         mean = lgdistribution["mean"]
         covariance = lgdistribution["covars"]
         w = lgdistribution["coef"]
+
         if len(w) != 0:
             if len(lgpvals) != 0:
                 indexes = [i for i in range(1, (len(lgpvals) + 1), 1)]
@@ -146,17 +140,40 @@ def choose(
                         covariances=covariance,
                     )
                     cond_gmm = gmm.condition(indexes, [lgpvals])
-                    sample = cond_gmm.sample(1)[0][0]
+                    return cond_gmm.means, cond_gmm.covariances, cond_gmm.priors
                 else:
-                    sample = np.nan
+                    return np.nan, np.nan, np.nan
             else:
                 n_comp = len(w)
                 gmm = GMM(
                     n_components=n_comp, priors=w, means=mean, covariances=covariance
                 )
-                sample = gmm.sample(1)[0][0]
+                return gmm.means, gmm.covariances, gmm.priors
         else:
-            sample = np.nan
+            return np.nan, np.nan, np.nan
+
+    def choose(
+        self,
+        node_info: Dict[str, Dict[str, CondMixtureGaussParams]],
+        pvals: List[Union[str, float]],
+    ) -> Optional[float]:
+        """
+        Function to get value from ConditionalMixtureGaussian node
+        params:
+        node_info: nodes info from distributions
+        pvals: parent values
+        """
+        mean, covariance, w = self.get_dist(node_info, pvals)
+
+        n_comp = len(w)
+
+        gmm = GMM(
+            n_components=n_comp,
+            priors=w,
+            means=mean,
+            covariances=covariance,
+        )
+        sample = gmm.sample(1)[0][0]
         return sample
 
     @staticmethod

diff --git a/bamt/nodes/discrete_node.py b/bamt/nodes/discrete_node.py
@@ -49,15 +49,25 @@ def worker(node: Type[BaseNode]) -> DiscreteParams:
                 tight_form = conditional_dist.to_dict("tight")
 
                 for comb, probs in zip(tight_form["index"], tight_form["data"]):
-                    cprob[str([str(i) for i in comb])] = probs
+                    if len(parents) > 1:
+                        cprob[str([str(i) for i in comb])] = probs
+                    else:
+                        cprob[f"['{comb}']"] = probs
             return {"cprob": cprob, "vals": vals}
 
         pool = ThreadPoolExecutor(num_workers)
         future = pool.submit(worker, self)
         return future.result()
 
     @staticmethod
-    def choose(node_info: Dict[str, Union[float, str]], pvals: List[str]) -> str:
+    def get_dist(node_info, pvals):
+        if not pvals:
+            return node_info["cprob"]
+        else:
+            # noinspection PyTypeChecker
+            return node_info["cprob"][str(pvals)]
+
+    def choose(self, node_info: Dict[str, Union[float, str]], pvals: List[str]) -> str:
         """
         Return value from discrete node
         params:
@@ -67,11 +77,9 @@ def choose(node_info: Dict[str, Union[float, str]], pvals: List[str]) -> str:
         rindex = 0
         random.seed()
         vals = node_info["vals"]
-        if not pvals:
-            dist = node_info["cprob"]
-        else:
-            # noinspection PyTypeChecker
-            dist = node_info["cprob"][str(pvals)]
+
+        dist = self.get_dist(node_info, pvals)
+
         lbound = 0
         ubound = 0
         rand = random.random()

diff --git a/bamt/nodes/gaussian_node.py b/bamt/nodes/gaussian_node.py
@@ -78,13 +78,8 @@ def fit_parameters(self, data: DataFrame) -> GaussianParams:
             }
 
     @staticmethod
-    def choose(node_info: GaussianParams, pvals: List[float]) -> float:
-        """
-        Return value from Logit node
-        params:
-        node_info: nodes info from distributions
-        pvals: parent values
-        """
+    def get_dist(node_info, pvals):
+        var = node_info["variance"]
         if pvals:
             for el in pvals:
                 if str(el) == "nan":
@@ -96,10 +91,20 @@ def choose(node_info: GaussianParams, pvals: List[float]) -> float:
                 model = pickle.loads(a)
 
             cond_mean = model.predict(np.array(pvals).reshape(1, -1))[0]
-            var = node_info["variance"]
-            return random.gauss(cond_mean, var)
+            return cond_mean, var
         else:
-            return random.gauss(node_info["mean"], math.sqrt(node_info["variance"]))
+            return node_info["mean"], math.sqrt(var)
+
+    def choose(self, node_info: GaussianParams, pvals: List[float]) -> float:
+        """
+        Return value from Logit node
+        params:
+        node_info: nodes info from distributions
+        pvals: parent values
+        """
+
+        cond_mean, var = self.get_dist(node_info, pvals)
+        return random.gauss(cond_mean, var)
 
     @staticmethod
     def predict(node_info: GaussianParams, pvals: List[float]) -> float:

diff --git a/bamt/nodes/logit_node.py b/bamt/nodes/logit_node.py
@@ -57,6 +57,19 @@ def fit_parameters(self, data: DataFrame) -> LogitParams:
             "serialization": serialization_name,
         }
 
+    @staticmethod
+    def get_dist(node_info, pvals):
+        if len(node_info["classes"]) > 1:
+            if node_info["serialization"] == "joblib":
+                model = joblib.load(node_info["classifier_obj"])
+            else:
+                # str_model = node_info["classifier_obj"].decode('latin1').replace('\'', '\"')
+                a = node_info["classifier_obj"].encode("latin1")
+                model = pickle.loads(a)
+            return model.predict_proba(np.array(pvals).reshape(1, -1))[0]
+        else:
+            return np.array([100.0])
+
     def choose(self, node_info: LogitParams, pvals: List[Union[float]]) -> str:
         """
         Return value from Logit node
@@ -67,29 +80,21 @@ def choose(self, node_info: LogitParams, pvals: List[Union[float]]) -> str:
 
         rindex = 0
 
-        if len(node_info["classes"]) > 1:
-            if node_info["serialization"] == "joblib":
-                model = joblib.load(node_info["classifier_obj"])
-            else:
-                # str_model = node_info["classifier_obj"].decode('latin1').replace('\'', '\"')
-                a = node_info["classifier_obj"].encode("latin1")
-                model = pickle.loads(a)
-            distribution = model.predict_proba(np.array(pvals).reshape(1, -1))[0]
+        distribution = self.get_dist(node_info, pvals)
 
-            # choose
+        if len(node_info["classes"]) > 1:
             rand = random.random()
             lbound = 0
             ubound = 0
             for interval in range(len(node_info["classes"])):
                 ubound += distribution[interval]
-                if lbound <= rand and rand < ubound:
+                if lbound <= rand < ubound:
                     rindex = interval
                     break
                 else:
                     lbound = ubound
 
             return str(node_info["classes"][rindex])
-
         else:
             return str(node_info["classes"][0])