diff --git a/content/bayes_nn/bayes.md b/content/bayes_nn/bayes.md
new file mode 100644
index 0000000..45f7b0a
--- /dev/null
+++ b/content/bayes_nn/bayes.md
@@ -0,0 +1,318 @@
+# Bayesian Neural Network
+
+The usual Neural Network are optimized in way to get fixed value of weights and biases that allows the model perform specific task successfully. Instead in 
+Bayesian Neural Network the weights and biases are the distribution, this type of model could be treated as a ensemble of many neural networks trained by the Bayesian inference.
+
+Bayesian approach for the neural networks allows to estimate the uncertainty and make the decision of the model more robust according to the input data.
+
+
+
+### Difference between usual NN and BNN
+
+
+![Placeholder](../images/bayes_nn/diff.png)
+
+
+### Training of NN and BNN
+=== "NN"
+    ![Placeholder](../images/bayes_nn/trainingNN.png)
+    The parameters  ![formula](https://render.githubusercontent.com/render/math?math=\theta ) are optimized in order to minimaze the loss function
+
+=== "BNN"
+    ![Placeholder](../images/bayes_nn/bayesNN.png)
+     The process is to learn the probability distributions for weights and biases that maximize the likelihood of getting a high probability for the correct data/label ![formula](https://render.githubusercontent.com/render/math?math=D(x,y) ) pairs.
+    The parameters of the weights distributions - mean and standart deviation are the product of the loss function optimization
+
+#### Training Procedure
+    1. Introduce the prior distribution over model parameter w
+    2. Compute posterio p(w|D) using Bayesian rule
+    3. Make the average over the posterior distribution
+
+
+
+### Prediction of NN and BNN
+=== "NN"
+    ![Placeholder](../images/bayes_nn/PredictionNN.png)
+
+=== "BNN"
+    ![Placeholder](../images/bayes_nn/PredictionBNN.png)
+
+
+### Uncertainty
+The uncertainty that are quatified by the BNN are categorized in the next way:
+=== "Alletonic"
+    Alletonic - uncertainties due to the lack of knowledge, comes from data or enviroment 
+    ![formula](https://render.githubusercontent.com/render/math?math=p (\theta|D) )
+=== "Epistemic"
+    Epistemic - uncertainties of the model parameter 
+    ![formula](https://render.githubusercontent.com/render/math?math=p(y|x,\theta))
+
+
+
+
+
+
+
+## Packages
+The are several packages for the probabilistic neural network, the tensorflow probability and pyro are the most consistent
+
+=== "Tensorflow"
+    ```python linenums="1"  
+        pip install --upgrade tensorflow-probability
+    ```
+=== "Pyro"
+    ```python linenums="1"  
+        pip install pyro
+    ```
+
+
+## Modules Description:
+
+### Distribution and sampling
+
+=== "Tensorflow"
+
+=== "Pyro"
+
+### Distribution and sampling
+
+=== "Tensorflow"
+
+=== "Pyro"
+
+
+
+
+Let's consider simple linear regression as an example and compare it to the bayesian analog.
+
+## Linear Regression
+
+Lets consider simple dataset D(x, y) and we want to fit some linear function:
+y=ax+b+e, where a,b are learnable parameters and e is observation noise.
+
+### Synthetic dataset
+=== "Synthetic dataset"
+    ```python linenums="1"
+
+    import numpy as np
+    w0 = 0.125
+    b0 = 5.
+    x_range = [-20, 60]
+
+    def load_dataset(n=150, n_tst=150):
+        np.random.seed(43)
+        def s(x):
+            g = (x - x_range[0]) / (x_range[1] - x_range[0])
+            return 3 * (0.25 + g**2.)
+        x = (x_range[1] - x_range[0]) * np.random.rand(n) + x_range[0]
+        eps = np.random.randn(n) * s(x)
+        y = (w0 * x * (1. + np.sin(x)) + b0) + eps
+        x = x[..., np.newaxis]
+        x_tst = np.linspace(*x_range, num=n_tst).astype(np.float32)
+        x_tst = x_tst[..., np.newaxis]
+        return y, x, x_tst
+
+    y, x, x_tst = load_dataset()
+    ```
+
+### Probabilistic Linear regression
+=== "tensorflow_probability"
+
+    Let's consider you write your network model in a single `tf.function`.
+
+    ```python linenums="1"
+    import tensorflow as tf
+    import tensorflow_probability as tfp
+    tfd = tfp.distributions
+
+    # Build model.
+    model = tf.keras.Sequential([
+    tf.keras.layers.Dense(1),
+    tfp.layers.DistributionLambda(lambda t: tfd.Normal(loc=t, scale=1)),
+    ])
+
+    # Define the loss:
+    negloglik = lambda y, rv_y: -rv_y.log_prob(y)
+
+    # Do inference.
+    model.compile(optimizer=tf.optimizers.Adam(learning_rate=0.05), loss=negloglik)
+    model.fit(x, y, epochs=500, verbose=False)
+
+    # Make predictions.
+    yhat = model(x_tst)
+    ```
+    
+=== "pyro"
+
+    ```python linenums="1"
+    # coding: utf-8
+
+    from pyro.nn import PyroSample
+
+    # Specify model.
+
+    class BayesianRegression(PyroModule):
+        def __init__(self, in_features, out_features):
+            super().__init__()
+            self.linear = PyroModule[nn.Linear](in_features, out_features)
+            self.linear.weight = PyroSample(dist.Normal(0., 1.).expand([out_features, in_features]).to_event(2))
+            self.linear.bias = PyroSample(dist.Normal(0., 10.).expand([out_features]).to_event(1))
+
+        def forward(self, x, y=None):
+            sigma = pyro.sample("sigma", dist.Uniform(0., 10.))
+            mean = self.linear(x).squeeze(-1)
+            with pyro.plate("data", x.shape[0]):
+                obs = pyro.sample("obs", dist.Normal(mean, sigma), obs=y)
+            return mean
+
+
+
+    # Build model.
+    model = BayesianRegression()
+
+    # Fit model given data.
+    coeffs, linear_response, is_converged, num_iter = tfp.glm.fit(
+    model_matrix=features[:, tf.newaxis],
+    response=tf.cast(labels, dtype=tf.float32),
+    model=model)
+    # ==> coeffs is approximately [1.618] (We're golden!)
+
+    # Do inference.
+    model.compile(optimizer=tf.optimizers.Adam(learning_rate=0.01), loss=negloglik)
+    model.fit(x, y, epochs=1000, verbose=False);
+
+    # Profit.
+    [print(np.squeeze(w.numpy())) for w in model.weights];
+    yhat = model(x_tst)
+    assert isinstance(yhat, tfd.Distribution)
+
+    ```
+
+
+The output of the model:
+
+![Placeholder](../images/bayes_nn/lr.png)
+
+
+
+
+## Variational Autoencoder
+
+The generative models could be build using the bayesian neural network.
+The Variantional Autoencoder is the popular way for data synthethis.
+
+Let's consider the example of generating the images:
+
+The generating process consist of two steps:
+
+1. Samling the latent variable from prior distribution
+
+2. Drawing the sample from stochastic process ![formula](https://render.githubusercontent.com/render/math?math=x-p(z|x)) 
+
+Objective:
+
+![formula](https://render.githubusercontent.com/render/math?math=p(z)) the prior on the latent representation ![formula](https://render.githubusercontent.com/render/math?math=z) ,
+![formula](https://render.githubusercontent.com/render/math?math=q(z|x)), the variational encoder, and
+![formula](https://render.githubusercontent.com/render/math?math=p(x|z)), the decoder — how likely is the image x given the latent representation z.
+
+### Loss
+
+Once we define the procedure for the generation process the Objective function should be chosen for the optimization process. In order to train the network, we maximize the ELBO (Evidence Lower Bound) objective.
+
+
+### Prior
+p(z), the prior on the latent representation z,
+
+q(z|x), the variational encoder, and
+
+p(x|z), the decoder — how likely is the image x given the latent representation z.
+
+
+### Encoder and Decoder
+=== "tensorflow"
+
+    ```python linenums="1"
+    ```
+=== "pyro"
+
+    ```python linenums="1"
+    ```
+
+### Training
+=== "tensorflow"
+
+    ```python linenums="1"
+    ```
+=== "pyro"
+
+    ```python linenums="1"
+    ```
+
+
+### Results
+=== "tensorflow"
+
+    ```python linenums="1"
+    ```
+=== "pyro"
+
+    ```python linenums="1"
+    ```
+
+
+
+## Normalizing Flows
+
+### Defition
+
+=== "tensorflow"
+
+    ```python linenums="1"
+    ```
+=== "pyro"
+
+    ```python linenums="1"
+    ```
+
+### Training
+=== "tensorflow"
+
+    ```python linenums="1"
+    ```
+=== "pyro"
+
+    ```python linenums="1"
+    ```
+
+### Inference
+=== "tensorflow"
+
+    ```python linenums="1"
+    ```
+=== "pyro"
+
+    ```python linenums="1"
+    ```
+
+## Resources
+
+
+### Bayesian NN
+
+    1. https://arxiv.org/pdf/2007.06823.pdf
+    2. http://krasserm.github.io/2019/03/14/bayesian-neural-networks/
+    3. https://arxiv.org/pdf/1807.02811.pdf
+
+### Normalizing Flow:
+
+    1. https://arxiv.org/abs/1908.09257
+    2. https://arxiv.org/pdf/1505.05770.pdf
+
+### Variational AutoEncoder:
+
+    1. https://arxiv.org/abs/1312.6114
+    2. https://pyro.ai/examples/vae.html
+    3. https://www.tensorflow.org/probability/examples/Probabilistic_Layers_VAE
+
+
+
diff --git a/content/images/bayes_nn/PredictionBNN.png b/content/images/bayes_nn/PredictionBNN.png
new file mode 100644
index 0000000..341081f
Binary files /dev/null and b/content/images/bayes_nn/PredictionBNN.png differ
diff --git a/content/images/bayes_nn/PredictionNN.png b/content/images/bayes_nn/PredictionNN.png
new file mode 100644
index 0000000..0162cf5
Binary files /dev/null and b/content/images/bayes_nn/PredictionNN.png differ
diff --git a/content/images/bayes_nn/VAE/function.png b/content/images/bayes_nn/VAE/function.png
new file mode 100644
index 0000000..a5f87da
Binary files /dev/null and b/content/images/bayes_nn/VAE/function.png differ
diff --git a/content/images/bayes_nn/bayesNN.png b/content/images/bayes_nn/bayesNN.png
new file mode 100644
index 0000000..11def67
Binary files /dev/null and b/content/images/bayes_nn/bayesNN.png differ
diff --git a/content/images/bayes_nn/diff copy.png b/content/images/bayes_nn/diff copy.png
new file mode 100644
index 0000000..68afde3
Binary files /dev/null and b/content/images/bayes_nn/diff copy.png differ
diff --git a/content/images/bayes_nn/diff.png b/content/images/bayes_nn/diff.png
new file mode 100644
index 0000000..68afde3
Binary files /dev/null and b/content/images/bayes_nn/diff.png differ
diff --git a/content/images/bayes_nn/lr.png b/content/images/bayes_nn/lr.png
new file mode 100644
index 0000000..687f6ad
Binary files /dev/null and b/content/images/bayes_nn/lr.png differ
diff --git a/content/images/bayes_nn/trainingNN.png b/content/images/bayes_nn/trainingNN.png
new file mode 100644
index 0000000..8ed689b
Binary files /dev/null and b/content/images/bayes_nn/trainingNN.png differ
diff --git a/content/images/no_unc.png b/content/images/no_unc.png
new file mode 100644
index 0000000..c7015c5
Binary files /dev/null and b/content/images/no_unc.png differ
diff --git a/mkdocs.yml b/mkdocs.yml
index 6cf5dd4..03e4dd0 100644
--- a/mkdocs.yml
+++ b/mkdocs.yml
@@ -69,7 +69,8 @@ markdown_extensions:
   - pymdownx.tasklist:
       custom_checkbox: true
   - pymdownx.tilde
-
+  - pymdownx.arithmatex:
+      generic: true
 extra_javascript:
   - https://unpkg.com/mermaid@8.6/dist/mermaid.min.js
 
@@ -91,6 +92,8 @@ nav:
     - Introduction: starter/introduction.md
   - Optimization:
     - Model optimization: optimization/introduction.md
+    - Bayesian Optimization: optimization/bayes.md
+
   - Inference:
     - Direct inference:
       - TensorFlow 2: inference/tensorflow2.md
@@ -98,6 +101,8 @@ nav:
       - ONNX: inference/onnx.md
       - XGBoost: inference/xgboost.md
       - hls4ml: inference/hls4ml.md
+      - Bayesian NN: bayes_nn/bayes.md
+
     - Inference as a service:
       - Sonic/Triton: inference/sonic_triton.md
     - Integration checklist: inference/checklist.md
diff --git a/site/optimization/bayes.html b/site/optimization/bayes.html
new file mode 100644
index 0000000..1d20862
--- /dev/null
+++ b/site/optimization/bayes.html
@@ -0,0 +1,184 @@
+<!doctype html><html lang=en class=no-js> <head><meta charset=utf-8><meta name=viewport content="width=device-width,initial-scale=1"><meta name=description content="Documentation of the CMS Machine Learning Group"><meta name=author content="CMS Machine Learning Group"><link rel=canonical href=https://cms-ml.github.io/documentation/optimization/bayes.html><link rel=icon href=../images/favicon.png><meta name=generator content="mkdocs-1.1.2, mkdocs-material-7.1.3"><title>Bayesian Optimization - CMS Machine Learning Documentation</title><link rel=stylesheet href=../assets/stylesheets/main.e35208c4.min.css><link rel=stylesheet href=../assets/stylesheets/palette.ef6f36e2.min.css><meta name=theme-color content=#4051b5><link rel=preconnect href=https://fonts.gstatic.com crossorigin><link rel=stylesheet href="https://fonts.googleapis.com/css?family=Roboto:300,400,400i,700%7CRoboto+Mono&display=fallback"><style>:root{--md-text-font-family:"Roboto";--md-code-font-family:"Roboto Mono"}</style></head> <body dir=ltr data-md-color-scheme=preference data-md-color-primary=indigo data-md-color-accent=orange> <script>function __prefix(e){return new URL("..",location).pathname+"."+e}function __get(e,t=localStorage){return JSON.parse(t.getItem(__prefix(e)))}</script> <input class=md-toggle data-md-toggle=drawer type=checkbox id=__drawer autocomplete=off> <input class=md-toggle data-md-toggle=search type=checkbox id=__search autocomplete=off> <label class=md-overlay for=__drawer></label> <div data-md-component=skip> <a href=#bayesian-neural-network class=md-skip> Skip to content </a> </div> <div data-md-component=announce> </div> <header class=md-header data-md-component=header> <nav class="md-header__inner md-grid" aria-label=Header> <a href=.. title="CMS Machine Learning Documentation" class="md-header__button md-logo" aria-label="CMS Machine Learning Documentation" data-md-component=logo> <img src=../images/logo.png alt=logo> </a> <label class="md-header__button md-icon" for=__drawer> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 24 24"><path d="M3 6h18v2H3V6m0 5h18v2H3v-2m0 5h18v2H3v-2z"/></svg> </label> <div class=md-header__title data-md-component=header-title> <div class=md-header__ellipsis> <div class=md-header__topic> <span class=md-ellipsis> CMS Machine Learning Documentation </span> </div> <div class=md-header__topic data-md-component=header-topic> <span class=md-ellipsis> Bayesian Optimization </span> </div> </div> </div> <label class="md-header__button md-icon" for=__search> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 24 24"><path d="M9.5 3A6.5 6.5 0 0 1 16 9.5c0 1.61-.59 3.09-1.56 4.23l.27.27h.79l5 5-1.5 1.5-5-5v-.79l-.27-.27A6.516 6.516 0 0 1 9.5 16 6.5 6.5 0 0 1 3 9.5 6.5 6.5 0 0 1 9.5 3m0 2C7 5 5 7 5 9.5S7 14 9.5 14 14 12 14 9.5 12 5 9.5 5z"/></svg> </label> <div class=md-search data-md-component=search role=dialog> <label class=md-search__overlay for=__search></label> <div class=md-search__inner role=search> <form class=md-search__form name=search> <input type=text class=md-search__input name=query aria-label=Search placeholder=Search autocapitalize=off autocorrect=off autocomplete=off spellcheck=false data-md-component=search-query data-md-state=active required> <label class="md-search__icon md-icon" for=__search> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 24 24"><path d="M9.5 3A6.5 6.5 0 0 1 16 9.5c0 1.61-.59 3.09-1.56 4.23l.27.27h.79l5 5-1.5 1.5-5-5v-.79l-.27-.27A6.516 6.516 0 0 1 9.5 16 6.5 6.5 0 0 1 3 9.5 6.5 6.5 0 0 1 9.5 3m0 2C7 5 5 7 5 9.5S7 14 9.5 14 14 12 14 9.5 12 5 9.5 5z"/></svg> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 24 24"><path d="M20 11v2H8l5.5 5.5-1.42 1.42L4.16 12l7.92-7.92L13.5 5.5 8 11h12z"/></svg> </label> <button type=reset class="md-search__icon md-icon" aria-label=Clear tabindex=-1> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 24 24"><path d="M19 6.41 17.59 5 12 10.59 6.41 5 5 6.41 10.59 12 5 17.59 6.41 19 12 13.41 17.59 19 19 17.59 13.41 12 19 6.41z"/></svg> </button> </form> <div class=md-search__output> <div class=md-search__scrollwrap data-md-scrollfix> <div class=md-search-result data-md-component=search-result> <div class=md-search-result__meta> Initializing search </div> <ol class=md-search-result__list></ol> </div> </div> </div> </div> </div> <div class=md-header__source> <a href=https://github.com/cms-ml/documentation/ title="Go to repository" class=md-source data-md-component=source> <div class="md-source__icon md-icon"> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 448 512"><path d="M439.55 236.05 244 40.45a28.87 28.87 0 0 0-40.81 0l-40.66 40.63 51.52 51.52c27.06-9.14 52.68 16.77 43.39 43.68l49.66 49.66c34.23-11.8 61.18 31 35.47 56.69-26.49 26.49-70.21-2.87-56-37.34L240.22 199v121.85c25.3 12.54 22.26 41.85 9.08 55a34.34 34.34 0 0 1-48.55 0c-17.57-17.6-11.07-46.91 11.25-56v-123c-20.8-8.51-24.6-30.74-18.64-45L142.57 101 8.45 235.14a28.86 28.86 0 0 0 0 40.81l195.61 195.6a28.86 28.86 0 0 0 40.8 0l194.69-194.69a28.86 28.86 0 0 0 0-40.81z"/></svg> </div> <div class=md-source__repository> cms-ml/documentation </div> </a> </div> </nav> </header> <div class=md-container data-md-component=container> <main class=md-main data-md-component=main> <div class="md-main__inner md-grid"> <div class="md-sidebar md-sidebar--primary" data-md-component=sidebar data-md-type=navigation> <div class=md-sidebar__scrollwrap> <div class=md-sidebar__inner> <nav class="md-nav md-nav--primary" aria-label=Navigation data-md-level=0> <label class=md-nav__title for=__drawer> <a href=.. title="CMS Machine Learning Documentation" class="md-nav__button md-logo" aria-label="CMS Machine Learning Documentation" data-md-component=logo> <img src=../images/logo.png alt=logo> </a> CMS Machine Learning Documentation </label> <div class=md-nav__source> <a href=https://github.com/cms-ml/documentation/ title="Go to repository" class=md-source data-md-component=source> <div class="md-source__icon md-icon"> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 448 512"><path d="M439.55 236.05 244 40.45a28.87 28.87 0 0 0-40.81 0l-40.66 40.63 51.52 51.52c27.06-9.14 52.68 16.77 43.39 43.68l49.66 49.66c34.23-11.8 61.18 31 35.47 56.69-26.49 26.49-70.21-2.87-56-37.34L240.22 199v121.85c25.3 12.54 22.26 41.85 9.08 55a34.34 34.34 0 0 1-48.55 0c-17.57-17.6-11.07-46.91 11.25-56v-123c-20.8-8.51-24.6-30.74-18.64-45L142.57 101 8.45 235.14a28.86 28.86 0 0 0 0 40.81l195.61 195.6a28.86 28.86 0 0 0 40.8 0l194.69-194.69a28.86 28.86 0 0 0 0-40.81z"/></svg> </div> <div class=md-source__repository> cms-ml/documentation </div> </a> </div> <ul class=md-nav__list data-md-scrollfix> <li class=md-nav__item> <a href=../index.html class=md-nav__link> Home </a> </li> <li class="md-nav__item md-nav__item--nested"> <input class="md-nav__toggle md-toggle" data-md-toggle=__nav_2 type=checkbox id=__nav_2> <label class=md-nav__link for=__nav_2> Starter Guide <span class="md-nav__icon md-icon"></span> </label> <nav class=md-nav aria-label="Starter Guide" data-md-level=1> <label class=md-nav__title for=__nav_2> <span class="md-nav__icon md-icon"></span> Starter Guide </label> <ul class=md-nav__list data-md-scrollfix> <li class=md-nav__item> <a href=../starter/introduction.html class=md-nav__link> Introduction </a> </li> </ul> </nav> </li> <li class="md-nav__item md-nav__item--active md-nav__item--nested"> <input class="md-nav__toggle md-toggle" data-md-toggle=__nav_3 type=checkbox id=__nav_3 checked> <label class=md-nav__link for=__nav_3> Optimization <span class="md-nav__icon md-icon"></span> </label> <nav class=md-nav aria-label=Optimization data-md-level=1> <label class=md-nav__title for=__nav_3> <span class="md-nav__icon md-icon"></span> Optimization </label> <ul class=md-nav__list data-md-scrollfix> <li class=md-nav__item> <a href=introduction.html class=md-nav__link> Model optimization </a> </li> <li class="md-nav__item md-nav__item--active"> <input class="md-nav__toggle md-toggle" data-md-toggle=toc type=checkbox id=__toc> <label class="md-nav__link md-nav__link--active" for=__toc> Bayesian Optimization <span class="md-nav__icon md-icon"></span> </label> <a href=bayes.html class="md-nav__link md-nav__link--active"> Bayesian Optimization </a> <nav class="md-nav md-nav--secondary" aria-label="Table of contents"> <label class=md-nav__title for=__toc> <span class="md-nav__icon md-icon"></span> Table of contents </label> <ul class=md-nav__list data-md-component=toc data-md-scrollfix> <li class=md-nav__item> <a href=#difference-between-usual-nn-and-bayesian class=md-nav__link> Difference between usual NN and bayesian: </a> </li> <li class=md-nav__item> <a href=#training class=md-nav__link> Training </a> </li> <li class=md-nav__item> <a href=#prediction class=md-nav__link> Prediction </a> </li> <li class=md-nav__item> <a href=#uncertainty class=md-nav__link> Uncertainty: </a> </li> <li class=md-nav__item> <a href=#training-procedure class=md-nav__link> Training Procedure: </a> </li> <li class=md-nav__item> <a href=#package-installation class=md-nav__link> Package installation: </a> </li> <li class=md-nav__item> <a href=#linear-regression class=md-nav__link> Linear regression: </a> </li> <li class=md-nav__item> <a href=#bayesian-linear-regression class=md-nav__link> Bayesian Linear regression: </a> </li> <li class=md-nav__item> <a href=#bayesian-linear-regression_1 class=md-nav__link> Bayesian Linear regression: </a> </li> <li class=md-nav__item> <a href=#variational-autoencoder class=md-nav__link> Variational Autoencoder: </a> </li> <li class=md-nav__item> <a href=#model-selection-architecture-search class=md-nav__link> Model Selection, Architecture Search: </a> </li> <li class=md-nav__item> <a href=#resources class=md-nav__link> Resources: </a> </li> </ul> </nav> </li> </ul> </nav> </li> <li class="md-nav__item md-nav__item--nested"> <input class="md-nav__toggle md-toggle" data-md-toggle=__nav_4 type=checkbox id=__nav_4> <label class=md-nav__link for=__nav_4> Inference <span class="md-nav__icon md-icon"></span> </label> <nav class=md-nav aria-label=Inference data-md-level=1> <label class=md-nav__title for=__nav_4> <span class="md-nav__icon md-icon"></span> Inference </label> <ul class=md-nav__list data-md-scrollfix> <li class="md-nav__item md-nav__item--nested"> <input class="md-nav__toggle md-toggle" data-md-toggle=__nav_4_1 type=checkbox id=__nav_4_1> <label class=md-nav__link for=__nav_4_1> Direct inference <span class="md-nav__icon md-icon"></span> </label> <nav class=md-nav aria-label="Direct inference" data-md-level=2> <label class=md-nav__title for=__nav_4_1> <span class="md-nav__icon md-icon"></span> Direct inference </label> <ul class=md-nav__list data-md-scrollfix> <li class=md-nav__item> <a href=../inference/tensorflow2.html class=md-nav__link> TensorFlow 2 </a> </li> <li class=md-nav__item> <a href=../inference/tensorflow1.html class=md-nav__link> TensorFlow 1 </a> </li> <li class=md-nav__item> <a href=../inference/onnx.html class=md-nav__link> ONNX </a> </li> <li class=md-nav__item> <a href=../inference/xgboost.html class=md-nav__link> XGBoost </a> </li> <li class=md-nav__item> <a href=../inference/hls4ml.html class=md-nav__link> hls4ml </a> </li> <li class=md-nav__item> <a href=../inference/bayes.html class=md-nav__link> Bayesian Inference </a> </li> </ul> </nav> </li> <li class="md-nav__item md-nav__item--nested"> <input class="md-nav__toggle md-toggle" data-md-toggle=__nav_4_2 type=checkbox id=__nav_4_2> <label class=md-nav__link for=__nav_4_2> Inference as a service <span class="md-nav__icon md-icon"></span> </label> <nav class=md-nav aria-label="Inference as a service" data-md-level=2> <label class=md-nav__title for=__nav_4_2> <span class="md-nav__icon md-icon"></span> Inference as a service </label> <ul class=md-nav__list data-md-scrollfix> <li class=md-nav__item> <a href=../inference/sonic_triton.html class=md-nav__link> Sonic/Triton </a> </li> </ul> </nav> </li> <li class=md-nav__item> <a href=../inference/checklist.html class=md-nav__link> Integration checklist </a> </li> <li class=md-nav__item> <a href=../inference/performance.html class=md-nav__link> Performance </a> </li> <li class=md-nav__item> <a href=../inference/integrations.html class=md-nav__link> Successful integrations </a> </li> </ul> </nav> </li> </ul> </nav> </div> </div> </div> <div class="md-sidebar md-sidebar--secondary" data-md-component=sidebar data-md-type=toc> <div class=md-sidebar__scrollwrap> <div class=md-sidebar__inner> <nav class="md-nav md-nav--secondary" aria-label="Table of contents"> <label class=md-nav__title for=__toc> <span class="md-nav__icon md-icon"></span> Table of contents </label> <ul class=md-nav__list data-md-component=toc data-md-scrollfix> <li class=md-nav__item> <a href=#difference-between-usual-nn-and-bayesian class=md-nav__link> Difference between usual NN and bayesian: </a> </li> <li class=md-nav__item> <a href=#training class=md-nav__link> Training </a> </li> <li class=md-nav__item> <a href=#prediction class=md-nav__link> Prediction </a> </li> <li class=md-nav__item> <a href=#uncertainty class=md-nav__link> Uncertainty: </a> </li> <li class=md-nav__item> <a href=#training-procedure class=md-nav__link> Training Procedure: </a> </li> <li class=md-nav__item> <a href=#package-installation class=md-nav__link> Package installation: </a> </li> <li class=md-nav__item> <a href=#linear-regression class=md-nav__link> Linear regression: </a> </li> <li class=md-nav__item> <a href=#bayesian-linear-regression class=md-nav__link> Bayesian Linear regression: </a> </li> <li class=md-nav__item> <a href=#bayesian-linear-regression_1 class=md-nav__link> Bayesian Linear regression: </a> </li> <li class=md-nav__item> <a href=#variational-autoencoder class=md-nav__link> Variational Autoencoder: </a> </li> <li class=md-nav__item> <a href=#model-selection-architecture-search class=md-nav__link> Model Selection, Architecture Search: </a> </li> <li class=md-nav__item> <a href=#resources class=md-nav__link> Resources: </a> </li> </ul> </nav> </div> </div> </div> <div class=md-content data-md-component=content> <article class="md-content__inner md-typeset"> <a href=https://github.com/cms-ml/documentation/blob/master/content/optimization/bayes.md title="Edit this page" class="md-content__button md-icon"> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 24 24"><path d="M20.71 7.04c.39-.39.39-1.04 0-1.41l-2.34-2.34c-.37-.39-1.02-.39-1.41 0l-1.84 1.83 3.75 3.75M3 17.25V21h3.75L17.81 9.93l-3.75-3.75L3 17.25z"/></svg> </a> <h1 id=bayesian-neural-network>Bayesian Neural Network:<a class=headerlink href=#bayesian-neural-network title="Permanent link">&para;</a></h1> <p>The usual Neural Network are optimized in order to get fixed value of weights and biases. Instead Bayesian Neural Network the weights and biases are the distribution, and this type of model could be treated as a ensemble of many neural networks.</p> <p>Bayesian approach for the neural networks allows to estimate the uncertainty, and make the desicion of the model more robust. </p> <h2 id=difference-between-usual-nn-and-bayesian>Difference between usual NN and bayesian:<a class=headerlink href=#difference-between-usual-nn-and-bayesian title="Permanent link">&para;</a></h2> <p>Normal Neural Network | Bayesian Neural Network:</p> <p><img alt=Placeholder src=diff.png></p> <h2 id=training>Training<a class=headerlink href=#training title="Permanent link">&para;</a></h2> <div class=tabbed-set data-tabs=1:2><input checked=checked id=__tabbed_1_1 name=__tabbed_1 type=radio><label for=__tabbed_1_1>NN</label><div class=tabbed-content> <p><img alt=Placeholder src=trainingNN.png></p> </div> <input id=__tabbed_1_2 name=__tabbed_1 type=radio><label for=__tabbed_1_2>BNN</label><div class=tabbed-content> <p><img alt=Placeholder src=bayesNN.png></p> </div> </div> <h2 id=prediction>Prediction<a class=headerlink href=#prediction title="Permanent link">&para;</a></h2> <div class=tabbed-set data-tabs=2:2><input checked=checked id=__tabbed_2_1 name=__tabbed_2 type=radio><label for=__tabbed_2_1>NN</label><div class=tabbed-content> <p><img alt=Placeholder src=PredictionNN.png></p> </div> <input id=__tabbed_2_2 name=__tabbed_2 type=radio><label for=__tabbed_2_2>BNN</label><div class=tabbed-content> <p><img alt=Placeholder src=PredictionBNN.png></p> </div> </div> <h2 id=uncertainty>Uncertainty:<a class=headerlink href=#uncertainty title="Permanent link">&para;</a></h2> <div class=highlight><pre><span></span><code>- Alletonic - comes from data or enviroment *p(|D)*
+- Epistemic - uncertainties of the model parameter *p(y|w)*
+</code></pre></div> <h2 id=training-procedure>Training Procedure:<a class=headerlink href=#training-procedure title="Permanent link">&para;</a></h2> <div class=highlight><pre><span></span><code>1. Introduce the prior distribution over model parameter w
+2. Comput posterio p(w|D) using Bayesian rule
+3. Make the average over the posterior disrtibution
+</code></pre></div> <h2 id=package-installation>Package installation:<a class=headerlink href=#package-installation title="Permanent link">&para;</a></h2> <div class=tabbed-set data-tabs=3:2><input checked=checked id=__tabbed_3_1 name=__tabbed_3 type=radio><label for=__tabbed_3_1>Tensorflow</label><div class=tabbed-content> <table class=highlighttable><tr><td class=linenos><div class=linenodiv><pre><span></span>1</pre></div></td><td class=code><div class=highlight><pre><span></span><code>    <span class=n>pip</span> <span class=n>install</span> <span class=o>--</span><span class=n>upgrade</span> <span class=n>tensorflow</span><span class=o>-</span><span class=n>probability</span>
+</code></pre></div> </td></tr></table> </div> <input id=__tabbed_3_2 name=__tabbed_3 type=radio><label for=__tabbed_3_2>Pyro</label><div class=tabbed-content> <table class=highlighttable><tr><td class=linenos><div class=linenodiv><pre><span></span>1</pre></div></td><td class=code><div class=highlight><pre><span></span><code>    <span class=n>pip</span> <span class=n>install</span> <span class=n>pyro</span>
+</code></pre></div> </td></tr></table> </div> </div> <p>Let's consider simple linear regression as an example and compare it to the bayesian analog.</p> <h2 id=linear-regression>Linear regression:<a class=headerlink href=#linear-regression title="Permanent link">&para;</a></h2> <div class=tabbed-set data-tabs=4:1><input checked=checked id=__tabbed_4_1 name=__tabbed_4 type=radio><label for=__tabbed_4_1>tensorflow_probability</label><div class=tabbed-content> <p>Let's consider you write your network model in a single <code>tf.function</code>.</p> <table class=highlighttable><tr><td class=linenos><div class=linenodiv><pre><span></span> 1
+ 2
+ 3
+ 4
+ 5
+ 6
+ 7
+ 8
+ 9
+10
+11
+12
+13
+14
+15
+16</pre></div></td><td class=code><div class=highlight><pre><span></span><code><span class=kn>import</span> <span class=nn>tensorflow</span> <span class=k>as</span> <span class=nn>tf</span>
+<span class=kn>import</span> <span class=nn>tensorflow_probability</span> <span class=k>as</span> <span class=nn>tfp</span>
+<span class=n>tfd</span> <span class=o>=</span> <span class=n>tfp</span><span class=o>.</span><span class=n>distributions</span>
+
+<span class=c1># Build model.</span>
+<span class=n>model</span> <span class=o>=</span> <span class=n>tf</span><span class=o>.</span><span class=n>keras</span><span class=o>.</span><span class=n>Sequential</span><span class=p>([</span>
+<span class=n>tf</span><span class=o>.</span><span class=n>keras</span><span class=o>.</span><span class=n>layers</span><span class=o>.</span><span class=n>Dense</span><span class=p>(</span><span class=mi>1</span><span class=p>),</span>
+<span class=n>tfp</span><span class=o>.</span><span class=n>layers</span><span class=o>.</span><span class=n>DistributionLambda</span><span class=p>(</span><span class=k>lambda</span> <span class=n>t</span><span class=p>:</span> <span class=n>tfd</span><span class=o>.</span><span class=n>Normal</span><span class=p>(</span><span class=n>loc</span><span class=o>=</span><span class=n>t</span><span class=p>,</span> <span class=n>scale</span><span class=o>=</span><span class=mi>1</span><span class=p>)),</span>
+<span class=p>])</span>
+
+<span class=c1># Do inference.</span>
+<span class=n>model</span><span class=o>.</span><span class=n>compile</span><span class=p>(</span><span class=n>optimizer</span><span class=o>=</span><span class=n>tf</span><span class=o>.</span><span class=n>optimizers</span><span class=o>.</span><span class=n>Adam</span><span class=p>(</span><span class=n>learning_rate</span><span class=o>=</span><span class=mf>0.05</span><span class=p>),</span> <span class=n>loss</span><span class=o>=</span><span class=n>negloglik</span><span class=p>)</span>
+<span class=n>model</span><span class=o>.</span><span class=n>fit</span><span class=p>(</span><span class=n>x</span><span class=p>,</span> <span class=n>y</span><span class=p>,</span> <span class=n>epochs</span><span class=o>=</span><span class=mi>500</span><span class=p>,</span> <span class=n>verbose</span><span class=o>=</span><span class=kc>False</span><span class=p>)</span>
+
+<span class=c1># Make predictions.</span>
+<span class=n>yhat</span> <span class=o>=</span> <span class=n>model</span><span class=p>(</span><span class=n>x_tst</span><span class=p>)</span>
+</code></pre></div> </td></tr></table> </div> </div> <p>The output of the model:</p> <p><img alt=Placeholder src=lr.png></p> <h2 id=bayesian-linear-regression>Bayesian Linear regression:<a class=headerlink href=#bayesian-linear-regression title="Permanent link">&para;</a></h2> <div class=tabbed-set data-tabs=5:1><input checked=checked id=__tabbed_5_1 name=__tabbed_5 type=radio><label for=__tabbed_5_1>tensorflow_probability</label><div class=tabbed-content> <p>Let's consider you write your network model in a single <code>tf.function</code>.</p> <table class=highlighttable><tr><td class=linenos><div class=linenodiv><pre><span></span> 1
+ 2
+ 3
+ 4
+ 5
+ 6
+ 7
+ 8
+ 9
+10
+11
+12
+13
+14
+15
+16
+17
+18
+19
+20
+21
+22
+23
+24
+25
+26
+27
+28
+29
+30
+31
+32
+33
+34
+35</pre></div></td><td class=code><div class=highlight><pre><span></span><code><span class=c1># coding: utf-8</span>
+
+<span class=kn>import</span> <span class=nn>tensorflow</span> <span class=k>as</span> <span class=nn>tf</span>
+<span class=kn>import</span> <span class=nn>tensorflow_probability</span> <span class=k>as</span> <span class=nn>tfp</span>
+
+<span class=c1># Pretend to load synthetic data set.</span>
+<span class=n>features</span> <span class=o>=</span> <span class=n>tfp</span><span class=o>.</span><span class=n>distributions</span><span class=o>.</span><span class=n>Normal</span><span class=p>(</span><span class=n>loc</span><span class=o>=</span><span class=mf>0.</span><span class=p>,</span> <span class=n>scale</span><span class=o>=</span><span class=mf>1.</span><span class=p>)</span><span class=o>.</span><span class=n>sample</span><span class=p>(</span><span class=nb>int</span><span class=p>(</span><span class=mf>100e3</span><span class=p>))</span>
+<span class=n>labels</span> <span class=o>=</span> <span class=n>tfp</span><span class=o>.</span><span class=n>distributions</span><span class=o>.</span><span class=n>Bernoulli</span><span class=p>(</span><span class=n>logits</span><span class=o>=</span><span class=mf>1.618</span> <span class=o>*</span> <span class=n>features</span><span class=p>)</span><span class=o>.</span><span class=n>sample</span><span class=p>()</span>
+
+<span class=c1># Specify model.</span>
+<span class=n>model</span> <span class=o>=</span> <span class=n>tfp</span><span class=o>.</span><span class=n>glm</span><span class=o>.</span><span class=n>Bernoulli</span><span class=p>()</span>
+
+<span class=c1># Fit model given data.</span>
+<span class=n>coeffs</span><span class=p>,</span> <span class=n>linear_response</span><span class=p>,</span> <span class=n>is_converged</span><span class=p>,</span> <span class=n>num_iter</span> <span class=o>=</span> <span class=n>tfp</span><span class=o>.</span><span class=n>glm</span><span class=o>.</span><span class=n>fit</span><span class=p>(</span>
+<span class=n>model_matrix</span><span class=o>=</span><span class=n>features</span><span class=p>[:,</span> <span class=n>tf</span><span class=o>.</span><span class=n>newaxis</span><span class=p>],</span>
+<span class=n>response</span><span class=o>=</span><span class=n>tf</span><span class=o>.</span><span class=n>cast</span><span class=p>(</span><span class=n>labels</span><span class=p>,</span> <span class=n>dtype</span><span class=o>=</span><span class=n>tf</span><span class=o>.</span><span class=n>float32</span><span class=p>),</span>
+<span class=n>model</span><span class=o>=</span><span class=n>model</span><span class=p>)</span>
+<span class=c1># ==&gt; coeffs is approximately [1.618] (We&#39;re golden!)</span>
+
+<span class=c1># Build model.</span>
+<span class=n>model</span> <span class=o>=</span> <span class=n>tf</span><span class=o>.</span><span class=n>keras</span><span class=o>.</span><span class=n>Sequential</span><span class=p>([</span>
+<span class=n>tf</span><span class=o>.</span><span class=n>keras</span><span class=o>.</span><span class=n>layers</span><span class=o>.</span><span class=n>Dense</span><span class=p>(</span><span class=mi>1</span> <span class=o>+</span> <span class=mi>1</span><span class=p>),</span>
+<span class=n>tfp</span><span class=o>.</span><span class=n>layers</span><span class=o>.</span><span class=n>DistributionLambda</span><span class=p>(</span>
+    <span class=k>lambda</span> <span class=n>t</span><span class=p>:</span> <span class=n>tfd</span><span class=o>.</span><span class=n>Normal</span><span class=p>(</span><span class=n>loc</span><span class=o>=</span><span class=n>t</span><span class=p>[</span><span class=o>...</span><span class=p>,</span> <span class=p>:</span><span class=mi>1</span><span class=p>],</span>
+                        <span class=n>scale</span><span class=o>=</span><span class=mf>1e-3</span> <span class=o>+</span> <span class=n>tf</span><span class=o>.</span><span class=n>math</span><span class=o>.</span><span class=n>softplus</span><span class=p>(</span><span class=mf>0.05</span> <span class=o>*</span> <span class=n>t</span><span class=p>[</span><span class=o>...</span><span class=p>,</span><span class=mi>1</span><span class=p>:]))),</span>
+<span class=p>])</span>
+
+<span class=c1># Do inference.</span>
+<span class=n>model</span><span class=o>.</span><span class=n>compile</span><span class=p>(</span><span class=n>optimizer</span><span class=o>=</span><span class=n>tf</span><span class=o>.</span><span class=n>optimizers</span><span class=o>.</span><span class=n>Adam</span><span class=p>(</span><span class=n>learning_rate</span><span class=o>=</span><span class=mf>0.01</span><span class=p>),</span> <span class=n>loss</span><span class=o>=</span><span class=n>negloglik</span><span class=p>)</span>
+<span class=n>model</span><span class=o>.</span><span class=n>fit</span><span class=p>(</span><span class=n>x</span><span class=p>,</span> <span class=n>y</span><span class=p>,</span> <span class=n>epochs</span><span class=o>=</span><span class=mi>1000</span><span class=p>,</span> <span class=n>verbose</span><span class=o>=</span><span class=kc>False</span><span class=p>);</span>
+
+<span class=c1># Profit.</span>
+<span class=p>[</span><span class=nb>print</span><span class=p>(</span><span class=n>np</span><span class=o>.</span><span class=n>squeeze</span><span class=p>(</span><span class=n>w</span><span class=o>.</span><span class=n>numpy</span><span class=p>()))</span> <span class=k>for</span> <span class=n>w</span> <span class=ow>in</span> <span class=n>model</span><span class=o>.</span><span class=n>weights</span><span class=p>];</span>
+<span class=n>yhat</span> <span class=o>=</span> <span class=n>model</span><span class=p>(</span><span class=n>x_tst</span><span class=p>)</span>
+<span class=k>assert</span> <span class=nb>isinstance</span><span class=p>(</span><span class=n>yhat</span><span class=p>,</span> <span class=n>tfd</span><span class=o>.</span><span class=n>Distribution</span><span class=p>)</span>
+</code></pre></div> </td></tr></table> </div> </div> <p><img alt=Placeholder src=lr.png></p> <h2 id=bayesian-linear-regression_1>Bayesian Linear regression:<a class=headerlink href=#bayesian-linear-regression_1 title="Permanent link">&para;</a></h2> <div class=tabbed-set data-tabs=6:1><input checked=checked id=__tabbed_6_1 name=__tabbed_6 type=radio><label for=__tabbed_6_1>tensorflow_probability</label><div class=tabbed-content> <p>Let's consider you write your network model in a single <code>tf.function</code>.</p> <table class=highlighttable><tr><td class=linenos><div class=linenodiv><pre><span></span> 1
+ 2
+ 3
+ 4
+ 5
+ 6
+ 7
+ 8
+ 9
+10
+11
+12
+13
+14
+15
+16
+17
+18
+19
+20
+21
+22
+23
+24
+25
+26
+27
+28
+29
+30
+31
+32
+33
+34
+35
+36
+37</pre></div></td><td class=code><div class=highlight><pre><span></span><code><span class=c1># Specify the surrogate posterior over `keras.layers.Dense` `kernel` and `bias`.</span>
+<span class=k>def</span> <span class=nf>posterior_mean_field</span><span class=p>(</span><span class=n>kernel_size</span><span class=p>,</span> <span class=n>bias_size</span><span class=o>=</span><span class=mi>0</span><span class=p>,</span> <span class=n>dtype</span><span class=o>=</span><span class=kc>None</span><span class=p>):</span>
+    <span class=n>n</span> <span class=o>=</span> <span class=n>kernel_size</span> <span class=o>+</span> <span class=n>bias_size</span>
+    <span class=n>c</span> <span class=o>=</span> <span class=n>np</span><span class=o>.</span><span class=n>log</span><span class=p>(</span><span class=n>np</span><span class=o>.</span><span class=n>expm1</span><span class=p>(</span><span class=mf>1.</span><span class=p>))</span>
+    <span class=k>return</span> <span class=n>tf</span><span class=o>.</span><span class=n>keras</span><span class=o>.</span><span class=n>Sequential</span><span class=p>([</span>
+        <span class=n>tfp</span><span class=o>.</span><span class=n>layers</span><span class=o>.</span><span class=n>VariableLayer</span><span class=p>(</span><span class=mi>2</span> <span class=o>*</span> <span class=n>n</span><span class=p>,</span> <span class=n>dtype</span><span class=o>=</span><span class=n>dtype</span><span class=p>),</span>
+        <span class=n>tfp</span><span class=o>.</span><span class=n>layers</span><span class=o>.</span><span class=n>DistributionLambda</span><span class=p>(</span><span class=k>lambda</span> <span class=n>t</span><span class=p>:</span> <span class=n>tfd</span><span class=o>.</span><span class=n>Independent</span><span class=p>(</span>
+            <span class=n>tfd</span><span class=o>.</span><span class=n>Normal</span><span class=p>(</span><span class=n>loc</span><span class=o>=</span><span class=n>t</span><span class=p>[</span><span class=o>...</span><span class=p>,</span> <span class=p>:</span><span class=n>n</span><span class=p>],</span>
+                        <span class=n>scale</span><span class=o>=</span><span class=mf>1e-5</span> <span class=o>+</span> <span class=n>tf</span><span class=o>.</span><span class=n>nn</span><span class=o>.</span><span class=n>softplus</span><span class=p>(</span><span class=n>c</span> <span class=o>+</span> <span class=n>t</span><span class=p>[</span><span class=o>...</span><span class=p>,</span> <span class=n>n</span><span class=p>:])),</span>
+            <span class=n>reinterpreted_batch_ndims</span><span class=o>=</span><span class=mi>1</span><span class=p>)),</span>
+    <span class=p>])</span>
+
+<span class=c1># Specify the prior over `keras.layers.Dense` `kernel` and `bias`.</span>
+<span class=k>def</span> <span class=nf>prior_trainable</span><span class=p>(</span><span class=n>kernel_size</span><span class=p>,</span> <span class=n>bias_size</span><span class=o>=</span><span class=mi>0</span><span class=p>,</span> <span class=n>dtype</span><span class=o>=</span><span class=kc>None</span><span class=p>):</span>
+    <span class=n>n</span> <span class=o>=</span> <span class=n>kernel_size</span> <span class=o>+</span> <span class=n>bias_size</span>
+    <span class=k>return</span> <span class=n>tf</span><span class=o>.</span><span class=n>keras</span><span class=o>.</span><span class=n>Sequential</span><span class=p>([</span>
+        <span class=n>tfp</span><span class=o>.</span><span class=n>layers</span><span class=o>.</span><span class=n>VariableLayer</span><span class=p>(</span><span class=n>n</span><span class=p>,</span> <span class=n>dtype</span><span class=o>=</span><span class=n>dtype</span><span class=p>),</span>
+        <span class=n>tfp</span><span class=o>.</span><span class=n>layers</span><span class=o>.</span><span class=n>DistributionLambda</span><span class=p>(</span><span class=k>lambda</span> <span class=n>t</span><span class=p>:</span> <span class=n>tfd</span><span class=o>.</span><span class=n>Independent</span><span class=p>(</span>
+            <span class=n>tfd</span><span class=o>.</span><span class=n>Normal</span><span class=p>(</span><span class=n>loc</span><span class=o>=</span><span class=n>t</span><span class=p>,</span> <span class=n>scale</span><span class=o>=</span><span class=mi>1</span><span class=p>),</span>
+            <span class=n>reinterpreted_batch_ndims</span><span class=o>=</span><span class=mi>1</span><span class=p>)),</span>
+    <span class=p>])</span>
+
+
+<span class=c1># Build model.</span>
+<span class=n>model</span> <span class=o>=</span> <span class=n>tf</span><span class=o>.</span><span class=n>keras</span><span class=o>.</span><span class=n>Sequential</span><span class=p>([</span>
+<span class=n>tfp</span><span class=o>.</span><span class=n>layers</span><span class=o>.</span><span class=n>DenseVariational</span><span class=p>(</span><span class=mi>1</span><span class=p>,</span> <span class=n>posterior_mean_field</span><span class=p>,</span> <span class=n>prior_trainable</span><span class=p>,</span> <span class=n>kl_weight</span><span class=o>=</span><span class=mi>1</span><span class=o>/</span><span class=n>x</span><span class=o>.</span><span class=n>shape</span><span class=p>[</span><span class=mi>0</span><span class=p>]),</span>
+<span class=n>tfp</span><span class=o>.</span><span class=n>layers</span><span class=o>.</span><span class=n>DistributionLambda</span><span class=p>(</span><span class=k>lambda</span> <span class=n>t</span><span class=p>:</span> <span class=n>tfd</span><span class=o>.</span><span class=n>Normal</span><span class=p>(</span><span class=n>loc</span><span class=o>=</span><span class=n>t</span><span class=p>,</span> <span class=n>scale</span><span class=o>=</span><span class=mi>1</span><span class=p>)),</span>
+<span class=p>])</span>
+
+<span class=c1># Do inference.</span>
+<span class=n>model</span><span class=o>.</span><span class=n>compile</span><span class=p>(</span><span class=n>optimizer</span><span class=o>=</span><span class=n>tf</span><span class=o>.</span><span class=n>optimizers</span><span class=o>.</span><span class=n>Adam</span><span class=p>(</span><span class=n>learning_rate</span><span class=o>=</span><span class=mf>0.01</span><span class=p>),</span> <span class=n>loss</span><span class=o>=</span><span class=n>negloglik</span><span class=p>)</span>
+<span class=n>model</span><span class=o>.</span><span class=n>fit</span><span class=p>(</span><span class=n>x</span><span class=p>,</span> <span class=n>y</span><span class=p>,</span> <span class=n>epochs</span><span class=o>=</span><span class=mi>1000</span><span class=p>,</span> <span class=n>verbose</span><span class=o>=</span><span class=kc>False</span><span class=p>);</span>
+
+<span class=c1># Profit.</span>
+<span class=p>[</span><span class=nb>print</span><span class=p>(</span><span class=n>np</span><span class=o>.</span><span class=n>squeeze</span><span class=p>(</span><span class=n>w</span><span class=o>.</span><span class=n>numpy</span><span class=p>()))</span> <span class=k>for</span> <span class=n>w</span> <span class=ow>in</span> <span class=n>model</span><span class=o>.</span><span class=n>weights</span><span class=p>];</span>
+<span class=n>yhat</span> <span class=o>=</span> <span class=n>model</span><span class=p>(</span><span class=n>x_tst</span><span class=p>)</span>
+<span class=k>assert</span> <span class=nb>isinstance</span><span class=p>(</span><span class=n>yhat</span><span class=p>,</span> <span class=n>tfd</span><span class=o>.</span><span class=n>Distribution</span><span class=p>)</span>
+</code></pre></div> </td></tr></table> </div> </div> <p><img alt=Placeholder src=lr.png></p> <p>Put here some conclusion;</p> <h2 id=variational-autoencoder>Variational Autoencoder:<a class=headerlink href=#variational-autoencoder title="Permanent link">&para;</a></h2> <p>The Variantional Autoencoder</p> <h2 id=model-selection-architecture-search>Model Selection, Architecture Search:<a class=headerlink href=#model-selection-architecture-search title="Permanent link">&para;</a></h2> <h2 id=resources>Resources:<a class=headerlink href=#resources title="Permanent link">&para;</a></h2> <div class=highlight><pre><span></span><code>1. https://arxiv.org/pdf/2007.06823.pdf
+2. http://krasserm.github.io/2019/03/14/bayesian-neural-networks/
+3. https://arxiv.org/pdf/1807.02811.pdf
+</code></pre></div> <hr> <div class=md-source-date> <small> Last update: <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">May 17, 2021</span> </small> </div> </article> </div> </div> </main> <footer class=md-footer> <nav class="md-footer__inner md-grid" aria-label=Footer> <a href=introduction.html class="md-footer__link md-footer__link--prev" rel=prev> <div class="md-footer__button md-icon"> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 24 24"><path d="M20 11v2H8l5.5 5.5-1.42 1.42L4.16 12l7.92-7.92L13.5 5.5 8 11h12z"/></svg> </div> <div class=md-footer__title> <div class=md-ellipsis> <span class=md-footer__direction> Previous </span> Model optimization </div> </div> </a> <a href=../inference/tensorflow2.html class="md-footer__link md-footer__link--next" rel=next> <div class=md-footer__title> <div class=md-ellipsis> <span class=md-footer__direction> Next </span> TensorFlow 2 </div> </div> <div class="md-footer__button md-icon"> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 24 24"><path d="M4 11v2h12l-5.5 5.5 1.42 1.42L19.84 12l-7.92-7.92L10.5 5.5 16 11H4z"/></svg> </div> </a> </nav> <div class="md-footer-meta md-typeset"> <div class="md-footer-meta__inner md-grid"> <div class=md-footer-copyright> <div class=md-footer-copyright__highlight> Copyright &copy; 2020 CMS Machine Learning Group </div> Made with <a href=https://squidfunk.github.io/mkdocs-material/ target=_blank rel=noopener> Material for MkDocs </a> </div> <div class=md-footer-social> <a href=https://github.com/cms-ml target=_blank rel=noopener title=github.com class=md-footer-social__link> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 480 512"><path d="M186.1 328.7c0 20.9-10.9 55.1-36.7 55.1s-36.7-34.2-36.7-55.1 10.9-55.1 36.7-55.1 36.7 34.2 36.7 55.1zM480 278.2c0 31.9-3.2 65.7-17.5 95-37.9 76.6-142.1 74.8-216.7 74.8-75.8 0-186.2 2.7-225.6-74.8-14.6-29-20.2-63.1-20.2-95 0-41.9 13.9-81.5 41.5-113.6-5.2-15.8-7.7-32.4-7.7-48.8 0-21.5 4.9-32.3 14.6-51.8 45.3 0 74.3 9 108.8 36 29-6.9 58.8-10 88.7-10 27 0 54.2 2.9 80.4 9.2 34-26.7 63-35.2 107.8-35.2 9.8 19.5 14.6 30.3 14.6 51.8 0 16.4-2.6 32.7-7.7 48.2 27.5 32.4 39 72.3 39 114.2zm-64.3 50.5c0-43.9-26.7-82.6-73.5-82.6-18.9 0-37 3.4-56 6-14.9 2.3-29.8 3.2-45.1 3.2-15.2 0-30.1-.9-45.1-3.2-18.7-2.6-37-6-56-6-46.8 0-73.5 38.7-73.5 82.6 0 87.8 80.4 101.3 150.4 101.3h48.2c70.3 0 150.6-13.4 150.6-101.3zm-82.6-55.1c-25.8 0-36.7 34.2-36.7 55.1s10.9 55.1 36.7 55.1 36.7-34.2 36.7-55.1-10.9-55.1-36.7-55.1z"/></svg> </a> <a href=https://hub.docker.com/orgs/cmsml/repositories target=_blank rel=noopener title=hub.docker.com class=md-footer-social__link> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 640 512"><path d="M349.9 236.3h-66.1v-59.4h66.1v59.4zm0-204.3h-66.1v60.7h66.1V32zm78.2 144.8H362v59.4h66.1v-59.4zm-156.3-72.1h-66.1v60.1h66.1v-60.1zm78.1 0h-66.1v60.1h66.1v-60.1zm276.8 100c-14.4-9.7-47.6-13.2-73.1-8.4-3.3-24-16.7-44.9-41.1-63.7l-14-9.3-9.3 14c-18.4 27.8-23.4 73.6-3.7 103.8-8.7 4.7-25.8 11.1-48.4 10.7H2.4c-8.7 50.8 5.8 116.8 44 162.1 37.1 43.9 92.7 66.2 165.4 66.2 157.4 0 273.9-72.5 328.4-204.2 21.4.4 67.6.1 91.3-45.2 1.5-2.5 6.6-13.2 8.5-17.1l-13.3-8.9zm-511.1-27.9h-66v59.4h66.1v-59.4zm78.1 0h-66.1v59.4h66.1v-59.4zm78.1 0h-66.1v59.4h66.1v-59.4zm-78.1-72.1h-66.1v60.1h66.1v-60.1z"/></svg> </a> <a href=https://hypernews.cern.ch/HyperNews/CMS/get/machine-learning.html target=_blank rel=noopener title=hypernews.cern.ch class=md-footer-social__link> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 512 512"><path d="M256 32C114.6 32 0 125.1 0 240c0 49.6 21.4 95 57 130.7C44.5 421.1 2.7 466 2.2 466.5c-2.2 2.3-2.8 5.7-1.5 8.7S4.8 480 8 480c66.3 0 116-31.8 140.6-51.4 32.7 12.3 69 19.4 107.4 19.4 141.4 0 256-93.1 256-208S397.4 32 256 32zM128 272c-17.7 0-32-14.3-32-32s14.3-32 32-32 32 14.3 32 32-14.3 32-32 32zm128 0c-17.7 0-32-14.3-32-32s14.3-32 32-32 32 14.3 32 32-14.3 32-32 32zm128 0c-17.7 0-32-14.3-32-32s14.3-32 32-32 32 14.3 32 32-14.3 32-32 32z"/></svg> </a> <a href=mailto:hn-cms-machine-learning@cern.ch target=_blank rel=noopener title class=md-footer-social__link> <svg xmlns=http://www.w3.org/2000/svg viewbox="0 0 512 512"><path d="M502.3 190.8c3.9-3.1 9.7-.2 9.7 4.7V400c0 26.5-21.5 48-48 48H48c-26.5 0-48-21.5-48-48V195.6c0-5 5.7-7.8 9.7-4.7 22.4 17.4 52.1 39.5 154.1 113.6 21.1 15.4 56.7 47.8 92.2 47.6 35.7.3 72-32.8 92.3-47.6 102-74.1 131.6-96.3 154-113.7zM256 320c23.2.4 56.6-29.2 73.4-41.4 132.7-96.3 142.8-104.7 173.4-128.7 5.8-4.5 9.2-11.5 9.2-18.9v-19c0-26.5-21.5-48-48-48H48C21.5 64 0 85.5 0 112v19c0 7.4 3.4 14.3 9.2 18.9 30.6 23.9 40.7 32.4 173.4 128.7 16.8 12.2 50.2 41.8 73.4 41.4z"/></svg> </a> </div> </div> </div> </footer> </div> <div class=md-dialog data-md-component=dialog> <div class="md-dialog__inner md-typeset"></div> </div> <script id=__config type=application/json>{"base": "..", "features": ["instant"], "translations": {"clipboard.copy": "Copy to clipboard", "clipboard.copied": "Copied to clipboard", "search.config.lang": "en", "search.config.pipeline": "trimmer, stopWordFilter", "search.config.separator": "[\\s\\-]+", "search.placeholder": "Search", "search.result.placeholder": "Type to start searching", "search.result.none": "No matching documents", "search.result.one": "1 matching document", "search.result.other": "# matching documents", "search.result.more.one": "1 more on this page", "search.result.more.other": "# more on this page", "search.result.term.missing": "Missing"}, "search": "../assets/javascripts/workers/search.fe42c31b.min.js", "version": null}</script> <script src=../assets/javascripts/bundle.4ea5477f.min.js></script> <script src=https://unpkg.com/mermaid@8.6/dist/mermaid.min.js></script> </body> </html>
\ No newline at end of file