Add CUDA JIT to calc_doppler_width() (#118)

* Add basic test for `calc_doppler_width()` * Refactor `calc_doppler_width()` and add test for vectorized implementation * Typecast to float * Add unwrapped cuda implementation of doppler_width Also typecast all global constants to float * Add wrapped cuda implementation of calc_doppler_width * Return cupy array by default * move test_broadening to restructure --------- Co-authored-by: Josh Shields <[email protected]>
tardis-sn · Sep 18, 2023 · da7f35d · da7f35d
1 parent a732a7a
commit da7f35d
Showing 1 changed file with 130 additions and 0 deletions.
diff --git a/stardis/radiation_field/opacities/opacities_solvers/tests/test_broadening.py b/stardis/radiation_field/opacities/opacities_solvers/tests/test_broadening.py
@@ -0,0 +1,130 @@
+import pytest
+import numpy as np
+from astropy import constants as const
+from numba import cuda
+
+from stardis.radiation_field.opacities.opacities_solvers.broadening import (
+    calc_doppler_width,
+    _calc_doppler_width_cuda,
+    calc_doppler_width_cuda,
+)
+
+GPUs_available = cuda.is_available()
+
+if GPUs_available:
+    import cupy as cp
+
+
+PI = np.pi
+SPEED_OF_LIGHT = const.c.cgs.value
+BOLTZMANN_CONSTANT = const.k_B.cgs.value
+PLANCK_CONSTANT = const.h.cgs.value
+RYDBERG_ENERGY = (const.h.cgs * const.c.cgs * const.Ryd.cgs).value
+ELEMENTARY_CHARGE = const.e.esu.value
+BOHR_RADIUS = const.a0.cgs.value
+VACUUM_ELECTRIC_PERMITTIVITY = 1 / (4 * PI)
+
+
+@pytest.mark.parametrize(
+    "calc_doppler_width_sample_values_input_nu_line,calc_doppler_width_sample_values_input_temperature,calc_doppler_width_sample_values_input_atomic_mass, calc_doppler_width_sample_values_expected_result",
+    [
+        (
+            SPEED_OF_LIGHT,
+            0.5,
+            BOLTZMANN_CONSTANT,
+            1.0,
+        ),
+        (
+            np.array(2 * [SPEED_OF_LIGHT]),
+            np.array(2 * [0.5]),
+            np.array(2 * [BOLTZMANN_CONSTANT]),
+            np.array(2 * [1.0]),
+        ),
+    ],
+)
+def test_calc_doppler_width_sample_values(
+    calc_doppler_width_sample_values_input_nu_line,
+    calc_doppler_width_sample_values_input_temperature,
+    calc_doppler_width_sample_values_input_atomic_mass,
+    calc_doppler_width_sample_values_expected_result,
+):
+    assert np.allclose(
+        calc_doppler_width(
+            calc_doppler_width_sample_values_input_nu_line,
+            calc_doppler_width_sample_values_input_temperature,
+            calc_doppler_width_sample_values_input_atomic_mass,
+        ),
+        calc_doppler_width_sample_values_expected_result,
+    )
+
+
+@pytest.mark.skipif(
+    not GPUs_available, reason="No GPU is available to test CUDA function"
+)
+@pytest.mark.parametrize(
+    "calc_doppler_width_cuda_unwrapped_sample_values_input_nu_line,calc_doppler_width_cuda_unwrapped_sample_values_input_temperature,calc_doppler_width_cuda_unwrapped_sample_values_input_atomic_mass,calc_doppler_width_cuda_unwrapped_sample_values_expected_result",
+    [
+        (
+            np.array(2 * [SPEED_OF_LIGHT]),
+            np.array(2 * [0.5]),
+            np.array(2 * [BOLTZMANN_CONSTANT]),
+            np.array(2 * [1.0]),
+        ),
+    ],
+)
+def test_calc_doppler_width_cuda_unwrapped_sample_values(
+    calc_doppler_width_cuda_unwrapped_sample_values_input_nu_line,
+    calc_doppler_width_cuda_unwrapped_sample_values_input_temperature,
+    calc_doppler_width_cuda_unwrapped_sample_values_input_atomic_mass,
+    calc_doppler_width_cuda_unwrapped_sample_values_expected_result,
+):
+    arg_list = (
+        calc_doppler_width_cuda_unwrapped_sample_values_input_nu_line,
+        calc_doppler_width_cuda_unwrapped_sample_values_input_temperature,
+        calc_doppler_width_cuda_unwrapped_sample_values_input_atomic_mass,
+    )
+
+    arg_list = tuple(map(cp.array, arg_list))
+    result_values = cp.empty_like(arg_list[0])
+
+    nthreads = 256
+    length = len(calc_doppler_width_cuda_unwrapped_sample_values_expected_result)
+    nblocks = 1 + (length // nthreads)
+
+    _calc_doppler_width_cuda[nblocks, nthreads](result_values, *arg_list)
+
+    assert np.allclose(
+        cp.asnumpy(result_values),
+        calc_doppler_width_cuda_unwrapped_sample_values_expected_result,
+    )
+
+
+@pytest.mark.skipif(
+    not GPUs_available, reason="No GPU is available to test CUDA function"
+)
+@pytest.mark.parametrize(
+    "calc_doppler_width_cuda_sample_values_input_nu_line, calc_doppler_width_cuda_sample_values_input_temperature, calc_doppler_width_cuda_sample_values_input_atomic_mass, calc_doppler_width_cuda_wrapped_sample_cuda_values_expected_result",
+    [
+        (
+            np.array(2 * [SPEED_OF_LIGHT]),
+            np.array(2 * [0.5]),
+            np.array(2 * [BOLTZMANN_CONSTANT]),
+            np.array(2 * [1.0]),
+        ),
+    ],
+)
+def test_calc_doppler_width_cuda_wrapped_sample_cuda_values(
+    calc_doppler_width_cuda_sample_values_input_nu_line,
+    calc_doppler_width_cuda_sample_values_input_temperature,
+    calc_doppler_width_cuda_sample_values_input_atomic_mass,
+    calc_doppler_width_cuda_wrapped_sample_cuda_values_expected_result,
+):
+    arg_list = (
+        calc_doppler_width_cuda_sample_values_input_nu_line,
+        calc_doppler_width_cuda_sample_values_input_temperature,
+        calc_doppler_width_cuda_sample_values_input_atomic_mass,
+    )
+    assert np.allclose(
+        calc_doppler_width_cuda(*map(cp.asarray, arg_list)),
+        calc_doppler_width_cuda_wrapped_sample_cuda_values_expected_result,
+    )