From a7246e118cf2846b03f4872a1b78adf09e23f4bc Mon Sep 17 00:00:00 2001
From: Kazuki Adachi <kazuki.adachi.xy@gmail.com>
Date: Mon, 25 Mar 2024 18:37:16 +0900
Subject: [PATCH] Update test for CosineSimilarity Metric (#3218)

* add cosine similarity

* update doc for cosine similarity metric

* fix the position of the CosineSimilarity

* Update ignite/contrib/metrics/cosine_similarity.py

Co-authored-by: vfdev <vfdev.5@gmail.com>

* autopep8 fix

* move CosineSimilarity from contrib.metrics to metrics

* autopep8 fix

* fix typo

* fix typo

* Update ignite/metrics/cosine_similarity.py

Co-authored-by: vfdev <vfdev.5@gmail.com>

* autopep8 fix

* Update ignite/metrics/cosine_similarity.py

Co-authored-by: vfdev <vfdev.5@gmail.com>

* fix formatting

* autopep8 fix

* fix formatting

* autopep8 fix

* add test for CosineSimilarity metric

* autopep8 fix

* fix error when testing in xla

* update test for CosineSimilarity metric

* update test for CosineSimilarity metric

---------

Co-authored-by: vfdev <vfdev.5@gmail.com>
Co-authored-by: kzkadc <kzkadc@users.noreply.github.com>
---
 .../ignite/metrics/test_cosine_similarity.py  | 179 ++++++------------
 1 file changed, 56 insertions(+), 123 deletions(-)

diff --git a/tests/ignite/metrics/test_cosine_similarity.py b/tests/ignite/metrics/test_cosine_similarity.py
index db7a5d5d9f1..1ee7be7b073 100644
--- a/tests/ignite/metrics/test_cosine_similarity.py
+++ b/tests/ignite/metrics/test_cosine_similarity.py
@@ -1,10 +1,12 @@
-import os
+from typing import Tuple
 
 import numpy as np
 import pytest
 import torch
+from torch import Tensor
 
 import ignite.distributed as idist
+from ignite.engine import Engine
 from ignite.exceptions import NotComputableError
 from ignite.metrics import CosineSimilarity
 
@@ -17,7 +19,7 @@ def test_zero_sample():
         cos_sim.compute()
 
 
-@pytest.fixture(params=[item for item in range(4)])
+@pytest.fixture(params=list(range(4)))
 def test_case(request):
     return [
         (torch.randn((100, 50)), torch.randn((100, 50)), 10 ** np.random.uniform(-8, 0), 1),
@@ -39,7 +41,7 @@ def test_case(request):
 
 
 @pytest.mark.parametrize("n_times", range(5))
-def test_compute(n_times, test_case):
+def test_compute(n_times, test_case: Tuple[Tensor, Tensor, float, int]):
     y_pred, y, eps, batch_size = test_case
 
     cos = CosineSimilarity(eps=eps)
@@ -65,73 +67,6 @@ def test_compute(n_times, test_case):
     assert pytest.approx(np_res, rel=2e-5) == cos.compute()
 
 
-def _test_distrib_integration(device, tol=2e-5):
-    from ignite.engine import Engine
-
-    rank = idist.get_rank()
-    torch.manual_seed(12 + rank)
-
-    def _test(metric_device):
-        n_iters = 100
-        batch_size = 10
-        n_dims = 100
-
-        y_true = torch.randn((n_iters * batch_size, n_dims), dtype=torch.float).to(device)
-        y_preds = torch.normal(2.0, 3.0, size=(n_iters * batch_size, n_dims), dtype=torch.float).to(device)
-
-        def update(engine, i):
-            return (
-                y_preds[i * batch_size : (i + 1) * batch_size],
-                y_true[i * batch_size : (i + 1) * batch_size],
-            )
-
-        engine = Engine(update)
-
-        m = CosineSimilarity(device=metric_device)
-        m.attach(engine, "cosine_similarity")
-
-        data = list(range(n_iters))
-        engine.run(data=data, max_epochs=1)
-
-        y_preds = idist.all_gather(y_preds)
-        y_true = idist.all_gather(y_true)
-
-        assert "cosine_similarity" in engine.state.metrics
-        res = engine.state.metrics["cosine_similarity"]
-
-        y_true_np = y_true.cpu().numpy()
-        y_preds_np = y_preds.cpu().numpy()
-        y_true_norm = np.clip(np.linalg.norm(y_true_np, axis=1, keepdims=True), 1e-8, None)
-        y_preds_norm = np.clip(np.linalg.norm(y_preds_np, axis=1, keepdims=True), 1e-8, None)
-        true_res = np.sum((y_true_np / y_true_norm) * (y_preds_np / y_preds_norm), axis=1)
-        true_res = np.mean(true_res)
-
-        assert pytest.approx(res, rel=tol) == true_res
-
-    _test("cpu")
-    if device.type != "xla":
-        _test(idist.device())
-
-
-def _test_distrib_accumulator_device(device):
-    metric_devices = [torch.device("cpu")]
-    if device.type != "xla":
-        metric_devices.append(idist.device())
-    for metric_device in metric_devices:
-        device = torch.device(device)
-        cos = CosineSimilarity(device=metric_device)
-
-        for dev in [cos._device, cos._sum_of_cos_similarities.device]:
-            assert dev == metric_device, f"{type(dev)}:{dev} vs {type(metric_device)}:{metric_device}"
-
-        y_pred = torch.tensor([[2.0, 3.0], [-2.0, 1.0]], dtype=torch.float)
-        y = torch.ones(2, 2, dtype=torch.float)
-        cos.update((y_pred, y))
-
-        for dev in [cos._device, cos._sum_of_cos_similarities.device]:
-            assert dev == metric_device, f"{type(dev)}:{dev} vs {type(metric_device)}:{metric_device}"
-
-
 def test_accumulator_detached():
     cos = CosineSimilarity()
 
@@ -142,70 +77,68 @@ def test_accumulator_detached():
     assert not cos._sum_of_cos_similarities.requires_grad
 
 
-@pytest.mark.distributed
-@pytest.mark.skipif(not idist.has_native_dist_support, reason="Skip if no native dist support")
-@pytest.mark.skipif(torch.cuda.device_count() < 1, reason="Skip if no GPU")
-def test_distrib_nccl_gpu(distributed_context_single_node_nccl):
-    device = idist.device()
-    _test_distrib_integration(device)
-    _test_distrib_accumulator_device(device)
-
+@pytest.mark.usefixtures("distributed")
+class TestDistributed:
+    def test_integration(self):
+        tol = 2e-5
+        n_iters = 100
+        batch_size = 10
+        n_dims = 100
 
-@pytest.mark.distributed
-@pytest.mark.skipif(not idist.has_native_dist_support, reason="Skip if no native dist support")
-def test_distrib_gloo_cpu_or_gpu(distributed_context_single_node_gloo):
-    device = idist.device()
-    _test_distrib_integration(device)
-    _test_distrib_accumulator_device(device)
+        rank = idist.get_rank()
+        torch.manual_seed(12 + rank)
 
+        device = idist.device()
+        metric_devices = [torch.device("cpu")]
+        if device.type != "xla":
+            metric_devices.append(device)
 
-@pytest.mark.distributed
-@pytest.mark.skipif(not idist.has_hvd_support, reason="Skip if no Horovod dist support")
-@pytest.mark.skipif("WORLD_SIZE" in os.environ, reason="Skip if launched as multiproc")
-def test_distrib_hvd(gloo_hvd_executor):
-    device = torch.device("cpu" if not torch.cuda.is_available() else "cuda")
-    nproc = 4 if not torch.cuda.is_available() else torch.cuda.device_count()
+        for metric_device in metric_devices:
+            y_true = torch.randn((n_iters * batch_size, n_dims)).float().to(device)
+            y_preds = torch.normal(2.0, 3.0, size=(n_iters * batch_size, n_dims)).float().to(device)
 
-    gloo_hvd_executor(_test_distrib_integration, (device,), np=nproc, do_init=True)
-    gloo_hvd_executor(_test_distrib_accumulator_device, (device,), np=nproc, do_init=True)
+            engine = Engine(
+                lambda e, i: (
+                    y_preds[i * batch_size : (i + 1) * batch_size],
+                    y_true[i * batch_size : (i + 1) * batch_size],
+                )
+            )
 
+            m = CosineSimilarity(device=metric_device)
+            m.attach(engine, "cosine_similarity")
 
-@pytest.mark.multinode_distributed
-@pytest.mark.skipif(not idist.has_native_dist_support, reason="Skip if no native dist support")
-@pytest.mark.skipif("MULTINODE_DISTRIB" not in os.environ, reason="Skip if not multi-node distributed")
-def test_multinode_distrib_gloo_cpu_or_gpu(distributed_context_multi_node_gloo):
-    device = idist.device()
-    _test_distrib_integration(device)
-    _test_distrib_accumulator_device(device)
+            data = list(range(n_iters))
+            engine.run(data=data, max_epochs=1)
 
+            y_preds = idist.all_gather(y_preds)
+            y_true = idist.all_gather(y_true)
 
-@pytest.mark.multinode_distributed
-@pytest.mark.skipif(not idist.has_native_dist_support, reason="Skip if no native dist support")
-@pytest.mark.skipif("GPU_MULTINODE_DISTRIB" not in os.environ, reason="Skip if not multi-node distributed")
-def test_multinode_distrib_nccl_gpu(distributed_context_multi_node_nccl):
-    device = idist.device()
-    _test_distrib_integration(device)
-    _test_distrib_accumulator_device(device)
+            assert "cosine_similarity" in engine.state.metrics
+            res = engine.state.metrics["cosine_similarity"]
 
+            y_true_np = y_true.cpu().numpy()
+            y_preds_np = y_preds.cpu().numpy()
+            y_true_norm = np.clip(np.linalg.norm(y_true_np, axis=1, keepdims=True), 1e-8, None)
+            y_preds_norm = np.clip(np.linalg.norm(y_preds_np, axis=1, keepdims=True), 1e-8, None)
+            true_res = np.sum((y_true_np / y_true_norm) * (y_preds_np / y_preds_norm), axis=1)
+            true_res = np.mean(true_res)
 
-@pytest.mark.tpu
-@pytest.mark.skipif("NUM_TPU_WORKERS" in os.environ, reason="Skip if NUM_TPU_WORKERS is in env vars")
-@pytest.mark.skipif(not idist.has_xla_support, reason="Skip if no PyTorch XLA package")
-def test_distrib_single_device_xla():
-    device = idist.device()
-    _test_distrib_integration(device, tol=1e-4)
-    _test_distrib_accumulator_device(device)
+            assert pytest.approx(res, rel=tol) == true_res
 
+    def test_accumulator_device(self):
+        device = idist.device()
+        metric_devices = [torch.device("cpu")]
+        if device.type != "xla":
+            metric_devices.append(device)
+        for metric_device in metric_devices:
+            cos = CosineSimilarity(device=metric_device)
 
-def _test_distrib_xla_nprocs(index):
-    device = idist.device()
-    _test_distrib_integration(device, tol=1e-4)
-    _test_distrib_accumulator_device(device)
+            for dev in (cos._device, cos._sum_of_cos_similarities.device):
+                assert dev == metric_device, f"{type(dev)}:{dev} vs {type(metric_device)}:{metric_device}"
 
+            y_pred = torch.tensor([[2.0, 3.0], [-2.0, 1.0]]).float()
+            y = torch.ones(2, 2).float()
+            cos.update((y_pred, y))
 
-@pytest.mark.tpu
-@pytest.mark.skipif("NUM_TPU_WORKERS" not in os.environ, reason="Skip if no NUM_TPU_WORKERS in env vars")
-@pytest.mark.skipif(not idist.has_xla_support, reason="Skip if no PyTorch XLA package")
-def test_distrib_xla_nprocs(xmp_executor):
-    n = int(os.environ["NUM_TPU_WORKERS"])
-    xmp_executor(_test_distrib_xla_nprocs, args=(), nprocs=n)
+            for dev in (cos._device, cos._sum_of_cos_similarities.device):
+                assert dev == metric_device, f"{type(dev)}:{dev} vs {type(metric_device)}:{metric_device}"