Merge pull request #85 from nisyad-ms/nisyad/ic_od_to_kvp_adapter

Add IC OD to KVP Format Converter
microsoft · Sep 4, 2024 · 27dff13 · 27dff13
2 parents 4da490e + 66e82fe
commit 27dff13
Show file tree

Hide file tree

Showing 9 changed files with 358 additions and 4 deletions.
diff --git a/README.md b/README.md
@@ -92,6 +92,22 @@ print(imgs)
 print(target)
 ```
 
+### Loading IC/OD Datasets in KeyValuePair (KVP) Format:
+You can convert an existing IC/OD VisionDataset to the generalized KVP format using the following adapter:
+
+```{python}
+# For IC dataset
+from vision_datasets.image_classification import ClassificationAsKeyValuePairDataset
+sample_ic_dataset = VisionDataset(dataset_info, dataset_manifest)
+kvp_dataset = ClassificationAsKeyValuePairDataset(sample_ic_dataset)
+
+# For OD dataset
+from vision_datasets.image_object_detection import DetectionAsKeyValuePairDataset
+sample_od_dataset = VisionDataset(dataset_info, dataset_manifest)
+kvp_dataset = DetectionAsKeyValuePairDataset(sample_od_dataset)
+```
+
+
 #### Coco format
 
 Here is an example with explanation of what a `DatasetInfo` looks like for coco format, when it is serialized into json:

diff --git a/setup.py b/setup.py
@@ -1,7 +1,7 @@
 import setuptools
 from os import path
 
-VERSION = '1.0.14'
+VERSION = '1.0.15'
 
 # Get the long description from the README file
 here = path.abspath(path.dirname(__file__))

diff --git a/tests/test_fixtures.py b/tests/test_fixtures.py
@@ -5,7 +5,12 @@
 
 from PIL import Image
 
-from vision_datasets.common import CocoManifestAdaptorFactory, DatasetInfo, DatasetTypes, VisionDataset
+from vision_datasets.common import (
+    CocoManifestAdaptorFactory,
+    DatasetInfo,
+    DatasetTypes,
+    VisionDataset,
+)
 
 
 class DetectionTestFixtures:
@@ -51,3 +56,45 @@ def create_an_od_dataset(n_images=2, n_categories=4, coordinates='relative'):
         dataset_manifest = DetectionTestFixtures.create_an_od_manifest(tempdir.name, n_images, n_categories)
         dataset = VisionDataset(dataset_info, dataset_manifest, coordinates)
         return dataset, tempdir
+
+
+class MultilcassClassificationTestFixtures:
+    DATASET_INFO_DICT = {
+        "name": "dummy",
+        "version": 1,
+        "type": "image_classification_multiclass",
+        "root_folder": "dummy",
+        "format": "coco",
+        "test": {
+            "index_path": "train.json",
+            "files_for_local_usage": [
+                "train.zip"
+            ]
+        },
+    }
+
+    @staticmethod
+    def create_an_ic_dataset(n_images=2, n_categories=3):
+        dataset_dict = copy.deepcopy(MultilcassClassificationTestFixtures.DATASET_INFO_DICT)
+        tempdir = tempfile.TemporaryDirectory()
+        dataset_dict['root_folder'] = tempdir.name
+        for i in range(n_images):
+            Image.new('RGB', (100, 100)).save(pathlib.Path(tempdir.name) / f'{i + 1}.jpg')
+
+        dataset_info = DatasetInfo(dataset_dict)
+        dataset_manifest = MultilcassClassificationTestFixtures.create_an_ic_manifest(tempdir.name, n_images, n_categories)
+        dataset = VisionDataset(dataset_info, dataset_manifest)
+        return dataset, tempdir
+
+    @staticmethod
+    def create_an_ic_manifest(root_dir='', n_images=2, n_categories=3):
+        images = [{'id': i + 1, 'file_name': f'{i + 1}.jpg', 'width': 100, 'height': 100} for i in range(n_images)]
+
+        categories = [{'id': i + 1, 'name': f'{i + 1}-class', } for i in range(n_categories)]
+
+        annotations = [{'id': i + 1, 'image_id': i + 1, 'category_id': i + 1} for i in range(n_images)]
+
+        coco_dict = {'images': images, 'categories': categories, 'annotations': annotations}
+        coco_path = pathlib.Path(root_dir) / 'coco.json'
+        coco_path.write_text(json.dumps(coco_dict))
+        return CocoManifestAdaptorFactory.create(DatasetTypes.IMAGE_CLASSIFICATION_MULTICLASS).create_dataset_manifest(coco_path.name, root_dir)
diff --git a/tests/test_ic_od_to_kvp_wrapper/test_classification_as_kvp.py b/tests/test_ic_od_to_kvp_wrapper/test_classification_as_kvp.py
@@ -0,0 +1,42 @@
+import unittest
+
+from tests.test_fixtures import MultilcassClassificationTestFixtures
+from vision_datasets.common import DatasetTypes
+from vision_datasets.image_classification import ClassificationAsKeyValuePairDataset
+from vision_datasets.key_value_pair.manifest import KeyValuePairLabelManifest
+
+
+class TestClassificationAsKeyValuePairDataset(unittest.TestCase):
+    def test_multiclass_classification(self):
+        sample_classification_dataset, _ = MultilcassClassificationTestFixtures.create_an_ic_dataset()
+        kvp_dataset = ClassificationAsKeyValuePairDataset(sample_classification_dataset)
+
+        self.assertIsInstance(kvp_dataset, ClassificationAsKeyValuePairDataset)
+        self.assertEqual(kvp_dataset.dataset_info.type, DatasetTypes.KEY_VALUE_PAIR)
+        self.assertIn("name", kvp_dataset.dataset_info.schema)
+        self.assertIn("description", kvp_dataset.dataset_info.schema)
+        self.assertIn("fieldSchema", kvp_dataset.dataset_info.schema)
+
+        print(kvp_dataset.dataset_info.schema["fieldSchema"])
+
+        self.assertEqual(kvp_dataset.dataset_info.schema["fieldSchema"],
+                         {"className": {
+                             "type": "string",
+                             "description": "Class name that the image belongs to.",
+                             "classes": {
+                                 "1-class": {"description": "A single class name. Only output 1-class as the class name if present."},
+                                 "2-class": {"description": "A single class name. Only output 2-class as the class name if present."},
+                                 "3-class": {"description": "A single class name. Only output 3-class as the class name if present."},
+                             }
+                         }
+        })
+
+        _, target, _ = kvp_dataset[0]
+        self.assertIsInstance(target, KeyValuePairLabelManifest)
+        self.assertEqual(target.label_data,
+                         {"fields": {"className": {"value": "1-class"}}}
+                         )
+
+
+if __name__ == '__main__':
+    unittest.main()
diff --git a/tests/test_ic_od_to_kvp_wrapper/test_detection_as_kvp.py b/tests/test_ic_od_to_kvp_wrapper/test_detection_as_kvp.py
@@ -0,0 +1,45 @@
+import unittest
+
+from tests.test_fixtures import DetectionTestFixtures
+from vision_datasets.common.constants import DatasetTypes
+from vision_datasets.image_object_detection import DetectionAsKeyValuePairDataset
+from vision_datasets.key_value_pair.manifest import KeyValuePairLabelManifest
+
+
+class TestDetectionAsKeyValuePairDataset(unittest.TestCase):
+    def test_detection_to_kvp(self):
+        sample_detection_dataset, _ = DetectionTestFixtures.create_an_od_dataset()
+        kvp_dataset = DetectionAsKeyValuePairDataset(sample_detection_dataset)
+
+        self.assertIsInstance(kvp_dataset, DetectionAsKeyValuePairDataset)
+        self.assertEqual(kvp_dataset.dataset_info.type, DatasetTypes.KEY_VALUE_PAIR)
+        self.assertIn("name", kvp_dataset.dataset_info.schema)
+        self.assertIn("description", kvp_dataset.dataset_info.schema)
+        self.assertIn("fieldSchema", kvp_dataset.dataset_info.schema)
+
+        self.assertEqual(kvp_dataset.dataset_info.schema["fieldSchema"],
+                         {'detectedObjects': {'type': 'array', 'description': 'Objects in the image of the specified classes, with bounding boxes',
+                                              'items': {'type': 'string', 'description': 'Class name of the object',
+                                                        'classes': {'1-class': {},
+                                                                    '2-class': {},
+                                                                    '3-class': {},
+                                                                    '4-class': {}},
+                                                        'includeGrounding': True}}})
+
+        _, target, _ = kvp_dataset[0]
+        self.assertIsInstance(target, KeyValuePairLabelManifest)
+        self.assertEqual(target.label_data,
+                         {'fields': {'detectedObjects': {'value': [{'value': '1-class', 'groundings': [[0, 0, 100, 100]]},
+                                                                   {'value': '2-class', 'groundings': [[10, 10, 50, 100]]}]}}
+                          })
+
+    def test_single_class_description(self):
+        sample_detection_dataset, _ = DetectionTestFixtures.create_an_od_dataset(n_categories=1)
+        kvp_dataset = DetectionAsKeyValuePairDataset(sample_detection_dataset)
+
+        self.assertEqual(kvp_dataset.dataset_info.schema["fieldSchema"]['detectedObjects']['items']['classes'],
+                         {'1-class': {"description": "Always output 1-class as the class."}})
+
+
+if __name__ == '__main__':
+    unittest.main()
diff --git a/vision_datasets/image_classification/__init__.py b/vision_datasets/image_classification/__init__.py
@@ -1,7 +1,9 @@
 from .coco_manifest_adaptor import MultiClassClassificationCocoManifestAdaptor, MultiLabelClassificationCocoManifestAdaptor
 from .operations import ImageClassificationCocoDictGenerator
 from .manifest import ImageClassificationLabelManifest
+from .classification_as_kvp_dataset import ClassificationAsKeyValuePairDataset
 
 __all__ = ['MultiClassClassificationCocoManifestAdaptor', 'MultiLabelClassificationCocoManifestAdaptor',
            'ImageClassificationCocoDictGenerator',
-           'ImageClassificationLabelManifest']
+           'ImageClassificationLabelManifest',
+           'ClassificationAsKeyValuePairDataset']
diff --git a/vision_datasets/image_classification/classification_as_kvp_dataset.py b/vision_datasets/image_classification/classification_as_kvp_dataset.py
@@ -0,0 +1,89 @@
+import logging
+import typing
+from copy import deepcopy
+
+from vision_datasets.common import DatasetTypes, KeyValuePairDatasetInfo, VisionDataset
+from vision_datasets.key_value_pair import (
+    KeyValuePairDatasetManifest,
+    KeyValuePairLabelManifest,
+)
+
+logger = logging.getLogger(__name__)
+
+
+CLASS_NAME_KEY = "className"
+BASE_CLASSIFICATION_SCHEMA = {
+    "name": "Multiclass image classification",
+    "description": "Classify images into one of the provided classes.",
+    "fieldSchema": {
+            f"{CLASS_NAME_KEY}": {
+                "type": "string",
+                "description": "Class name that the image belongs to.",
+                "classes": {}
+            }
+    }
+}
+
+
+class ClassificationAsKeyValuePairDataset(VisionDataset):
+    """Dataset class that access Classification datset as KeyValuePair dataset."""
+
+    def __init__(self, classification_dataset: VisionDataset):
+        """
+        Initializes an instance of the ClassificationAsKeyValuePairDataset class.
+        Args:
+            classification_dataset (VisionDataset): The classification dataset to convert to key-value pair dataset.
+        """
+
+        if classification_dataset is None or classification_dataset.dataset_info.type not in {DatasetTypes.IMAGE_CLASSIFICATION_MULTICLASS}:
+            # TODO: Add support for multilabel classification
+            raise ValueError
+
+        # Generate schema and update dataset info
+        classification_dataset = deepcopy(classification_dataset)
+
+        dataset_info_dict = classification_dataset.dataset_info.__dict__
+        dataset_info_dict["type"] = DatasetTypes.KEY_VALUE_PAIR.name.lower()
+        self.class_names = [c.name for c in classification_dataset.dataset_manifest.categories]
+        self.class_id_to_names = {c.id: c.name for c in classification_dataset.dataset_manifest.categories}
+        self.img_id_to_pos = {x.id: i for i, x in enumerate(classification_dataset.dataset_manifest.images)}
+
+        schema = self.construct_schema(self.class_names)
+        # Update dataset_info with schema
+        dataset_info = KeyValuePairDatasetInfo({**dataset_info_dict, "schema": schema})
+
+        # Construct KeyValuePairDatasetManifest
+        annotations = []
+        for id, img in enumerate(classification_dataset.dataset_manifest.images, 1):
+            label_id = img.labels[0].label_data
+            label_name = self.class_id_to_names[label_id]
+
+            kvp_label_data = self.construct_kvp_label_data(label_name)
+            img_ids = [self.img_id_to_pos[img.id]]  # 0-based index
+            kvp_annotation = KeyValuePairLabelManifest(id, img_ids, label_data=kvp_label_data)
+
+            # KVPDatasetManifest expects img.labels to be empty. Labels are instead stored in KVP annotation
+            img.labels = []
+            annotations.append(kvp_annotation)
+
+        dataset_manifest = KeyValuePairDatasetManifest(classification_dataset.dataset_manifest.images, annotations, schema, additional_info=classification_dataset.dataset_manifest.additional_info)
+        super().__init__(dataset_info, dataset_manifest, dataset_resources=classification_dataset.dataset_resources)
+
+    def construct_schema(self, class_names: typing.List[str]) -> typing.Dict[str, typing.Any]:
+        schema: typing.Dict[str, typing.Any] = BASE_CLASSIFICATION_SCHEMA  # initialize with base schema
+        schema["fieldSchema"][f"{CLASS_NAME_KEY}"]["classes"] = {c: {"description": f"A single class name. Only output {c} as the class name if present."} for c in class_names}
+        return schema
+
+    def construct_kvp_label_data(self, label_name: str) -> typing.Dict[str, typing.Union[typing.Dict[str, typing.Dict[str, str]], None]]:
+        """
+        Convert the classification dataset label_name to the desired format for KVP annnotation as defined by the BASE_CLASSIFICATION_SCHEMA.
+        E.g. {"fields": {"className": {"value": <label_name>}}}
+
+        """
+        return {
+            f"{KeyValuePairLabelManifest.LABEL_KEY}": {
+                f"{CLASS_NAME_KEY}": {
+                    f"{KeyValuePairLabelManifest.LABEL_VALUE_KEY}": label_name
+                }
+            }
+        }
diff --git a/vision_datasets/image_object_detection/__init__.py b/vision_datasets/image_object_detection/__init__.py
@@ -2,6 +2,7 @@
 from .manifest import ImageObjectDetectionLabelManifest
 from .operations import ImageObjectDetectionCocoDictGenerator
 from .detection_as_classification_dataset import DetectionAsClassificationBaseDataset, DetectionAsClassificationByCroppingDataset, DetectionAsClassificationIgnoreBoxesDataset
+from .detection_as_kvp_dataset import DetectionAsKeyValuePairDataset
 
 __all__ = ['ImageObjectDetectionCocoManifestAdaptor', 'ImageObjectDetectionLabelManifest', 'ImageObjectDetectionCocoDictGenerator', 'DetectionAsClassificationBaseDataset',
-           'DetectionAsClassificationByCroppingDataset', 'DetectionAsClassificationIgnoreBoxesDataset']
+           'DetectionAsClassificationByCroppingDataset', 'DetectionAsClassificationIgnoreBoxesDataset', 'DetectionAsKeyValuePairDataset']