hegelai · LuvvAggarwal · Aug 14, 2023 · HashemAlsaket · Aug 22, 2023 · HashemAlsaket
diff --git a/prompttools/benchmarks/load_data.py b/prompttools/benchmarks/load_data.py
@@ -0,0 +1,44 @@
+from datasets import load_dataset_builder,load_dataset,get_dataset_config_names, Dataset
+from datasets.dataset_dict import DatasetDict
+from typing import Literal
+
+class DatasetLoader():
+    r"""
+    A dataset class used to load dataset.
+
+    Args:
+        dataset_name (str): The name of the dataset.
+        split (str()): load a specific split
+    """
+
+    def __init__(
+        self,
+        dataset_name: str,
+        split: Literal["train","validation","test"] | None
+    ):
+        self.dataset_name = dataset_name
+        self.split = split,
+        super().__init__()
+
+    def builder(self) -> DatasetDict | Dataset:
+        r"""
+        Initializes and prepares the datasetbuilder.
+        """
+        return load_dataset_builder(path=self.dataset_name)
+
+    def load_dataset(self)-> DatasetDict | Dataset:
+        r"""
+        Return the loaded dataset"""
+        if self.split == None:
+            return load_dataset(path=self.dataset_name)
+        else:
+            return load_dataset(path=self.dataset_name, split=self.split)
+
+    def get_config(self)-> list:
+        r"""
+        Return the configuration dataset"""
+        return get_dataset_config_names(self.dataset_name)
+
+# Example usecase
+# d = DatasetLoader(dataset_name='rotten_tomatoes',split=None)
+# print(d.builder().info.description)
diff --git a/prompttools/playground/requirements.txt b/prompttools/playground/requirements.txt
@@ -3,4 +3,5 @@ jinja2
 huggingface_hub
 llama-cpp-python
 anthropic
-pyperclip
+pyperclip
+datasets
diff --git a/prompttools/version.py b/prompttools/version.py
@@ -1,2 +1,2 @@
-__version__ = '0.0.30a0+b3007fc'
-git_version = 'b3007fcc8f6dc39a859cad5ae92a64696cebf124'
+__version__ = '0.0.30a0+df575ec'
+git_version = 'df575ece8a0c66206b28611e84e55d420a0047b3'