intel · alessandropalla · Jun 20, 2024 · Jun 19, 2024 · Jun 19, 2024 · Jun 19, 2024
diff --git a/include/intel_npu_acceleration_library/nn_factory.h b/include/intel_npu_acceleration_library/nn_factory.h
@@ -50,12 +50,11 @@ class ModelFactory : public intel_npu_acceleration_library::OVInferenceModel {
      *
      * @param dtype element type of the tensor constant
      * @param shape shape of the tensor constant
-     * @param values vector of literals for initializing the tensor constant
+     * @param dst data pointer of the tensor constant
      * @return ov::op::Op*
      */
-    template <typename T>
-    ov::op::Op* constant(ov::element::Type_t dtype, std::vector<size_t> shape, std::vector<T>& values) {
-        auto constant = std::make_shared<ov::opset1::Constant>(dtype, ov::Shape(shape), values);
+    ov::op::Op* constant(ov::element::Type_t dtype, std::vector<size_t> shape, const void* dst) {
+        auto constant = std::make_shared<ov::opset1::Constant>(dtype, ov::Shape(shape), dst);
         operations.push_back(constant);
         return constant.get();
     }

diff --git a/intel_npu_acceleration_library/backend/bindings.py b/intel_npu_acceleration_library/backend/bindings.py
@@ -106,6 +106,15 @@ def init_network_factory(lib: ctypes.CDLL):
     lib.parameter.argtypes = [handler, ctypes.c_int, c_u32_array, ctypes.c_char_p]
     lib.parameter.restype = handler
 
+    lib.constant.argtypes = [
+        handler,
+        ctypes.c_int,
+        c_u32_array,
+        ctypes.c_char_p,
+        ctypes.c_void_p,
+    ]
+    lib.constant.restype = handler
+
     lib.compile.argtypes = [handler, handler]
     lib.compile.restype = handler
 

diff --git a/intel_npu_acceleration_library/backend/factory.py b/intel_npu_acceleration_library/backend/factory.py
@@ -92,6 +92,25 @@ def parameter(
             self._mm, shape_ptr.size, shape_ptr, self.get_backend_dtype(dtype)
         )
 
+    def constant(
+        self,
+        data: np.array,
+    ) -> ctypes._Pointer:
+        """Generate a model input constant.
+
+        Args:
+            data (np.array): Input numpy data array
+
+        Returns:
+            ctypes._Pointer: an instance to a constant object
+
+        """
+        dst = data.ctypes.data_as(ctypes.c_void_p)
+        shape_ptr = np.array(data.shape, dtype=np.uint32)
+        return backend_lib.constant(
+            self._mm, shape_ptr.size, shape_ptr, self.get_backend_dtype(data.dtype), dst
+        )
+
     def convolution(
         self,
         input_node: ctypes._Pointer,

diff --git a/src/bindings.cpp b/src/bindings.cpp
@@ -126,6 +126,13 @@ intel_npu_acceleration_library_DLL_API ov::op::Op* parameter(intel_npu_accelerat
     return factory->parameter(shape, ov_dtype);
 }
 
+intel_npu_acceleration_library_DLL_API ov::op::Op* constant(intel_npu_acceleration_library::ModelFactory* factory,
+                                                            size_t size, unsigned int* data, char* dtype, void* dst) {
+    ov::element::Type_t ov_dtype = intel_npu_acceleration_library::dtype_from_string(std::string(dtype));
+    std::vector<size_t> shape(data, data + size);
+    return factory->constant(ov_dtype, shape, dst);
+}
+
 intel_npu_acceleration_library_DLL_API ov::op::Op* matmul(intel_npu_acceleration_library::ModelFactory* factory,
                                                           ov::op::Op* in0, ov::op::Op* in1) {
     return factory->matmul(in0, in1);

diff --git a/test/python/test_layers.py b/test/python/test_layers.py
@@ -3,11 +3,12 @@
 # SPDX-License-Identifier: Apache 2.0
 #
 
-from intel_npu_acceleration_library.backend import MLP, NNFactory
+from intel_npu_acceleration_library.backend import MLP, NNFactory, MatMul
 from sklearn.metrics import r2_score
 import numpy as np
 import pytest
 import torch
+import itertools
 
 
 class MLP_PT(torch.nn.Module):
@@ -240,3 +241,28 @@ def test_activation(batch, hidden_dim, activation):
     assert np.isfinite(out).all(), "NPU output contains NaN or Inf"
 
     assert 1 - r2_score(reference, out) < 0.001
+
+
+@pytest.mark.parametrize("batch", [16, 128])
+@pytest.mark.parametrize("hidden_dim", [256, 512])
+def test_constant(batch, hidden_dim):
+
+    data = np.random.rand(batch, hidden_dim).astype(np.float16)
+    X = torch.rand((batch, hidden_dim)).to(torch.float16) - 0.5
+
+    model = NNFactory()
+    cc = model.constant(data=data)
+    input = model.parameter(X.shape)
+    output = model.eltwise_add(cc, input)
+    model.compile(output)
+    out = model.run(X.numpy())
+
+    reference = data + X.numpy()
+    print(out)
+    print(reference)
+
+    assert out.shape == reference.shape, "Output shape mismatch"
+    assert np.isfinite(reference).all(), "Pytorch Reference contains NaN or Inf"
+    assert np.isfinite(out).all(), "NPU output contains NaN or Inf"
+
+    assert 1 - r2_score(reference, out) < 0.001