From 4d7a8c4b9bfc998a71df94aec2b2a856aba71478 Mon Sep 17 00:00:00 2001
From: hyeonseok lee <hs89.lee@samsung.com>
Date: Thu, 21 Mar 2024 16:17:53 +0900
Subject: [PATCH 1/4] temporary code for layer initialization

 - Temporary code for layer initialization

Signed-off-by: hyeonseok lee <hs89.lee@samsung.com>
---
 api/ccapi/include/layer.h      | 2 ++
 nntrainer/layers/layer_devel.h | 2 ++
 nntrainer/layers/layer_node.h  | 2 ++
 3 files changed, 6 insertions(+)
diff --git a/api/ccapi/include/layer.h b/api/ccapi/include/layer.h
index 19266ae5a7..8bd13e01bc 100644
--- a/api/ccapi/include/layer.h
+++ b/api/ccapi/include/layer.h
@@ -131,6 +131,8 @@ class Layer {
    */
   virtual const std::string getType() const = 0;
 
+  virtual void initialize() = 0;
+
   /**
    * @brief     Default allowed properties
    * - input shape : string
diff --git a/nntrainer/layers/layer_devel.h b/nntrainer/layers/layer_devel.h
index 54ce1a0ee9..be02b5bc2f 100644
--- a/nntrainer/layers/layer_devel.h
+++ b/nntrainer/layers/layer_devel.h
@@ -160,6 +160,8 @@ class Layer {
    */
   virtual void finalize(InitLayerContext &context) = 0;
 
+  virtual void initialize(RunLayerContext &context){};
+
   /**
    * @brief     Forward Propagation of a layer
    * @param     context Context of the layer
diff --git a/nntrainer/layers/layer_node.h b/nntrainer/layers/layer_node.h
index 55b24f44e9..ccd8bb8be1 100644
--- a/nntrainer/layers/layer_node.h
+++ b/nntrainer/layers/layer_node.h
@@ -273,6 +273,8 @@ class LayerNode final : public ml::train::Layer, public GraphNode {
    */
   InitLayerContext refinalize(const std::vector<TensorDim> &input_dims = {});
 
+  void initialize() override { layer->initialize(*run_context); }
+
   /**
    * @brief     Forward Propagation of a layer
    * @param     training true if training, false if inference

From 9328d1f898953d08d5e2f48c3c9f500b1ad3fdee Mon Sep 17 00:00:00 2001
From: "jijoong.moon" <jijoong.moon@samsung.com>
Date: Mon, 22 Apr 2024 14:07:21 +0900
Subject: [PATCH 2/4] [ SPEC ] chagne fp16

Describe a commit content (Until 80 colums per line) in detail ASAP.

**Changes proposed in this PR:**
- Added TOC generator for README.md

Resolves:

**Self evaluation:**
1. Build test:	 [X]Passed [ ]Failed [ ]Skipped
2. Run test:	 [X]Passed [ ]Failed [ ]Skipped

Signed-off-by: jijoong.moon <jijoong.moon@samsung.com>
---
 packaging/nntrainer.spec | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/packaging/nntrainer.spec b/packaging/nntrainer.spec
index 80d682c908..de1d3576e3 100644
--- a/packaging/nntrainer.spec
+++ b/packaging/nntrainer.spec
@@ -393,6 +393,11 @@ export CFLAGS+=" -fprofile-arcs -ftest-coverage"
 export CXXFLAGS+=" -fprofile-arcs -ftest-coverage"
 %endif
 
+%if 0%{?enable_fp16}
+export CFLAGS+=" -march=armv8.2-a+fp16"
+export CXXFLAGS+=" -march=armv8.2-a+fp16"
+%endif
+
 # Add backward competibility for tizen < 6
 %if 0%{tizen_version_major} < 6
 ln -sf %{_includedir}/nnstreamer/nnstreamer.h %{_includedir}/nnstreamer/ml-api-common.h

From 450000572e8a7e993d36f06e0413c2ae4abc2e5a Mon Sep 17 00:00:00 2001
From: "jijoong.moon" <jijoong.moon@samsung.com>
Date: Mon, 22 Apr 2024 14:43:58 +0900
Subject: [PATCH 3/4] [ NNStreamer ] disable nnstreamer trainer

Describe a commit content (Until 80 colums per line) in detail ASAP.

**Changes proposed in this PR:**
- Added TOC generator for README.md

Resolves:

**Self evaluation:**
1. Build test:	 [X]Passed [ ]Failed [ ]Skipped
2. Run test:	 [X]Passed [ ]Failed [ ]Skipped

Signed-off-by: jijoong.moon <jijoong.moon@samsung.com>
---
 nnstreamer/meson.build   | 2 +-
 packaging/nntrainer.spec | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/nnstreamer/meson.build b/nnstreamer/meson.build
index 54b518b03c..9a7735d614 100644
--- a/nnstreamer/meson.build
+++ b/nnstreamer/meson.build
@@ -3,5 +3,5 @@ if get_option('enable-nnstreamer-tensor-filter').enabled()
   subdir('tensor_filter')
 endif
 if get_option('enable-nnstreamer-tensor-trainer').enabled()
-  subdir('tensor_trainer')
+#  subdir('tensor_trainer')
 endif
diff --git a/packaging/nntrainer.spec b/packaging/nntrainer.spec
index de1d3576e3..9e4ff0067e 100644
--- a/packaging/nntrainer.spec
+++ b/packaging/nntrainer.spec
@@ -1,7 +1,7 @@
 # Execute gbs with --define "testcoverage 1" in case that you must get unittest coverage statistics
 %define         use_cblas 1
 %define         nnstreamer_filter 1
-%define         nnstreamer_trainer 1
+%define         nnstreamer_trainer 0
 %define         nnstreamer_subplugin_path /usr/lib/nnstreamer
 %define         use_gym 0
 %define         support_ccapi 1

From 1916f977aa2e13d7a15416830653da9fa9b84e45 Mon Sep 17 00:00:00 2001
From: Eunju Yang <ej.yang@samsung.com>
Date: Mon, 26 Aug 2024 14:17:18 +0900
Subject: [PATCH 4/4] [Tizen7.0] Tizen7.0 Backporting

- This commit adds some updates for Tizen7.0 backporting
- Type mismatch bug is fixed.
- Unused variable is removed.
- Missing header files are added in spec file.
- spec file is updated

Self evaluation:

Build test: [X]Passed [ ]Failed [ ]Skipped
Run test: [X]Passed [ ]Failed [ ]Skipped

Signed-off-by: Eunju Yang <ej.yang@samsung.com>
---
 api/ccapi/include/layer.h             |  3 +++
 debian/nntrainer-dev.install          |  1 +
 meson.build                           |  1 +
 nnstreamer/meson.build                |  2 +-
 nntrainer/layers/layer_context.cpp    |  5 +++--
 nntrainer/layers/layer_context.h      |  3 ---
 nntrainer/layers/layer_devel.h        |  3 +++
 nntrainer/layers/meson.build          |  1 +
 nntrainer/tensor/hgemm/hgemm_pack.cpp |  8 ++++----
 packaging/nntrainer.spec              | 21 +++++++++++++++------
 10 files changed, 32 insertions(+), 16 deletions(-)

diff --git a/api/ccapi/include/layer.h b/api/ccapi/include/layer.h
index 8bd13e01bc..3740500aa6 100644
--- a/api/ccapi/include/layer.h
+++ b/api/ccapi/include/layer.h
@@ -131,6 +131,9 @@ class Layer {
    */
   virtual const std::string getType() const = 0;
 
+  /**
+   * @brief Initialize layer
+   */
   virtual void initialize() = 0;
 
   /**
diff --git a/debian/nntrainer-dev.install b/debian/nntrainer-dev.install
index 6390d02b0a..fea2a1b5b5 100644
--- a/debian/nntrainer-dev.install
+++ b/debian/nntrainer-dev.install
@@ -24,6 +24,7 @@
 /usr/include/nntrainer/layer_context.h
 /usr/include/nntrainer/layer_devel.h
 /usr/include/nntrainer/layer_impl.h
+/usr/include/nntrainer/acti_func.h
 # custom layer kits
 /usr/include/nntrainer/app_context.h
 # logger
diff --git a/meson.build b/meson.build
index c4d94e8e9b..98e2cae9f6 100644
--- a/meson.build
+++ b/meson.build
@@ -88,6 +88,7 @@ if get_option('enable-fp16')
      # comaptible with armv8.0 machines.
      if cxx.has_argument('-mfp16-format=ieee')
        add_project_arguments('-mfp16-format=ieee', language: ['c', 'cpp'])
+       add_project_arguments('-march=armv8.2-a+fp16', language: ['c', 'cpp'])
      else
        message ('The compiler does not support -mfp16-format=ieee. However, according to https://gcc.gnu.org/onlinedocs/gcc-9.1.0/gcc/Half-Precision.html, gcc may use IEEE fp16 anyway. Thus, we will proceed without the option for FP16 support.')
      endif
diff --git a/nnstreamer/meson.build b/nnstreamer/meson.build
index 9a7735d614..8b42476aef 100644
--- a/nnstreamer/meson.build
+++ b/nnstreamer/meson.build
@@ -3,5 +3,5 @@ if get_option('enable-nnstreamer-tensor-filter').enabled()
   subdir('tensor_filter')
 endif
 if get_option('enable-nnstreamer-tensor-trainer').enabled()
-#  subdir('tensor_trainer')
+ subdir('tensor_trainer')
 endif
diff --git a/nntrainer/layers/layer_context.cpp b/nntrainer/layers/layer_context.cpp
index e6753285d7..6748637e01 100644
--- a/nntrainer/layers/layer_context.cpp
+++ b/nntrainer/layers/layer_context.cpp
@@ -541,9 +541,10 @@ bool RunLayerContext::validate(bool skip_input, bool skip_label) {
         } else if (val->getVariableRef().getTensorType().data_type ==
                    TensorDim::DataType::FP16) {
 #ifdef ENABLE_FP16
-          tensor_map[val->getName()] = val->getVariableRef().getData<_FP16>();
+          tensor_map[val->getName()] =
+            val->getVariableRef().template getData<_FP16>();
           tensor_map[val->getGradientName()] =
-            val->getGradientRef().getData<_FP16>();
+            val->getGradientRef().template getData<_FP16>();
 #else
           throw std::invalid_argument("Error: enable-fp16 is not enabled");
 #endif
diff --git a/nntrainer/layers/layer_context.h b/nntrainer/layers/layer_context.h
index b1f297f6ee..2022692874 100644
--- a/nntrainer/layers/layer_context.h
+++ b/nntrainer/layers/layer_context.h
@@ -438,9 +438,6 @@ class RunLayerContext {
       d.setDataType(o_t);
       w = Tensor(d, true);
     }
-    unsigned int o_ax = getWeightObject(idx).getOutputAxis();
-
-    // t_w.dequantize(w, o_ax);
 
     return;
   }
diff --git a/nntrainer/layers/layer_devel.h b/nntrainer/layers/layer_devel.h
index be02b5bc2f..e59d1e9936 100644
--- a/nntrainer/layers/layer_devel.h
+++ b/nntrainer/layers/layer_devel.h
@@ -160,6 +160,9 @@ class Layer {
    */
   virtual void finalize(InitLayerContext &context) = 0;
 
+  /**
+   * @brief    Initialize the layer
+   */
   virtual void initialize(RunLayerContext &context){};
 
   /**
diff --git a/nntrainer/layers/meson.build b/nntrainer/layers/meson.build
index c612d8c177..0902adb6e4 100644
--- a/nntrainer/layers/meson.build
+++ b/nntrainer/layers/meson.build
@@ -51,6 +51,7 @@ layer_headers = [
   'layer_context.h',
   'layer_devel.h',
   'layer_impl.h',
+  'acti_func.h',
   'common_properties.h',
 ]
 
diff --git a/nntrainer/tensor/hgemm/hgemm_pack.cpp b/nntrainer/tensor/hgemm/hgemm_pack.cpp
index c19fde6ecd..813a2bbd77 100644
--- a/nntrainer/tensor/hgemm/hgemm_pack.cpp
+++ b/nntrainer/tensor/hgemm/hgemm_pack.cpp
@@ -367,10 +367,10 @@ void packing_B8(unsigned int K, unsigned int N, const __fp16 *src,
                 unsigned int ldb, const __fp16 *dst) {
   assert(K != 0 && N != 0 && N % 8 == 0);
 
-  for (int i = 0; i < K; i++) {
+  for (unsigned int i = 0; i < K; i++) {
     const __fp16 *a_off = src + i * ldb;
     __fp16 *b_off = (__fp16 *)dst + i * 8;
-    for (int j = 0; j < N; j += 8) {
+    for (unsigned int j = 0; j < N; j += 8) {
       float16x8_t v = vld1q_f16(a_off);
       a_off += 8;
 
@@ -384,10 +384,10 @@ void packing_B16(unsigned int K, unsigned int N, const __fp16 *src,
                  unsigned int ldb, const __fp16 *dst) {
   assert(K != 0 && N != 0 && N % 16 == 0);
 
-  for (int i = 0; i < K; i++) {
+  for (unsigned int i = 0; i < K; i++) {
     const __fp16 *a_off = src + i * ldb;
     __fp16 *b_off = (__fp16 *)dst + i * 16;
-    for (int j = 0; j < N; j += 16) {
+    for (unsigned int j = 0; j < N; j += 16) {
       float16x8_t v0_7 = vld1q_f16(a_off);
       float16x8_t v8_15 = vld1q_f16(a_off + 8);
       a_off += 16;
diff --git a/packaging/nntrainer.spec b/packaging/nntrainer.spec
index 9e4ff0067e..deaafebd1b 100644
--- a/packaging/nntrainer.spec
+++ b/packaging/nntrainer.spec
@@ -131,13 +131,13 @@ BuildRequires: tensorflow2-lite-devel
 BuildRequires: tensorflow2-lite-devel
 %endif # support_tflite_interpreter
 
-%define enable_nnstreamer_tensor_filter -Denable-nnstreamer-tensor-filter=false
-%define enable_nnstreamer_tensor_trainer -Denable-nnstreamer-tensor-trainer=false
+%define enable_nnstreamer_tensor_filter -Denable-nnstreamer-tensor-filter=disabled
+%define enable_nnstreamer_tensor_trainer -Denable-nnstreamer-tensor-trainer=disabled
 
 %if  0%{?nnstreamer_filter}
 Requires:	nnstreamer-nntrainer = %{version}-%{release}
 BuildRequires:	nnstreamer-devel
-%define enable_nnstreamer_tensor_filter -Denable-nnstreamer-tensor-filter=true
+%define enable_nnstreamer_tensor_filter -Denable-nnstreamer-tensor-filter=enabled
 
 %if 0%{?unit_test}
 %if 0%{tizen_version_major}%{tizen_version_minor} > 60
@@ -151,7 +151,7 @@ BuildRequires:	python
 %if  0%{?nnstreamer_trainer}
 Requires:	nnstreamer-nntrainer = %{version}-%{release}
 BuildRequires:	nnstreamer-devel
-%define enable_nnstreamer_tensor_trainer -Denable-nnstreamer-tensor-trainer=true
+%define enable_nnstreamer_tensor_trainer -Denable-nnstreamer-tensor-trainer=enabled
 %endif # nnstreamer_trainer
 %endif # tizen
 
@@ -413,8 +413,8 @@ meson --buildtype=plain --prefix=%{_prefix} --sysconfdir=%{_sysconfdir} \
       %{enable_profile} %{enable_nnstreamer_backbone} %{enable_tflite_backbone} \
       %{enable_tflite_interpreter} %{capi_ml_pkg_dep_resolution} \
       %{enable_reduce_tolerance} %{configure_subplugin_install_path} %{enable_debug} \
-      -Dml-api-support=enabled -Denable-nnstreamer-tensor-filter=enabled \
-      -Denable-nnstreamer-tensor-trainer=enabled -Denable-capi=enabled \
+      -Dml-api-support=enabled \
+      -Denable-capi=enabled \
       %{fp16_support} %{neon_support} build
 
 ninja -C build %{?_smp_mflags}
@@ -565,9 +565,18 @@ cp -r result %{buildroot}%{_datadir}/nntrainer/unittest/
 %{_includedir}/nntrainer/util_func.h
 %{_includedir}/nntrainer/fp16.h
 %{_includedir}/nntrainer/util_simd.h
+# In the current version, Neon SIMD is enabled only when FP16 is enabled with AArch64. 
+# This may be subject to change in future versions.
+%ifarch aarch64
 %if 0%{?enable_fp16}
 %{_includedir}/nntrainer/util_simd_neon.h
+%{_includedir}/nntrainer/blas_neon.h
+%{_includedir}/nntrainer/hgemm.h
+%{_includedir}/nntrainer/hgemm_util.h
+%endif
 %endif
+%{_includedir}/nntrainer/acti_func.h
+
 
 %files devel-static
 %{_libdir}/libnntrainer*.a