Add TextChunkingProcessor stats (opensearch-project#1308)

q-andy · YeonghyeonKO · commit fc7724669afd · 2025-05-29T19:09:00.000+09:00
* Add TextChunkingProcessor stats

Signed-off-by: Andy Qin &lt;qinandy@amazon.com&gt;

# Conflicts:
#	CHANGELOG.md

* Update unit and integ tests

Signed-off-by: Andy Qin &lt;qinandy@amazon.com&gt;

---------

Signed-off-by: Andy Qin &lt;qinandy@amazon.com&gt;
Signed-off-by: yeonghyeonKo &lt;dk02315@gmail.com&gt;
diff --git a/CHANGELOG.md b/CHANGELOG.md
@@ -9,6 +9,7 @@ The format is based on [Keep a Changelog](https://keepachangelog.com/en/1.0.0/),
 
 ### Enhancements
 - [Performance Improvement] Add custom bulk scorer for hybrid query (2-3x faster) ([#1289](https://github.com/opensearch-project/neural-search/pull/1289))
+- [Stats] Add stats for text chunking processor algorithms ([#1308](https://github.com/opensearch-project/neural-search/pull/1308))
 
 ### Bug Fixes
 
diff --git a/src/main/java/org/opensearch/neuralsearch/processor/TextChunkingProcessor.java b/src/main/java/org/opensearch/neuralsearch/processor/TextChunkingProcessor.java
@@ -23,7 +23,10 @@
 import org.opensearch.neuralsearch.processor.chunker.Chunker;
 import org.opensearch.index.mapper.IndexFieldMapper;
 import org.opensearch.neuralsearch.processor.chunker.ChunkerFactory;
+import org.opensearch.neuralsearch.processor.chunker.DelimiterChunker;
 import org.opensearch.neuralsearch.processor.chunker.FixedTokenLengthChunker;
+import org.opensearch.neuralsearch.stats.events.EventStatName;
+import org.opensearch.neuralsearch.stats.events.EventStatsManager;
 import org.opensearch.neuralsearch.util.ProcessorDocumentUtils;
 
 import static org.opensearch.neuralsearch.processor.chunker.Chunker.MAX_CHUNK_LIMIT_FIELD;
@@ -192,6 +195,7 @@ public IngestDocument execute(final IngestDocument ingestDocument) {
         runtimeParameters.put(MAX_CHUNK_LIMIT_FIELD, maxChunkLimit);
         runtimeParameters.put(CHUNK_STRING_COUNT_FIELD, chunkStringCount);
         chunkMapType(sourceAndMetadataMap, fieldMap, runtimeParameters);
+        recordChunkingExecutionStats(chunker.getAlgorithmName());
         return ingestDocument;
     }
 
@@ -316,4 +320,12 @@ private List<String> chunkLeafType(final Object value, final Map<String, Object>
         }
         return result;
     }
+
+    private void recordChunkingExecutionStats(String algorithmName) {
+        EventStatsManager.increment(EventStatName.TEXT_CHUNKING_PROCESSOR_EXECUTIONS);
+        switch (algorithmName) {
+            case DelimiterChunker.ALGORITHM_NAME -> EventStatsManager.increment(EventStatName.TEXT_CHUNKING_DELIMITER_EXECUTIONS);
+            case FixedTokenLengthChunker.ALGORITHM_NAME -> EventStatsManager.increment(EventStatName.TEXT_CHUNKING_FIXED_LENGTH_EXECUTIONS);
+        }
+    }
 }
diff --git a/src/main/java/org/opensearch/neuralsearch/processor/chunker/Chunker.java b/src/main/java/org/opensearch/neuralsearch/processor/chunker/Chunker.java
@@ -54,4 +54,6 @@ public interface Chunker {
     static boolean checkRunTimeMaxChunkLimit(int chunkResultSize, int runtimeMaxChunkLimit, int chunkStringCount) {
         return runtimeMaxChunkLimit != DISABLED_MAX_CHUNK_LIMIT && chunkResultSize + chunkStringCount >= runtimeMaxChunkLimit;
     }
+
+    String getAlgorithmName();
 }
diff --git a/src/main/java/org/opensearch/neuralsearch/processor/chunker/DelimiterChunker.java b/src/main/java/org/opensearch/neuralsearch/processor/chunker/DelimiterChunker.java
@@ -83,4 +83,9 @@ public List<String> chunk(final String content, final Map<String, Object> runtim
 
         return chunkResult;
     }
+
+    @Override
+    public String getAlgorithmName() {
+        return ALGORITHM_NAME;
+    }
 }
diff --git a/src/main/java/org/opensearch/neuralsearch/processor/chunker/FixedTokenLengthChunker.java b/src/main/java/org/opensearch/neuralsearch/processor/chunker/FixedTokenLengthChunker.java
@@ -180,4 +180,9 @@ private List<AnalyzeToken> tokenize(final String content, final String tokenizer
             throw new IllegalStateException(String.format(Locale.ROOT, "analyzer %s throws exception: %s", tokenizer, e.getMessage()), e);
         }
     }
+
+    @Override
+    public String getAlgorithmName() {
+        return ALGORITHM_NAME;
+    }
 }
diff --git a/src/main/java/org/opensearch/neuralsearch/stats/events/EventStatName.java b/src/main/java/org/opensearch/neuralsearch/stats/events/EventStatName.java
@@ -18,7 +18,14 @@
  */
 @Getter
 public enum EventStatName implements StatName {
-    TEXT_EMBEDDING_PROCESSOR_EXECUTIONS("text_embedding_executions", "processors.ingest", EventStatType.TIMESTAMPED_EVENT_COUNTER);
+    TEXT_EMBEDDING_PROCESSOR_EXECUTIONS("text_embedding_executions", "processors.ingest", EventStatType.TIMESTAMPED_EVENT_COUNTER),
+    TEXT_CHUNKING_PROCESSOR_EXECUTIONS("text_chunking_executions", "processors.ingest", EventStatType.TIMESTAMPED_EVENT_COUNTER),
+    TEXT_CHUNKING_FIXED_LENGTH_EXECUTIONS(
+        "text_chunking_fixed_length_executions",
+        "processors.ingest",
+        EventStatType.TIMESTAMPED_EVENT_COUNTER
+    ),
+    TEXT_CHUNKING_DELIMITER_EXECUTIONS("text_chunking_delimiter_executions", "processors.ingest", EventStatType.TIMESTAMPED_EVENT_COUNTER);
 
     private final String nameString;
     private final String path;
diff --git a/src/main/java/org/opensearch/neuralsearch/stats/info/InfoStatName.java b/src/main/java/org/opensearch/neuralsearch/stats/info/InfoStatName.java
@@ -20,7 +20,10 @@
 public enum InfoStatName implements StatName {
     // Cluster info
     CLUSTER_VERSION("cluster_version", "", InfoStatType.INFO_STRING),
-    TEXT_EMBEDDING_PROCESSORS("text_embedding_processors_in_pipelines", "processors.ingest", InfoStatType.INFO_COUNTER);
+    TEXT_EMBEDDING_PROCESSORS("text_embedding_processors_in_pipelines", "processors.ingest", InfoStatType.INFO_COUNTER),
+    TEXT_CHUNKING_PROCESSORS("text_chunking_processors", "processors.ingest", InfoStatType.INFO_COUNTER),
+    TEXT_CHUNKING_DELIMITER_PROCESSORS("text_chunking_delimiter_processors", "processors.ingest", InfoStatType.INFO_COUNTER),
+    TEXT_CHUNKING_FIXED_LENGTH_PROCESSORS("text_chunking_fixed_length_processors", "processors.ingest", InfoStatType.INFO_COUNTER);
 
     private final String nameString;
     private final String path;
diff --git a/src/main/java/org/opensearch/neuralsearch/stats/info/InfoStatsManager.java b/src/main/java/org/opensearch/neuralsearch/stats/info/InfoStatsManager.java
@@ -4,7 +4,10 @@
  */
 package org.opensearch.neuralsearch.stats.info;
 
+import org.opensearch.neuralsearch.processor.TextChunkingProcessor;
 import org.opensearch.neuralsearch.processor.TextEmbeddingProcessor;
+import org.opensearch.neuralsearch.processor.chunker.DelimiterChunker;
+import org.opensearch.neuralsearch.processor.chunker.FixedTokenLengthChunker;
 import org.opensearch.neuralsearch.settings.NeuralSearchSettingsAccessor;
 import org.opensearch.neuralsearch.stats.common.StatSnapshot;
 import org.opensearch.neuralsearch.util.NeuralSearchClusterUtil;
@@ -118,6 +121,7 @@ private void addClusterVersionStat(Map<InfoStatName, SettableInfoStatSnapshot<?>
     private void addIngestProcessorStats(Map<InfoStatName, CountableInfoStatSnapshot> stats) {
         List<Map<String, Object>> pipelineConfigs = pipelineServiceUtil.getIngestPipelineConfigs();
 
+        // Iterate through all ingest processors and count their stats individually by calling helpers
         for (Map<String, Object> pipelineConfig : pipelineConfigs) {
             List<Map<String, Object>> ingestProcessors = asListOfMaps(pipelineConfig.get(PROCESSORS_KEY));
             for (Map<String, Object> ingestProcessor : ingestProcessors) {
@@ -128,12 +132,36 @@ private void addIngestProcessorStats(Map<InfoStatName, CountableInfoStatSnapshot
                         case TextEmbeddingProcessor.TYPE:
                             increment(stats, InfoStatName.TEXT_EMBEDDING_PROCESSORS);
                             break;
+                        case TextChunkingProcessor.TYPE:
+                            countTextChunkingProcessorStats(stats, processorConfig);
+                            break;
                     }
                 }
             }
         }
     }
 
+    /**
+     * Counts text chunking processor stats based on processor config
+     * @param stats map containing the stat to increment
+     * @param processorConfig map of the processor config, parsed to add stats
+     */
+    private void countTextChunkingProcessorStats(Map<InfoStatName, CountableInfoStatSnapshot> stats, Map<String, Object> processorConfig) {
+        increment(stats, InfoStatName.TEXT_CHUNKING_PROCESSORS);
+
+        Map<String, Object> algorithmMap = asMap(processorConfig.get(TextChunkingProcessor.ALGORITHM_FIELD));
+
+        Map.Entry<String, Object> algorithmEntry = algorithmMap.entrySet().iterator().next();
+        String algorithmKey = algorithmEntry.getKey();
+
+        switch (algorithmKey) {
+            case DelimiterChunker.ALGORITHM_NAME -> increment(stats, InfoStatName.TEXT_CHUNKING_DELIMITER_PROCESSORS);
+            case FixedTokenLengthChunker.ALGORITHM_NAME -> increment(stats, InfoStatName.TEXT_CHUNKING_FIXED_LENGTH_PROCESSORS);
+            // If no algorithm is specified, the default is fixed length
+            default -> increment(stats, InfoStatName.TEXT_CHUNKING_FIXED_LENGTH_PROCESSORS);
+        }
+    }
+
     /**
      * Increments a countable info stat in the given stat name
      * @param stats map containing the stat to increment
diff --git a/src/test/java/org/opensearch/neuralsearch/processor/TextChunkingProcessorIT.java b/src/test/java/org/opensearch/neuralsearch/processor/TextChunkingProcessorIT.java
@@ -17,9 +17,12 @@
 
 import org.opensearch.index.query.MatchAllQueryBuilder;
 import org.opensearch.neuralsearch.BaseNeuralSearchIT;
+import org.opensearch.neuralsearch.stats.events.EventStatName;
+import org.opensearch.neuralsearch.stats.info.InfoStatName;
 
 public class TextChunkingProcessorIT extends BaseNeuralSearchIT {
     private static final String INDEX_NAME = "text_chunking_test_index";
+    private static final String INDEX_NAME2 = "text_chunking_test_index_2nd";
 
     private static final String OUTPUT_FIELD = "body_chunk";
 
@@ -167,8 +170,57 @@ public void testTextChunkingProcessor_withFixedTokenLengthAlgorithmStandardToken
         assertEquals(1, getDocCount(INDEX_NAME));
     }
 
-    private void validateIndexIngestResults(String indexName, String fieldName, Object expected) {
-        assertEquals(1, getDocCount(indexName));
+    @SneakyThrows
+    public void testTextChunkingProcessor_processorStats_successful() {
+        updateClusterSettings("plugins.neural_search.stats_enabled", true);
+        createPipelineProcessor(FIXED_TOKEN_LENGTH_PIPELINE_WITH_STANDARD_TOKENIZER_NAME);
+        createTextChunkingIndex(INDEX_NAME, FIXED_TOKEN_LENGTH_PIPELINE_WITH_STANDARD_TOKENIZER_NAME);
+
+        // Creating an extra fixed length pipeline
+        createPipelineProcessor(FIXED_TOKEN_LENGTH_PIPELINE_WITH_LOWERCASE_TOKENIZER_NAME);
+
+        createPipelineProcessor(DELIMITER_PIPELINE_NAME);
+        createTextChunkingIndex(INDEX_NAME2, DELIMITER_PIPELINE_NAME);
+
+        String document = getDocumentFromFilePath(TEST_DOCUMENT);
+        ingestDocument(INDEX_NAME, document);
+        ingestDocument(INDEX_NAME, document);
+
+        List<String> expectedPassages = new ArrayList<>();
+        expectedPassages.add("This is an example document to be chunked. The document ");
+        expectedPassages.add("contains a single paragraph, two sentences and 24 tokens by ");
+        expectedPassages.add("standard tokenizer in OpenSearch.");
+        validateIndexIngestResultsWithMultipleDocs(INDEX_NAME, OUTPUT_FIELD, expectedPassages, 2);
+
+        ingestDocument(INDEX_NAME2, document);
+        ingestDocument(INDEX_NAME2, document);
+        ingestDocument(INDEX_NAME2, document);
+
+        expectedPassages = new ArrayList<>();
+        expectedPassages.add("This is an example document to be chunked.");
+        expectedPassages.add(" The document contains a single paragraph, two sentences and 24 tokens by standard tokenizer in OpenSearch.");
+        validateIndexIngestResultsWithMultipleDocs(INDEX_NAME2, OUTPUT_FIELD, expectedPassages, 3);
+
+        // Get stats
+        String responseBody = executeNeuralStatRequest(new ArrayList<>(), new ArrayList<>());
+        Map<String, Object> stats = parseInfoStatsResponse(responseBody);
+        Map<String, Object> allNodesStats = parseAggregatedNodeStatsResponse(responseBody);
+
+        // Parse json to get stats
+        assertEquals(5, getNestedValue(allNodesStats, EventStatName.TEXT_CHUNKING_PROCESSOR_EXECUTIONS));
+        assertEquals(3, getNestedValue(allNodesStats, EventStatName.TEXT_CHUNKING_DELIMITER_EXECUTIONS));
+        assertEquals(2, getNestedValue(allNodesStats, EventStatName.TEXT_CHUNKING_FIXED_LENGTH_EXECUTIONS));
+
+        assertEquals(3, getNestedValue(stats, InfoStatName.TEXT_CHUNKING_PROCESSORS));
+        assertEquals(1, getNestedValue(stats, InfoStatName.TEXT_CHUNKING_DELIMITER_PROCESSORS));
+        assertEquals(2, getNestedValue(stats, InfoStatName.TEXT_CHUNKING_FIXED_LENGTH_PROCESSORS));
+
+        // Reset stats
+        updateClusterSettings("plugins.neural_search.stats_enabled", false);
+    }
+
+    private void validateIndexIngestResultsWithMultipleDocs(String indexName, String fieldName, Object expected, int docCount) {
+        assertEquals(docCount, getDocCount(indexName));
         MatchAllQueryBuilder query = new MatchAllQueryBuilder();
         Map<String, Object> searchResults = search(indexName, query, 10);
         assertNotNull(searchResults);
@@ -183,6 +235,10 @@ private void validateIndexIngestResults(String indexName, String fieldName, Obje
         assertEquals(expected, ingestOutputs);
     }
 
+    private void validateIndexIngestResults(String indexName, String fieldName, Object expected) {
+        validateIndexIngestResultsWithMultipleDocs(indexName, fieldName, expected, 1);
+    }
+
     private void createPipelineProcessor(String pipelineName) throws Exception {
         URL pipelineURLPath = classLoader.getResource(PIPELINE_CONFIGS_BY_NAME.get(pipelineName));
         Objects.requireNonNull(pipelineURLPath);
diff --git a/src/test/java/org/opensearch/neuralsearch/processor/TextChunkingProcessorTests.java b/src/test/java/org/opensearch/neuralsearch/processor/TextChunkingProcessorTests.java
@@ -9,6 +9,7 @@
 import org.apache.lucene.tests.analysis.MockTokenizer;
 import org.junit.Before;
 import java.util.ArrayList;
+import java.util.EnumSet;
 import java.util.HashMap;
 import java.util.List;
 import java.util.Locale;
@@ -37,6 +38,11 @@
 import org.opensearch.neuralsearch.processor.chunker.DelimiterChunker;
 import org.opensearch.neuralsearch.processor.chunker.FixedTokenLengthChunker;
 import org.opensearch.neuralsearch.processor.factory.TextChunkingProcessorFactory;
+import org.opensearch.neuralsearch.settings.NeuralSearchSettingsAccessor;
+import org.opensearch.neuralsearch.stats.events.EventStatName;
+import org.opensearch.neuralsearch.stats.events.EventStatsManager;
+import org.opensearch.neuralsearch.stats.events.TimestampedEventStatSnapshot;
+import org.opensearch.neuralsearch.util.TestUtils;
 import org.opensearch.plugins.AnalysisPlugin;
 import org.opensearch.test.OpenSearchTestCase;
 import static org.opensearch.neuralsearch.processor.TextChunkingProcessor.TYPE;
@@ -92,6 +98,8 @@ public void setup() {
         when(clusterState.metadata()).thenReturn(metadata);
         when(clusterService.state()).thenReturn(clusterState);
         textChunkingProcessorFactory = new TextChunkingProcessorFactory(environment, clusterService, getAnalysisRegistry());
+
+        TestUtils.initializeEventStatsManager();
     }
 
     private Map<String, Object> createFixedTokenLengthParameters() {
@@ -972,4 +980,70 @@ public void testExecute_withIgnoreMissing_thenSucceed() {
         IngestDocument document = processor.execute(ingestDocument);
         assertFalse(document.getSourceAndMetadata().containsKey(OUTPUT_FIELD));
     }
+
+    @SneakyThrows
+    public void testExecute_statsDisabled_thenSucceed() {
+        NeuralSearchSettingsAccessor settingsAccessor = mock(NeuralSearchSettingsAccessor.class);
+        when(settingsAccessor.isStatsEnabled()).thenReturn(false);
+        EventStatsManager.instance().initialize(settingsAccessor);
+
+        TextChunkingProcessor processor = createFixedTokenLengthInstance(createStringFieldMap());
+        IngestDocument ingestDocument = createIngestDocumentWithSourceData(createSourceDataString());
+        IngestDocument document = processor.execute(ingestDocument);
+        assert document.getSourceAndMetadata().containsKey(OUTPUT_FIELD);
+        Object passages = document.getSourceAndMetadata().get(OUTPUT_FIELD);
+        assert (passages instanceof List<?>);
+        List<String> expectedPassages = new ArrayList<>();
+        expectedPassages.add("This is an example document to be chunked. The document ");
+        expectedPassages.add("contains a single paragraph, two sentences and 24 tokens by ");
+        expectedPassages.add("standard tokenizer in OpenSearch.");
+        assertEquals(expectedPassages, passages);
+
+        Map<EventStatName, TimestampedEventStatSnapshot> snapshots = EventStatsManager.instance()
+            .getTimestampedEventStatSnapshots(EnumSet.allOf(EventStatName.class));
+
+        assertEquals(0L, snapshots.get(EventStatName.TEXT_CHUNKING_PROCESSOR_EXECUTIONS).getValue().longValue());
+        assertEquals(0L, snapshots.get(EventStatName.TEXT_CHUNKING_FIXED_LENGTH_EXECUTIONS).getValue().longValue());
+    }
+
+    @SneakyThrows
+    public void testExecute_statsEnabled_withFixedTokenLength_andSourceDataString_thenSucceed() {
+        TextChunkingProcessor processor = createFixedTokenLengthInstance(createStringFieldMap());
+        IngestDocument ingestDocument = createIngestDocumentWithSourceData(createSourceDataString());
+        IngestDocument document = processor.execute(ingestDocument);
+        assert document.getSourceAndMetadata().containsKey(OUTPUT_FIELD);
+        Object passages = document.getSourceAndMetadata().get(OUTPUT_FIELD);
+        assert (passages instanceof List<?>);
+        List<String> expectedPassages = new ArrayList<>();
+        expectedPassages.add("This is an example document to be chunked. The document ");
+        expectedPassages.add("contains a single paragraph, two sentences and 24 tokens by ");
+        expectedPassages.add("standard tokenizer in OpenSearch.");
+        assertEquals(expectedPassages, passages);
+
+        Map<EventStatName, TimestampedEventStatSnapshot> snapshots = EventStatsManager.instance()
+            .getTimestampedEventStatSnapshots(EnumSet.allOf(EventStatName.class));
+
+        assertEquals(1L, snapshots.get(EventStatName.TEXT_CHUNKING_PROCESSOR_EXECUTIONS).getValue().longValue());
+        assertEquals(1L, snapshots.get(EventStatName.TEXT_CHUNKING_FIXED_LENGTH_EXECUTIONS).getValue().longValue());
+    }
+
+    @SneakyThrows
+    public void testExecute_statsEnabled_withDelimiter_andSourceDataString_thenSucceed() {
+        TextChunkingProcessor processor = createDelimiterInstance();
+        IngestDocument ingestDocument = createIngestDocumentWithSourceData(createSourceDataString());
+        IngestDocument document = processor.execute(ingestDocument);
+        assert document.getSourceAndMetadata().containsKey(OUTPUT_FIELD);
+        Object passages = document.getSourceAndMetadata().get(OUTPUT_FIELD);
+        assert (passages instanceof List<?>);
+        List<String> expectedPassages = new ArrayList<>();
+        expectedPassages.add("This is an example document to be chunked.");
+        expectedPassages.add(" The document contains a single paragraph, two sentences and 24 tokens by standard tokenizer in OpenSearch.");
+        assertEquals(expectedPassages, passages);
+
+        Map<EventStatName, TimestampedEventStatSnapshot> snapshots = EventStatsManager.instance()
+            .getTimestampedEventStatSnapshots(EnumSet.allOf(EventStatName.class));
+
+        assertEquals(1L, snapshots.get(EventStatName.TEXT_CHUNKING_PROCESSOR_EXECUTIONS).getValue().longValue());
+        assertEquals(1L, snapshots.get(EventStatName.TEXT_CHUNKING_DELIMITER_EXECUTIONS).getValue().longValue());
+    }
 }
diff --git a/src/test/java/org/opensearch/neuralsearch/stats/events/EventStatNameTests.java b/src/test/java/org/opensearch/neuralsearch/stats/events/EventStatNameTests.java
@@ -45,9 +45,11 @@ public void test_validNames() {
 
     public void test_uniquePaths() {
         Set<String> paths = new HashSet<>();
+
+        // First pass to add all base paths (excluding stat names) to avoid colliding a stat name with a terminal path
+        // e.g. if a.b is a stat, a.b.c cannot be a stat.
         for (EventStatName statName : EVENT_STATS) {
             String path = statName.getPath().toLowerCase(Locale.ROOT);
-            assertFalse(String.format(Locale.ROOT, "Checking path uniqueness for %s", path), paths.contains(path));
             paths.add(path);
         }
 
diff --git a/src/test/java/org/opensearch/neuralsearch/stats/info/InfoStatNameTests.java b/src/test/java/org/opensearch/neuralsearch/stats/info/InfoStatNameTests.java
diff --git a/src/testFixtures/java/org/opensearch/neuralsearch/util/TestUtils.java b/src/testFixtures/java/org/opensearch/neuralsearch/util/TestUtils.java

Original file line number	Diff line number	Diff line change
`@@ -54,4 +54,6 @@ public interface Chunker {`
`54`	`54`	`static boolean checkRunTimeMaxChunkLimit(int chunkResultSize, int runtimeMaxChunkLimit, int chunkStringCount) {`
`55`	`55`	`return runtimeMaxChunkLimit != DISABLED_MAX_CHUNK_LIMIT && chunkResultSize + chunkStringCount >= runtimeMaxChunkLimit;`
`56`	`56`	`}`
	`57`	`+`
	`58`	`+ String getAlgorithmName();`
`57`	`59`	`}`
Original file line number	Diff line number	Diff line change
`@@ -83,4 +83,9 @@ public List<String> chunk(final String content, final Map<String, Object> runtim`
`83`	`83`
`84`	`84`	`return chunkResult;`
`85`	`85`	`}`
	`86`	`+`
	`87`	`+ @Override`
	`88`	`+ public String getAlgorithmName() {`
	`89`	`+ return ALGORITHM_NAME;`
	`90`	`+ }`
`86`	`91`	`}`
Original file line number	Diff line number	Diff line change
`@@ -180,4 +180,9 @@ private List<AnalyzeToken> tokenize(final String content, final String tokenizer`
`180`	`180`	`throw new IllegalStateException(String.format(Locale.ROOT, "analyzer %s throws exception: %s", tokenizer, e.getMessage()), e);`
`181`	`181`	`}`
`182`	`182`	`}`
	`183`	`+`
	`184`	`+ @Override`
	`185`	`+ public String getAlgorithmName() {`
	`186`	`+ return ALGORITHM_NAME;`
	`187`	`+ }`
`183`	`188`	`}`