Tokenizer - Code Search

compat/maven-model-builder/src/main/java/org/apache/maven/model/interpolation/reflection/ReflectionValueExtractor.java

        final Tokenizer tokenizer;
        if (trimRootToken && hasDots) {
            tokenizer = new Tokenizer(expression);
            tokenizer.nextPropertyName();
            if (tokenizer.getPosition() == EOF) {
                return null;
            }
        } else {
            tokenizer = new Tokenizer("." + expression);
        }

Registered: Sun Dec 28 03:35:09 UTC 2025

- Last Modified: Tue Feb 25 08:27:34 UTC 2025

- 10.8K bytes

- Viewed (0)

github.com/codelibs/fess

src/main/resources/fess_indices/fess.json

          "type": "custom",
          "tokenizer": "standard",
          "filter": [
            "truncate20_filter",
            "lowercase",
            "arabic_stop",
            "arabic_normalization",
            "arabic_keywords",
            "arabic_override",
            "arabic_stemmer"
          ]
        },
        "armenian_analyzer": {
          "tokenizer":  "standard",
          "filter": [

Registered: Sat Dec 20 09:19:18 UTC 2025

- Last Modified: Fri Jun 06 14:17:42 UTC 2025

- 39.8K bytes

- Viewed (0)

github.com/google/guava

android/guava/src/com/google/common/net/MediaType.java

    checkNotNull(input);
    Tokenizer tokenizer = new Tokenizer(input);
    try {
      String type = tokenizer.consumeToken(TOKEN_MATCHER);
      consumeSeparator(tokenizer, '/');
      String subtype = tokenizer.consumeToken(TOKEN_MATCHER);
      ImmutableListMultimap.Builder<String, String> parameters = ImmutableListMultimap.builder();
      while (tokenizer.hasMore()) {
        consumeSeparator(tokenizer, ';');

Registered: Fri Dec 26 12:43:10 UTC 2025

- Last Modified: Thu Oct 02 01:46:40 UTC 2025

- 48K bytes

- Viewed (0)

github.com/google/guava

guava/src/com/google/common/net/MediaType.java

    checkNotNull(input);
    Tokenizer tokenizer = new Tokenizer(input);
    try {
      String type = tokenizer.consumeToken(TOKEN_MATCHER);
      consumeSeparator(tokenizer, '/');
      String subtype = tokenizer.consumeToken(TOKEN_MATCHER);
      ImmutableListMultimap.Builder<String, String> parameters = ImmutableListMultimap.builder();
      while (tokenizer.hasMore()) {
        consumeSeparator(tokenizer, ';');

Registered: Fri Dec 26 12:43:10 UTC 2025

- Last Modified: Thu Oct 02 01:46:40 UTC 2025

- 48K bytes

- Viewed (0)

github.com/codelibs/fess-suggest

src/test/java/org/codelibs/fess/suggest/converter/AnalyzerConverterTest.java

                .put("analysis.analyzer.test_reading_analyzer.tokenizer", "standard")
                .put("analysis.analyzer.test_reading_term_analyzer.type", "custom")
                .put("analysis.analyzer.test_reading_term_analyzer.tokenizer", "standard")
                .put("analysis.analyzer.test_reading_analyzer_ja.type", "custom")
                .put("analysis.analyzer.test_reading_analyzer_ja.tokenizer", "keyword")

Registered: Sat Dec 20 13:04:59 UTC 2025

- Last Modified: Mon Sep 01 13:33:03 UTC 2025

- 12.5K bytes

- Viewed (0)

github.com/codelibs/corelib

README.md

String escaped = JsonUtil.escape("Hello \"World\" with special chars");
String unescaped = JsonUtil.unescape(escaped);

// Text tokenization
Tokenizer tokenizer = new Tokenizer("field1,field2,field3", ",");
while (tokenizer.hasMoreTokens()) {
    String token = tokenizer.nextToken();
    // Process each token
}

// Decimal formatting
DecimalFormat format = DecimalFormatUtil.getDecimalFormat("###,###.00");
```

Registered: Sat Dec 20 08:55:33 UTC 2025

- Last Modified: Sun Aug 31 02:56:02 UTC 2025

- 12.7K bytes

- Viewed (0)

github.com/codelibs/fess-suggest

src/test/java/org/codelibs/fess/suggest/analysis/SuggestAnalyzerTest.java

        List<AnalyzeToken> tokens = analyzer.analyzeAndReading(text, field, lang);

        assertNotNull(tokens);
        assertEquals(2, tokens.size()); // "Test123" and "ABC-456" (hyphen is not a split char in our tokenizer)
        assertEquals("Test123", tokens.get(0).getTerm());
        assertEquals("ABC-456", tokens.get(1).getTerm());
        assertEquals("TEST123", ((TestAnalyzeToken) tokens.get(0)).getReading());

Registered: Sat Dec 20 13:04:59 UTC 2025

- Last Modified: Mon Sep 01 13:33:03 UTC 2025

- 15.7K bytes

- Viewed (0)

github.com/codelibs/fess-suggest

src/test/java/org/codelibs/opensearch/extension/analysis/NGramSynonymTokenizer.java

 */

import java.io.IOException;
import java.util.ArrayList;
import java.util.Comparator;
import java.util.List;
import java.util.PriorityQueue;

import org.apache.lucene.analysis.Tokenizer;
import org.apache.lucene.analysis.synonym.SynonymMap;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.apache.lucene.analysis.tokenattributes.OffsetAttribute;

Registered: Sat Dec 20 13:04:59 UTC 2025

- Last Modified: Sat Mar 15 06:51:20 UTC 2025

- 17K bytes

- Viewed (0)

github.com/codelibs/fess

ADDING_NEW_LANGUAGE.md

      },
      "swedish_stemmer": {
        "type": "stemmer",
        "language": "swedish"
      }
    },
    "analyzer": {
      "sv_analyzer": {
        "type": "custom",
        "tokenizer": "standard",
        "filter": ["lowercase", "swedish_stop", "swedish_stemmer"]
      }
    }
  }
}
```

### 2. Add Custom Dictionaries (Optional)

Registered: Sat Dec 20 09:19:18 UTC 2025

- Last Modified: Thu Nov 06 11:36:30 UTC 2025

- 10.4K bytes

- Viewed (1)

github.com/golang/go

src/cmd/asm/internal/lex/input.go

		if i > 0 {
			name, value = name[:i], name[i+1:]
		}
		tokens := Tokenize(name)
		if len(tokens) != 1 || tokens[0].ScanToken != scanner.Ident {
			fmt.Fprintf(os.Stderr, "asm: parsing -D: %q is not a valid identifier name\n", tokens[0])
			flags.Usage()
		}
		macros[name] = &Macro{
			name:   name,
			args:   nil,
			tokens: Tokenize(value),
		}
	}
	return macros
}

var panicOnError bool // For testing.

Registered: Tue Dec 30 11:13:12 UTC 2025

- Last Modified: Wed Nov 12 03:59:40 UTC 2025

- 12.4K bytes

- Viewed (0)

Search Options