crawler_ - Code Search

fess-crawler-opensearch/src/test/java/org/codelibs/fess/crawler/CrawlerTest.java

            crawler1.getCrawlerContext().setMaxAccessCount(maxCount);
            crawler1.getCrawlerContext().setNumOfThread(numOfThread);

            final Crawler crawler2 = getComponent(Crawler.class);
            crawler2.setBackground(true);
            ((UrlFilterImpl) crawler2.urlFilter).setIncludeFilteringPattern("$1$2$3.*");
            crawler2.addUrl(url2);
            crawler2.getCrawlerContext().setMaxAccessCount(maxCount);

Created: Sun Apr 12 03:50:13 GMT 2026

- Last Modified: Thu Jan 15 01:11:43 GMT 2026

- 7.8K bytes

- Click Count (0)

github.com/square/okhttp

samples/crawler/src/main/java/okhttp3/sample/Crawler.java

    OkHttpClient client = new OkHttpClient.Builder()
        .cache(cache)
        .callTimeout(5, TimeUnit.SECONDS)
        .build();

    Crawler crawler = new Crawler(client, queueLimit, hostLimit);
    crawler.queue.add(HttpUrl.get(args[1]));
    crawler.parallelDrainQueue(threadCount);
  }

Created: Fri Apr 03 11:42:14 GMT 2026

- Last Modified: Wed Jul 23 00:58:06 GMT 2025

- 5K bytes

- Click Count (0)

github.com/codelibs/fess-crawler

fess-crawler-lasta/src/main/resources/crawler.xml

<components namespace="fessCrawler">
	<include path="crawler/container.xml"/>
	<include path="crawler/client.xml"/>
	<include path="crawler/rule.xml"/>
	<include path="crawler/filter.xml"/>
	<include path="crawler/interval.xml"/>
	<include path="crawler/extractor.xml"/>
	<include path="crawler/mimetype.xml"/>
	<include path="crawler/encoding.xml"/>
	<include path="crawler/urlconverter.xml"/>
	<include path="crawler/log.xml"/>

Created: Sun Apr 12 03:50:13 GMT 2026

- Last Modified: Tue Nov 28 13:40:25 GMT 2017

- 1.7K bytes

- Click Count (0)

github.com/codelibs/fess-crawler

fess-crawler-lasta/src/test/java/org/codelibs/fess/crawler/container/LastaCrawlerContainerTest.java

        // Verify that multiple components can be retrieved
        final Crawler crawler1 = crawlerContainer.getComponent("crawler");
        final Crawler crawler2 = crawlerContainer.getComponent("crawler");

        // They should be different instances (prototype scope)
        assertNotNull(crawler1);
        assertNotNull(crawler2);
    }

    @Test
    public void test_isLastaCrawlerContainer() {

Created: Sun Apr 12 03:50:13 GMT 2026

- Last Modified: Fri Jan 16 13:52:11 GMT 2026

- 2.7K bytes

- Click Count (0)

github.com/codelibs/fess

src/main/resources/mail/crawler.dfmail

/*
 [Crawler Notification]
 Crawler notification mail.
*/
subject: [FESS] Crawler completed: /*pmb.hostname*/
>>>
--- Server Info ---
Host Name: /*pmb.hostname:orElse('Unknown')*/
Job Name: /*pmb.jobname:orElse('Unknown')*/

--- Web/FileSystem Crawler ---
Start Time: /*pmb.webFsCrawlStartTime:orElse('-')*/
End Time:   /*pmb.webFsCrawlEndTime:orElse('-')*/
Exec Time:  /*pmb.webFsCrawlExecTime:orElse('-')*/ ms

--- Web/FileSystem Indexer ---

Created: Tue Mar 31 13:07:34 GMT 2026

- Last Modified: Wed Jan 15 22:05:20 GMT 2020

- 1K bytes

- Click Count (0)

github.com/codelibs/fess

src/main/java/org/codelibs/fess/crawler/processor/FessResponseProcessor.java

 */
package org.codelibs.fess.crawler.processor;

import org.apache.logging.log4j.LogManager;
import org.apache.logging.log4j.Logger;
import org.codelibs.fess.crawler.entity.AccessResult;
import org.codelibs.fess.crawler.entity.ResponseData;
import org.codelibs.fess.crawler.entity.ResultData;
import org.codelibs.fess.crawler.processor.impl.DefaultResponseProcessor;

Created: Tue Mar 31 13:07:34 GMT 2026

- Last Modified: Thu Jul 17 08:28:31 GMT 2025

- 3.7K bytes

- Click Count (0)

github.com/codelibs/fess-crawler

fess-crawler/src/main/java/org/codelibs/fess/crawler/CrawlerContext.java

 */
package org.codelibs.fess.crawler;

import java.util.Set;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.concurrent.atomic.AtomicLong;

import org.codelibs.core.collection.LruHashSet;
import org.codelibs.fess.crawler.filter.UrlFilter;
import org.codelibs.fess.crawler.interval.IntervalController;
import org.codelibs.fess.crawler.rule.RuleManager;

/**

Created: Sun Apr 12 03:50:13 GMT 2026

- Last Modified: Wed Dec 31 09:07:38 GMT 2025

- 9K bytes

- Click Count (0)

github.com/codelibs/fess

docs/fr/README.md

* [LastaFlute](https://github.com/lastaflute/lastaflute "LastaFlute") : Framework Web
* [Lasta Job](https://github.com/lastaflute/lasta-job "Lasta Job") : Planificateur de tâches
* [Fess Crawler](https://github.com/codelibs/fess-crawler "Fess Crawler") : Crawler Web

Created: Tue Mar 31 13:07:34 GMT 2026

- Last Modified: Tue Nov 11 22:42:32 GMT 2025

- 7.9K bytes

- Click Count (0)

github.com/codelibs/fess

docs/de/README.md

* [LastaFlute](https://github.com/lastaflute/lastaflute "LastaFlute"): Web-Framework
* [Lasta Job](https://github.com/lastaflute/lasta-job "Lasta Job"): Job-Scheduler
* [Fess Crawler](https://github.com/codelibs/fess-crawler "Fess Crawler"): Web-Crawler

Created: Tue Mar 31 13:07:34 GMT 2026

- Last Modified: Tue Nov 11 22:42:32 GMT 2025

- 7.8K bytes

- Click Count (0)

github.com/codelibs/fess

src/main/java/org/codelibs/fess/app/web/admin/webconfig/CreateForm.java

     * Document URL patterns to exclude from search index.
     */
    @CustomSize(maxKey = "form.admin.max.input.size")
    public String excludedDocUrls;

    /**
     * Additional configuration parameters for the crawler.
     */
    @CustomSize(maxKey = "form.admin.max.input.size")
    public String configParameter;

    /**
     * The maximum crawling depth from the starting URLs.
     */
    @Min(value = 0)

Created: Tue Mar 31 13:07:34 GMT 2026

- Last Modified: Thu Jul 17 08:28:31 GMT 2025

- 5.9K bytes

- Click Count (0)

Search Options