Czym jest Firecrawl?
Firecrawl to API do web scrapingu stworzone specjalnie dla aplikacji AI. Zamienia dowolną stronę internetową — nawet tę, która działa w całości na JavaScripcie — w czysty Markdown lub ustrukturyzowany JSON, gotowy do przetworzenia przez modele językowe jak GPT-4 czy Claude.
Projekt zdobył ponad 40 000 gwiazdek na GitHubie w ciągu roku od premiery. Tradycyjne scrapery jak BeautifulSoup czy Puppeteer zwracają bałagan — HTML wypełniony nawigacją, reklamami i stopkami. Firecrawl wyciąga tylko to, co ważne, i robi to automatycznie.
Cztery główne tryby Firecrawl
Scrape — jedna strona, czyste dane
Podstawowy endpoint: podajesz URL, dostajesz Markdown. Firecrawl sam obsługuje rendering JavaScriptu, rotację proxy i blokery. Wynikowy Markdown jest pozbawiony nawigacji, reklam i bocznych paneli — tylko treść główna.
Crawl — cała witryna w jednym wywołaniu
Zamiast ręcznie zbierać URL-e, wywołujesz crawl z adresem startowym. Firecrawl sam przeszukuje wszystkie podstrony rekurencyjnie i zwraca ujednoliconą listę dokumentów Markdown.
Map — mapa URL-i całej witryny
Tryb map zwraca drzewo wszystkich URL-i witryny w kilka sekund. Przydatne do audytów SEO i planowania większych operacji crawlowania.
Extract — ustrukturyzowana ekstrakcja z AI
Zamiast pisać selektory CSS, opisujesz co chcesz wyciągnąć jako schemat JSON. Firecrawl używa LLM żeby znaleźć i wyekstrahować dokładnie te dane.
Konkretne zastosowania w firmie
- Monitoring cen konkurencji — automatyczny crawler zbiera dane raz dziennie
- Baza wiedzy dla chatbota — crawlujesz witrynę, wrzucasz Markdown do wektorowej bazy danych
- Lead generation B2B — automatyczne zbieranie danych firm z katalogów branżowych
- Monitoring mediów i treści — śledzisz co pojawia się na konkurencyjnych blogach
- RAG pipeline — Firecrawl daje LLM-owi dostęp do aktualnej zawartości Twojej strony
Integracje z ekosystemem AI
Firecrawl ma gotowe konektory z najpopularniejszymi narzędziami AI:
- LangChain — FirecrawlLoader wczytuje strony bezpośrednio jako dokumenty
- LlamaIndex — FirecrawlReader jako data connector do pipeline'ów RAG
- CrewAI — agent może używać Firecrawl jako narzędzia do przeszukiwania sieci
- MCP (Model Context Protocol) — bezpośrednia integracja z Claude i Cursor
Cennik
- Free — 500 kredytów miesięcznie, bez karty kredytowej
- Hobby — $16/miesiąc — 3 000 kredytów
- Standard — $83/miesiąc — 100 000 kredytów
- Growth — $333/miesiąc — 500 000 kredytów
1 kredyt = 1 scrape
Jedno wywołanie scrape = 1 kredyt. Jeden crawl dużego serwisu to kilkadziesiąt do kilkuset kredytów.
Jak zacząć?
- Zarejestruj się na firecrawl.dev — 500 darmowych kredytów
- Skopiuj klucz API z dashboardu
- Zainstaluj klienta:
pip install firecrawl-pylubnpm install @mendable/firecrawl-js - Podaj URL i uruchom
Pierwszy wynik masz w ciągu 30 sekund. Pełna dokumentacja dostępna pod docs.firecrawl.dev.