Dokumentacja Anthropic: 5 wzorców agentowych dla developerów

10 kwietnia 2026 Anthropic opublikowało coś, na co środowisko developerskie czekało od dawna: oficjalny przewodnik po wzorcach koordynacji systemów multi-agentowych. Nie blogpost z ogólnikami. Nie wątek na X. Dokumentację architektoniczną — z pięcioma konkretnymi wzorcami, jawnie opisanymi failure modes i matrycą decyzyjną.

Dlaczego to jest ważne? Bo producent modelu mówi wprost: "tak powinniście budować systemy agentowe na naszej technologii". I po raz pierwszy robi to z pełną transparentnością co do ograniczeń.

Dlaczego dokumentacja od producenta zmienia zasady gry

Do tej pory wiedzę o budowaniu systemów agentowych czerpaliśmy z trzech źródeł: filmów na YouTube, wątków na Twitterze i własnych eksperymentów. Każde z nich ma fundamentalny problem.

YouTube daje wam 20-minutowy tutorial, który działa na demo, ale rozpada się w produkcji. Twitter daje wam hot takes bez kontekstu architektonicznego. Własne eksperymenty kosztują tokeny i czas — i często prowadzą do odkrywania problemów, które producent modelu już dawno zidentyfikował.

Teraz Anthropic mówi: oto pięć wzorców, które widzimy w produkcji. Oto gdzie każdy z nich się wykłada. Oto jak wybrać. I ujawnia przy okazji, że Claude Code — ich flagowe narzędzie do agentic coding generujące 2,5 mld USD ARR — sam używa wzorca orchestrator-subagent.

To nie jest altruizm. Anthropic ma interes biznesowy w tym, żebyśmy budowali skuteczne systemy agentowe. Skuteczne systemy = więcej tokenów = więcej przychodów. Ale tu jest clue: ten interes jest zbieżny z naszym. Mniej zmarnowanych tokenów, szybsze pipeline'y, mniej bugów w produkcji. Transparentność co do failure modes oznacza, że Anthropic gra w grę, w której obie strony wygrywają. I po raz pierwszy wszystkie założenia biznesowe są na stole.

Pięć wzorców — szybki przegląd dla praktyków

Anthropic opisuje pięć wzorców koordynacji agentów. Nie będziemy tu powtarzać całej dokumentacji — przeczytaj oryginał, jest wart każdej minuty. Zamiast tego skupiamy się na tym, co zmienia się z perspektywy developera pracującego z agentic coding.

Generator-weryfikator: pętla jakości

Najprostszy wzorzec. Agent generuje wynik, drugi agent go weryfikuje. Feedback wraca do generatora, pętla trwa aż do akceptacji lub limitu iteracji.

W agentic coding widzisz to codziennie: Claude Code pisze kod, ty (lub agent testujący) sprawdzasz wynik, dajesz feedback, Claude poprawia. Anthropic formalizuje to jako pattern i dodaje kluczowy insight: weryfikator bez jawnych kryteriów to weryfikator, który zatwierdza wszystko. Jeśli twój prompt review to "sprawdź, czy jest OK" — masz iluzję quality control.

Orkiestrator-subagent: Claude Code w praktyce

Anthropic ujawnia wprost, że Claude Code działa na tym wzorcu. Główny agent pisze kod i edytuje pliki. W tle dispatchuje subagentów do przeszukiwania codebase'u, badania niezależnych pytań, eksploracji. Każdy subagent operuje we własnym oknie kontekstowym i zwraca skondensowane wyniki.

Jeśli pracujesz z Claude Code, Cursor czy innym narzędziem agentic — już używasz tego wzorca. Pytanie brzmi: czy świadomie?

Zespoły agentów: długi kontekst, niezależna praca

Różnica kluczowa vs. orkiestrator: pracownicy żyją dłużej. Nie znikają po jednym zadaniu — akumulują kontekst i specjalizację. Praktyczny case: migracja codebase'u, gdzie każdy agent-teammate bierze jeden serwis i przeprowadza go przez pełny cykl.

Dla agentic coding to oznacza: jeśli masz projekt z wieloma niezależnymi modułami — rozważ dedykowanych agentów z pamięcią, zamiast jednego agenta, który za każdym razem startuje od zera.

Szyna komunikatów: event-driven w skali

Publish/subscribe z routerem. Agenci subskrybują tematy, router dostarcza wiadomości. Nowi agenci wchodzą do ekosystemu bez przebudowy istniejących.

W praktyce developerskiej: CI/CD pipeline z agentami. Alert z testów → agent triażujący → routing do agenta fixującego lub agenta raportującego. Dodajesz nowego agenta do pipeline'u bez dotykania istniejących.

Stan współdzielony: wspólna baza wiedzy

Brak koordynatora. Agenci czytają i piszą do wspólnego store'a. Każdy widzi odkrycia pozostałych natychmiast. Anthropic podaje case z research synthesis — ale dla developerów interesujący jest inny scenariusz: debug session, gdzie wielu agentów równolegle bada różne hipotezy i dzieli się wynikami w czasie rzeczywistym.

Najtrudniejszy failure mode to reactive loops — agenci odpowiadają sobie nawzajem bez konwergencji i palą tokeny. Rozwiązanie: warunek terminacji jako element pierwszej klasy architektury.

Porównanie wzorców koordynacji agentów AI

Matryca decyzyjna — jak dobrać wzorzec

Zamiast zgadywać, Anthropic daje cztery pytania kwalifikujące:

Jak długo agent musi utrzymywać kontekst? Krótko, jedno zadanie → orkiestrator-subagent. Długo, wiele kroków → zespoły agentów.
Jak przewidywalny jest workflow? Znany ciąg kroków → orkiestrator. Emergentny → szyna komunikatów.
Czy agenci potrzebują odkryć innych agentów? Nie → zespoły. Tak → stan współdzielony.
Praca = eventy czy akumulacja wiedzy? Eventy → bus. Wiedza → shared state.

Drzewo decyzyjne — jak wybrać wzorzec koordynacji

Kluczowa rekomendacja Anthropic: zaczynaj od orchestrator-subagent. To wzorzec, który obsługuje najszerszy zakres problemów z najniższym narzutem. Obserwuj, gdzie się potyka. Dopiero wtedy ewoluuj.

Czego NIE dowiesz się z YouTube

Filmy o agentic coding na YouTube mają wspólną cechę: pokazują happy path. Działające demo. Wow effect.

Dokumentacja Anthropic robi coś innego — opisuje failure modes. Mówi wprost:

"Verifier told only to check whether output is good will rubber-stamp the generator's output"
"After several handoffs, critical details are often lost or summarized away"
"The system keeps burning tokens on work that isn't converging"

To jest wiedza, którą normalnie zdobywasz po tygodniach eksperymentów i spalonych budżetach tokenowych. Anthropic daje ci ją za darmo, bo chce, żebyś budował systemy, które działają — i wydawał tokeny na produktywną pracę, nie na reactive loops.

Lekcja: czytaj dokumentację od producenta. Nie zamiast eksperymentów — ale przed nimi. Wiesz wtedy, czego szukać i czego unikać.

Co testujemy w REL8 — i dlaczego to piszemy teraz

W momencie, gdy piszemy ten artykuł, nasz zespół aktywnie testuje wzorce z dokumentacji Anthropic w naszych workflow'ach. Nie teoretycznie — w produkcyjnych pipeline'ach, które codziennie generują kod, treści i automatyzacje.

Konkretnie: przebudowujemy naszą architekturę agentową. Do tej pory nasz pipeline (RESEARCH → WRITER → SEO → VISUAL → FRONTEND) działał jak prosty łańcuch. Po lekturze dokumentacji Anthropic widzimy, że to de facto orchestrator-subagent z elementami generator-verifier — tyle że zbudowany intuicyjnie, bez jawnych wzorców.

Teraz eksperymentujemy z kilkoma rzeczami:

Jawne kryteria weryfikacji na każdym etapie pipeline'u (nie "sprawdź, czy jest OK" — ale listy kontrolne z mierzalnymi punktami)
Warunki terminacji dla pętli agentowych — budżet tokenów, limit iteracji, progi konwergencji
Różne modele w różnych rolach — szybszy model do researchu, mocniejszy do pisania, szybki do weryfikacji

Planujemy odpalić te same zadania w różnych konfiguracjach i zmierzyć realne efekty: czas wykonania, koszt tokenów, jakość wyników. Bo dokumentacja to jedno — a dane z produkcji to drugie. Zrobimy benchmarki, opublikujemy wyniki i zobaczymy, czy to, co serwuje Anthropic, przekłada się na rzeczywiste oszczędności.

Będziemy informować o rezultatach na blogu i na LinkedIn.

Co możesz wdrożyć już dziś

Przeczytaj oryginał. Serio. Cała dokumentacja Anthropic to 5 minut czytania i daje ci framework myślowy na miesiące pracy z agentami. Link: claude.com/blog/multi-agent-coordination-patterns

Zmapuj swój obecny workflow na wzorce. Prawdopodobnie już używasz orchestrator-subagent (jeśli pracujesz z Claude Code lub Cursor). Nazwij to. Zidentyfikuj, gdzie pattern się potyka — tam jest punkt ewolucji.

Dodaj jawne kryteria weryfikacji. Jeśli masz agenta, który "sprawdza" wyniki innego agenta — daj mu konkretne kryteria. Rubric. Checklist. Mierzalne punkty.

Wbuduj warunki terminacji. Każda pętla agentowa powinna mieć: limit iteracji, budżet tokenów, timeout. Bez tego płacisz za reactive loops, które nigdy nie konwergują.

Eksperymentuj z modelami w rolach. Nie każdy agent potrzebuje najdroższego modelu. Research agent? Szybki model wystarczy. Writer? Daj mu Opus. Verifier? Haiku z dobrym promptem.

Ile możesz na tym zyskać

Dobrze dobrane wzorce koordynacji to bezpośredni wpływ na koszty i prędkość developmentu:

30–60% mniej zmarnowanych tokenów — gdy agenci nie wchodzą w reactive loops i nie dublują pracy. Jawna dekompozycja kontekstowa + warunki terminacji eliminują jałowe iteracje.

2–5× szybszy pipeline — gdy podzadania biegną równolegle (agent teams) zamiast sekwencyjnie. W agentic coding to różnica między "czekam 10 minut na wynik" a "mam wynik w 2 minuty".

Mniej bugów w code review — generator-verifier z jawnymi kryteriami łapie problemy, których sam generator nie widzi. Anthropic wskazuje, że ten wzorzec zmniejsza liczbę bugów przechodzących do produkcji.

Skalowalność architektury — message bus pozwala dodawać nowych agentów bez modyfikacji istniejących. Shared state eliminuje single point of failure.

Kluczowy insight: dokumentacja od producenta to nie marketing — to architektoniczny shortcut. Zamiast odkrywać failure modes po tygodniach eksperymentów, dostajesz je opisane z góry. Czas, który oszczędzasz na unikaniu znanych pułapek, możesz wydać na eksperymenty, które naprawdę przesuwają granicę.

Wierzymy Anthropic, że chce lepszych efektów dla developerów — przy swoich biznesowych założeniach, które po raz pierwszy są transparentne. To gra, w której obie strony wygrywają. A jedyny sposób, żeby to zweryfikować, to zmierzyć. Właśnie to robimy.

Dlaczego dokumentacja od producenta zmienia zasady gry

Do tej pory wiedzę o budowaniu systemów agentowych czerpaliśmy z trzech źródeł: filmów na YouTube, wątków na Twitterze i własnych eksperymentów. Każde z nich ma fundamentalny problem.