Lokalni klienci MCP są tak niedoceniani! Wszyscy korzystają z Cursor, Claude Desktop i ChatGPT jako hostów MCP, ale jeśli tworzysz własne aplikacje wspierające MCP, potrzebujesz niestandardowych klientów. Oto problem: pisanie klientów MCP od podstaw jest bolesne i czasochłonne. Dziś pokażę ci, jak zbudować niestandardowych klientów MCP w kilka minut, a nie godzin. Aby to udowodnić, stworzyłem w pełni prywatnego, ostatecznego asystenta AI, który potrafi: - Łączyć się z dowolnym serwerem MCP - Automatyzować korzystanie z przeglądarki - Bezproblemowo zbierać dane z sieci - Kontrolować terminal mojego komputera - Przetwarzać obrazy, dźwięk i dokumenty - Zapamiętywać wszystko za pomocą grafów wiedzy Sekret? mcp-use — 100% otwarte źródło, które sprawia, że integracja MCP jest trywialna. Budowanie niestandardowych agentów MCP zajmuje 3 kroki: 1. Zdefiniuj konfigurację swojego serwera MCP 2. Połącz dowolny LLM z klientem MCP 3. Wdróż swojego agenta To wszystko. Żadnej skomplikowanej konfiguracji, żadnych zależności własnościowych. Najlepsza część? Wszystko działa lokalnie. Twoje dane pozostają prywatne, a ty kontrolujesz cały stos. Pełne omówienie z kodem...👇
Rozłóżmy to na czynniki, badając każdą integrację i rozumiejąc, jak to działa, używając kodu i ilustracji:
1️⃣ Serwer MCP Stagehand Zaczynamy od umożliwienia naszemu Agentowi kontrolowania przeglądarki, nawigowania po stronach internetowych, robienia zrzutów ekranu itp., korzystając z @Stagehanddev MCP. Poniżej zadałem zapytanie o pogodę, a Agent autonomicznie na nie odpowiedział, inicjując sesję przeglądarki. Sprawdź to👇
2️⃣ Serwer MCP Firecrawl Następnie dodajemy możliwości skanowania, przeszukiwania i głębokiego badania do Agenta. mcp-use wspiera jednoczesne łączenie z wieloma serwerami MCP. Dlatego dodajemy konfigurację MCP @firecrawl_dev do istniejącej konfiguracji i wchodzimy z nią w interakcję. Sprawdź to👇
3️⃣ Serwer Graphiti MCP Jak dotąd, nasz Agent nie ma pamięci. Zapomina wszystko po każdym zadaniu. Serwer MCP Graphiti od @Zep_ai zapewnia naszemu agentowi warstwę pamięci w czasie rzeczywistym opartą na grafie. Możesz również wizualizować ten graf w Neo4j. Sprawdź to👇
4️⃣ Serwer Ragie MCP Następnie zapewniamy multimodalne możliwości RAG Agentowi do przetwarzania tekstów, obrazów, filmów, dźwięków, dokumentów itp. Jest zasilany przez @ragieai MCP. Poniżej poprosiłem go o wymienienie projektów w moim pliku PDF MCP (skomplikowany dokument), a on odpowiedział doskonale. Sprawdź to👇
5️⃣ Serwer GitIngest MCP Następnie, aby zaspokoić potrzeby deweloperów, pozwalamy naszemu Agentowi rozmawiać z dowolnym repozytorium GitHub. Poniżej zapytałem o stos technologiczny mojego przepływu pisania książki, podając link do repozytorium. Wyciągnął odpowiednie informacje, korzystając z serwera MCP. Sprawdź to👇
6️⃣ Serwer terminala MCP Na koniec dajemy naszemu Agentowi kontrolę nad terminalem, aby w razie potrzeby mógł wykonywać polecenia dla dewelopera. Oferuje narzędzia takie jak: - odczyt/zapis/wyszukiwanie/przenoszenie plików - wykonanie polecenia - tworzenie/listowanie katalogu, itd. Sprawdź to👇
Na koniec opakowujemy to w interfejs Streamlit, gdzie możemy dynamicznie zmieniać konfigurację MCP. Daje nam to w 100% lokalnego, ostatecznego asystenta AI, który może przeszukiwać, zbierać dane, ma pamięć, pobiera z multimodalnej bazy wiedzy i wiele więcej. Sprawdź tę demonstrację👇
To koniec! Jeśli uznałeś to za pouczające, podziel się z siecią. Znajdź mnie → @akshay_pachaar ✔️ Po praktyczne spostrzeżenia i samouczki na temat LLM, AI Agents i uczenia maszynowego!
43,92K