Os clientes MCP locais são tão subestimados! Todos estão a usar o Cursor, Claude Desktop e ChatGPT como hosts MCP, mas se você está a construir suas próprias aplicações que suportam MCP, precisa de clientes personalizados. Aqui está o problema: escrever clientes MCP do zero é doloroso e demorado. Hoje, vou mostrar-lhe como construir clientes MCP personalizados em minutos, não em horas. Para provar isso, construí um assistente AI totalmente privado e definitivo que pode: - Conectar-se a qualquer servidor MCP - Automatizar o uso do navegador - Extrair dados da web de forma fluida - Controlar o terminal do meu computador - Processar imagens, áudio e documentos - Lembrar-se de tudo com gráficos de conhecimento O segredo? mcp-use — uma estrutura 100% open-source que torna a integração MCP trivial. Construir agentes MCP personalizados leva 3 passos: 1. Defina a configuração do seu servidor MCP 2. Conecte qualquer LLM com o cliente MCP 3. Implemente seu agente É isso. Sem configurações complexas, sem dependências proprietárias. A melhor parte? Tudo funciona localmente. Seus dados permanecem privados e você controla toda a pilha. Análise completa com código...👇
Vamos analisar isto detalhadamente, explorando cada integração e compreendendo como funciona, utilizando código e ilustrações:
1️⃣ Servidor MCP Stagehand Começamos por permitir que o nosso Agente controle um navegador, navegue em páginas da web, tire capturas de tela, etc., usando @Stagehanddev MCP. Abaixo, fiz uma consulta sobre o tempo, e o Agente respondeu autonomamente iniciando uma sessão de navegador. Verifique isto👇
2️⃣ Servidor MCP Firecrawl Em seguida, adicionamos capacidades de scraping, crawling e pesquisa profunda ao Agente. O mcp-use suporta a conexão a vários servidores MCP simultaneamente. Assim, adicionamos a configuração MCP @firecrawl_dev à configuração existente e interagimos com ela. Verifique isto👇
3️⃣ Servidor Graphiti MCP Até agora, o nosso Agente não tem memória. Ele esquece tudo após cada tarefa. O Graphiti da @Zep_ai é um servidor MCP que fornece ao nosso agente uma camada de memória em tempo real baseada em grafos. Você também pode visualizar este grafo no Neo4j. Confira isto👇
4️⃣ Servidor Ragie MCP A seguir, fornecemos capacidades RAG multimodais ao Agente para processar textos, imagens, vídeos, áudios, documentos, etc. É alimentado pela @ragieai MCP. Abaixo, pedi-lhe para listar projetos no meu PDF MCP (um documento complexo), e ele respondeu perfeitamente. Verifique isto👇
5️⃣ Servidor MCP GitIngest Em seguida, para atender às necessidades dos desenvolvedores, permitimos que nosso Agente converse com qualquer repositório do GitHub. Abaixo, perguntei sobre a pilha tecnológica do meu fluxo de escritor de livros fornecendo o link do repositório. Ele extraiu as informações corretas usando o servidor MCP. Confira isto👇
6️⃣ Servidor MCP terminal Finalmente, damos ao nosso Agente o controle do terminal para executar comandos para o desenvolvedor, se necessário. Ele fornece ferramentas como: - ler/escrever/pesquisar/mover arquivos - executar um comando - criar/listar diretório, etc. Verifique isto👇
Por último, envolvemos isto numa interface Streamlit, onde podemos alterar dinamicamente a configuração do MCP. Isto dá-nos um assistente de IA local 100% que pode navegar, extrair informações, tem memória, recuperar de uma base de conhecimento multimodal e muito mais. Veja esta demonstração👇
É isso! Se achou útil, compartilhe com sua rede. Encontre-me → @akshay_pachaar ✔️ Para insights práticos e tutoriais sobre LLMs, Agentes de IA e Aprendizado de Máquina!
43,93K