Found 55 results for data-extraction

tavily-mcp

MCP server for advanced web search using Tavily

ofx-data-extractor

A module written in TypeScript that provides a utility to extract data from an OFX file in Node.js and Browser

mcp-omnisearch

MCP server for integrating Omnisearch with LLMs

@toolsdk.ai/tavily-mcp

MCP server for advanced web search using Tavily

agentql-mcp

Model Context Protocol (MCP) server that integrates AgentQL data extraction capabilities.

puremd-mcp

Model Context Protocol (MCP) server for pure.md, the markdown delivery network for LLMs

crawl4ai

TypeScript SDK for Crawl4AI REST API - Bun & Node.js compatible

@aidalinfo/pdf-processor

Powerful PDF data extraction library powered by AI vision models. Transform PDFs into structured, validated data using TypeScript, Zod, and AI providers like Scaleway and Ollama.

site-crawl

A CLI tool to recursively crawl websites and download content

sate.js

🍢 Skewer web data perfectly - Smart Indonesian web crawler library

n8n-nodes-crawl4ai

n8n nodes for Crawl4AI web crawler and data extraction

stepwright

A powerful web scraping library built with Playwright

revit-cli

A scalable CLI tool for Revit communication and data manipulation

@scrapeops/n8n-nodes-scrapeops

n8n community node for ScrapeOps Proxy, Parser, and Data APIs for web scraping and data extraction

llm-gen

A CLI tool to extract text from a static Next.js export and generate llm.txt for LLM ingestion.

ollama-library-scraper

A TypeScript library for scraping model information from the Ollama model library website. Extract details, tags, and metadata from ollama.com/library with a simple, type-safe API.

sanity-font-data-extractor

Extract and analyze font data from documents in Sanity Studio with detailed typography information

n8n-nodes-crawl4ai-les4g

n8n nodes for Crawl4AI web crawler and data extraction - fix

pdf-tax-reader-cl

PDF scraping library for Chilean tax documents. Extract emitter name, economic activities, and address from structured PDF documents like 'CARPETA TRIBUTARIA ELECTRÓNICA PARA SOLICITAR CRÉDITOS'

matter-json

JSON front-matter parser and combiner. Minimal and perfect

@mseep/mcp-omnisearch

MCP server for integrating Omnisearch with LLMs

xscrape

A flexible and powerful library designed to extract and transform data from HTML documents using user-defined schemas

@monostate/node-scraper

Intelligent web scraping with AI Q&A, PDF support and multi-level fallback system - 11x faster than traditional scrapers

cyber-mysql-openai

Intelligent natural language to SQL translator with self-correction capabilities using OpenAI and MySQL

exceltables4js

Convierte un objeto de tabla Excel a JSON.

@wordbricks/next-eval

Web data extraction evaluation framework

n8n-nodes-crawl4ai-dev

n8n nodes for Crawl4AI web crawler and data extraction

jeopardy-json

A tool that scrapes and transforms Jeopardy! games from the J! Archive into structured JSON for trivia platforms and developers.

dataset-config

Parse HTML data attributes into a structured object with automatic type conversion.

aim-guard-mcp

AIM MCP Server :: Guard and Protect your MCPs & AI Chatting

web-scrapify

A simple web scraper that can scrape product details from various e-commerce platforms.

@monostate/browsernative-client

Browser Native client SDK for web scraping and content extraction API

@mseep/agentql-mcp

Model Context Protocol (MCP) server that integrates AgentQL data extraction capabilities.

easy-csv-parser simplifies CSV data parsing in Node.js. Fetch, extract headers, and convert CSV files from URLs to JavaScript objects and JSON effortlessly. Ideal fordevelopers, data analysis, automation, and more.

@mcpflow.io/mcp-tavily-mcp-

Tavily搜索 MCP 服务是一个兼容Model Context Protocol (MCP)协议的高级网络搜索工具，允许AI模型如Claude直接访问互联网上的实时信息。该服务提供两个核心工具：tavily-search用于智能网络搜索，支持按新闻、特定域名筛选；以及tavily-extract用于从网页中提取关键内容。作为专业的搜索解决方案，Tavily MCP 服务支持多种MCP客户端包括Cursor、Cline和Claude Desktop，帮助AI模型获取最新、最相关的网络信息，大幅提升其回答