본문으로 건너뛰기

데이터 Skills (Data)

데이터 Skills 讓 OpenClaw Agent 具備大規模데이터擷取、分析和管理的能力。從網頁크롤링到本機데이터庫查詢,這些 Skills 把 Agent 變成你的데이터工程師。


#18 — Firecrawl

屬性內容
排名#18 / 50
類別Data
總分58 / 80
成熟度🟡 Beta
官方/社群社群 (Community)
설치方式clawhub install community/firecrawl-claw
目標사용자데이터工程師、需要大量網頁데이터的사용자

기능 설명

Firecrawl 是專為 AI Agent 設計的網頁크롤링服務:

  • 智慧크롤링:自動處理 JavaScript 渲染、分頁、Infinite Scroll
  • 結構化輸出:將網頁內容轉為 Markdown 或 JSON
  • 批次크롤링:同時크롤링整個網站
  • Sitemap 支援:自動偵測和遵循 sitemap
  • 反爬蟲處理:自動處理 CAPTCHA 和 rate limiting
  • LLM 友善格式:輸出格式最佳化,適合 LLM 消化

중요한 이유

Web Browsing Skill 適合瀏覽個別網頁,但若需要크롤링整個網站的데이터,Firecrawl 是更高效的選擇。它的輸出格式直接為 LLM 最佳化,Agent 可以立即處理,不需要額外的데이터清理。

평점 상세

RELCOMTRCVALMNTRLBSECLRN總分
7778877758

설치 및 설정

clawhub install community/firecrawl-claw

# 설정 Firecrawl API Key
openclaw skill configure firecrawl-claw \
--api-key fc-xxxxxxxxxxxx

# 單頁크롤링
openclaw run "用 Firecrawl 크롤링 https://docs.example.com/api 並轉為 Markdown"

# 整站크롤링
openclaw run firecrawl-claw \
--crawl https://docs.example.com \
--max-pages 100 \
--output ~/data/example-docs/

의존성 및 보안

  • 依賴:Firecrawl API Key(免費方案 500 頁/月)
  • 권한需求:網路存取、本機檔案寫入
  • 安全性:SEC 7/10 — 크롤링的網頁內容可能包含惡意데이터
  • 替代方案:Apify(#21)更強大但更複雜;Web Browsing(#2)for 個別頁面

#21 — Apify

屬性內容
排名#21 / 50
類別Data
總分56 / 80
成熟度🟡 Beta
官方/社群社群 (Community)
설치方式clawhub install community/apify-claw
目標사용자데이터工程師、需要複雜爬蟲的사용자

기능 설명

Apify 是全球最大的網頁크롤링平台,提供:

  • 2000+ 預建 Actors:針對 Amazon、Google Maps、Instagram 等特定網站的爬蟲
  • 自訂爬蟲:使用 Apify SDK 생성客製化爬蟲
  • 데이터저장:內建 Dataset 和 Key-Value Store
  • 스케줄링실행:定時自動크롤링
  • Proxy 管理:內建 Proxy 池,降低被封鎖機率

중요한 이유

相較於 Firecrawl 的通用크롤링,Apify 的優勢在於針對特定網站的「Actors」。例如你想크롤링 Amazon 商品데이터,Apify 有現成的 Actor 可以使用,不需要自己處理 Amazon 的反爬蟲機制。

평점 상세

RELCOMTRCVALMNTRLBSECLRN總分
7778776756

설치 및 설정

clawhub install community/apify-claw

# 설정 Apify API Token
openclaw skill configure apify-claw \
--token apify_api_xxxxxxxxxxxx

# 실행預建 Actor
openclaw run apify-claw \
--actor "apify/google-search-scraper" \
--input '{"queries": ["OpenClaw skills"]}'

# 使用自然語言
openclaw run "用 Apify 크롤링 Google Maps 上서울市的咖啡廳데이터"

의존성 및 보안

  • 依賴:Apify API Token(免費方案有使用額度)
  • 권한需求:Apify Platform 存取
  • 安全性:SEC 6/10 — 크롤링的데이터和 Actors 品質參差不齊
크롤링컴플라이언스

大規模크롤링可能違反目標網站的 Terms of Service。使用 Apify 前請確認:

  • 目標網站是否允許크롤링(檢查 robots.txt)
  • 是否遵守相關데이터保護法規(如 GDPR)
  • 크롤링頻率是否合理
  • 替代方案:Firecrawl(#18)更簡單;Web Browsing(#2)for 小規模需求

#28 — DuckDB CRM

屬性內容
排名#28 / 50
類別Data
總分55 / 80
成熟度🟡 Beta
官方/社群社群 (Community)
설치方式clawhub install community/duckdb-crm
目標사용자業務人員、需要輕量 CRM 的사용자

기능 설명

基於 DuckDB 的輕量級 CRM 系統:

  • 聯絡人管理:存儲和검색客戶/聯絡人데이터
  • 互動記錄:記錄每次互動(郵件、電話、會議)
  • SQL 查詢:直接用 SQL 或自然語言查詢 CRM 데이터
  • 임포트/엑스포트:支援 CSV、JSON、Parquet
  • 分析報表:自動產生客戶分析報表

중요한 이유

不是每個人都需要 Salesforce 或 HubSpot。DuckDB CRM 提供一個本機、輕量、免費的 CRM 方案,데이터完全存放在你的電腦上。Agent 可以自動從 Gmail 和 Calendar 中擷取互動記錄,維護你的客戶關係。

평점 상세

RELCOMTRCVALMNTRLBSECLRN總分
6758788655

설치 및 설정

clawhub install community/duckdb-crm

# 初始化 CRM 데이터庫
openclaw skill configure duckdb-crm \
--db-path ~/openclaw-crm.duckdb

# 임포트現有聯絡人
openclaw run duckdb-crm --import contacts.csv

# 自然語言查詢
openclaw run "過去 30 天沒有聯繫的客戶有哪些?"
openclaw run "本月新增了多少筆交易?"

의존성 및 보안

  • 依賴:DuckDB(隨 Skill 自動설치)
  • 권한需求:本機檔案系統讀寫
  • 安全性:SEC 8/10 — 純本機데이터庫,데이터不外傳
  • 替代方案:Notion 데이터庫 + Notion Skill(#13);Airtable Skill(#47)

#34 — Reddit Readonly

屬性內容
排名#34 / 50
類別Data
總分52 / 80
成熟度🟡 Beta
官方/社群社群 (Community)
설치方式clawhub install community/reddit-readonly
目標사용자Reddit 사용자、市場리서치者

기능 설명

唯讀存取 Reddit 內容:

  • 讀取特定 subreddit 的熱門/最新貼文
  • 검색 Reddit 內容
  • 讀取貼文和답변
  • 追蹤特定 subreddit 或關鍵字
  • 情緒分析(搭配 LLM)

중요한 이유

Reddit 是許多社群的核心討論平台。Agent 可以幫你追蹤 r/openclaw、r/artificial 等 subreddit 的最新討論,產生每日요약,讓你不遺漏重要資訊。唯讀設計確保 Agent 不會意外發文。

평점 상세

RELCOMTRCVALMNTRLBSECLRN總分
6766778552

설치 및 설정

clawhub install community/reddit-readonly

# 설정 Reddit API(免費)
openclaw skill configure reddit-readonly \
--client-id your_reddit_client_id \
--client-secret your_reddit_secret

# 使用예시
openclaw run "r/openclaw 今天有什麼熱門討論?"
openclaw run "검색 Reddit 上關於 OpenClaw skills 安全性的討論"

의존성 및 보안

  • 依賴:Reddit API credentials(免費取得)
  • 권한需求:Reddit API 唯讀存取
  • 安全性:SEC 8/10 — 唯讀設計,不會意外發文或投票
  • 替代方案:Web Browsing Skill 直接瀏覽 Reddit(不需 API Key 但效率較低)

#45 — CSV Analyzer

屬性內容
排名#45 / 50
類別Data
總分49 / 80
成熟度🟡 Beta
官方/社群社群 (Community)
설치方式clawhub install community/csv-analyzer
目標사용자데이터分析師、需要處理 CSV 的사용자

기능 설명

快速分析和處理 CSV 檔案:

  • 讀取並요약 CSV 結構
  • 自然語言查詢 CSV 데이터
  • 產生統計요약和차트
  • 데이터清理和轉換
  • 엑스포트為其他格式

평점 상세

RELCOMTRCVALMNTRLBSECLRN總分
6746678549

설치 및 설정

clawhub install community/csv-analyzer

# 使用예시
openclaw run csv-analyzer --file ~/data/sales.csv
openclaw run "分析 sales.csv,找出銷售額最高的前 10 個產品"

의존성 및 보안

  • 依賴:DuckDB(底層引擎)
  • 권한需求:本機檔案讀取
  • 安全性:SEC 8/10 — 本機處理
  • 替代方案:DuckDB CRM(#28)提供更完整的데이터庫功能

#47 — Airtable

屬性內容
排名#47 / 50
類別Data
總分45 / 80
成熟度🟠 Alpha
官方/社群社群 (Community)
설치方式clawhub install community/airtable-claw
目標사용자Airtable 사용자

기능 설명

與 Airtable 데이터庫整合:

  • 讀取和寫入 Airtable 記錄
  • 검색和篩選
  • 생성和管理 Views
  • 自動同步데이터

평점 상세

RELCOMTRCVALMNTRLBSECLRN總分
6546567645

설치 및 설정

clawhub install community/airtable-claw

openclaw skill configure airtable-claw \
--api-key your_airtable_api_key \
--base-id appXXXXXXXXXXX

의존성 및 보안

  • 依賴:Airtable API Key
  • 권한需求:Airtable Base 讀寫
  • 安全性:SEC 7/10 — Airtable API 권한粒度一般
  • 替代方案:Notion(#13)功能更完整;DuckDB CRM(#28)本機方案

데이터 Skills 比較表

特性FirecrawlApifyDuckDB CRMRedditCSV AnalyzerAirtable
데이터來源網頁網頁本機Reddit本機雲端
規模中~大小~中
成本API 費用API 費用免費免費免費API 費用
即時性
離線可用
結構化程度最高

데이터工程師組合推薦

# 網頁데이터擷取
clawhub install community/firecrawl-claw
clawhub install community/apify-claw

# 本機데이터分析
clawhub install community/duckdb-crm
clawhub install community/csv-analyzer

# 社群모니터링
clawhub install community/reddit-readonly
clawhub install community/tweetclaw
clawhub install community/summarize