跳至主要内容

資料 Skills (Data)

資料類 Skills 讓 OpenClaw Agent 具備大規模資料擷取、分析和管理的能力。從網頁爬取到本機資料庫查詢,這些 Skills 把 Agent 變成你的資料工程師。


#18 — Firecrawl

屬性內容
排名#18 / 50
類別Data
總分58 / 80
成熟度🟡 Beta
官方/社群社群 (Community)
安裝方式clawhub install community/firecrawl-claw
目標使用者資料工程師、需要大量網頁資料的使用者

功能說明

Firecrawl 是專為 AI Agent 設計的網頁爬取服務:

  • 智慧爬取:自動處理 JavaScript 渲染、分頁、Infinite Scroll
  • 結構化輸出:將網頁內容轉為 Markdown 或 JSON
  • 批次爬取:同時爬取整個網站
  • Sitemap 支援:自動偵測和遵循 sitemap
  • 反爬蟲處理:自動處理 CAPTCHA 和 rate limiting
  • LLM 友善格式:輸出格式最佳化,適合 LLM 消化

為什麼重要

Web Browsing Skill 適合瀏覽個別網頁,但若需要爬取整個網站的資料,Firecrawl 是更高效的選擇。它的輸出格式直接為 LLM 最佳化,Agent 可以立即處理,不需要額外的資料清理。

評分明細

RELCOMTRCVALMNTRLBSECLRN總分
7778877758

安裝與設定

clawhub install community/firecrawl-claw

# 設定 Firecrawl API Key
openclaw skill configure firecrawl-claw \
--api-key fc-xxxxxxxxxxxx

# 單頁爬取
openclaw run "用 Firecrawl 爬取 https://docs.example.com/api 並轉為 Markdown"

# 整站爬取
openclaw run firecrawl-claw \
--crawl https://docs.example.com \
--max-pages 100 \
--output ~/data/example-docs/

依賴與安全

  • 依賴:Firecrawl API Key(免費方案 500 頁/月)
  • 權限需求:網路存取、本機檔案寫入
  • 安全性:SEC 7/10 — 爬取的網頁內容可能包含惡意資料
  • 替代方案:Apify(#21)更強大但更複雜;Web Browsing(#2)for 個別頁面

#21 — Apify

屬性內容
排名#21 / 50
類別Data
總分56 / 80
成熟度🟡 Beta
官方/社群社群 (Community)
安裝方式clawhub install community/apify-claw
目標使用者資料工程師、需要複雜爬蟲的使用者

功能說明

Apify 是全球最大的網頁爬取平台,提供:

  • 2000+ 預建 Actors:針對 Amazon、Google Maps、Instagram 等特定網站的爬蟲
  • 自訂爬蟲:使用 Apify SDK 建立客製化爬蟲
  • 資料儲存:內建 Dataset 和 Key-Value Store
  • 排程執行:定時自動爬取
  • Proxy 管理:內建 Proxy 池,降低被封鎖機率

為什麼重要

相較於 Firecrawl 的通用爬取,Apify 的優勢在於針對特定網站的「Actors」。例如你想爬取 Amazon 商品資料,Apify 有現成的 Actor 可以使用,不需要自己處理 Amazon 的反爬蟲機制。

評分明細

RELCOMTRCVALMNTRLBSECLRN總分
7778776756

安裝與設定

clawhub install community/apify-claw

# 設定 Apify API Token
openclaw skill configure apify-claw \
--token apify_api_xxxxxxxxxxxx

# 執行預建 Actor
openclaw run apify-claw \
--actor "apify/google-search-scraper" \
--input '{"queries": ["OpenClaw skills"]}'

# 使用自然語言
openclaw run "用 Apify 爬取 Google Maps 上台北市的咖啡廳資料"

依賴與安全

  • 依賴:Apify API Token(免費方案有使用額度)
  • 權限需求:Apify Platform 存取
  • 安全性:SEC 6/10 — 爬取的資料和 Actors 品質參差不齊
爬取合規

大規模爬取可能違反目標網站的 Terms of Service。使用 Apify 前請確認:

  • 目標網站是否允許爬取(檢查 robots.txt)
  • 是否遵守相關資料保護法規(如 GDPR)
  • 爬取頻率是否合理
  • 替代方案:Firecrawl(#18)更簡單;Web Browsing(#2)for 小規模需求

#28 — DuckDB CRM

屬性內容
排名#28 / 50
類別Data
總分55 / 80
成熟度🟡 Beta
官方/社群社群 (Community)
安裝方式clawhub install community/duckdb-crm
目標使用者業務人員、需要輕量 CRM 的使用者

功能說明

基於 DuckDB 的輕量級 CRM 系統:

  • 聯絡人管理:存儲和搜尋客戶/聯絡人資料
  • 互動記錄:記錄每次互動(郵件、電話、會議)
  • SQL 查詢:直接用 SQL 或自然語言查詢 CRM 資料
  • 匯入/匯出:支援 CSV、JSON、Parquet
  • 分析報表:自動產生客戶分析報表

為什麼重要

不是每個人都需要 Salesforce 或 HubSpot。DuckDB CRM 提供一個本機、輕量、免費的 CRM 方案,資料完全存放在你的電腦上。Agent 可以自動從 Gmail 和 Calendar 中擷取互動記錄,維護你的客戶關係。

評分明細

RELCOMTRCVALMNTRLBSECLRN總分
6758788655

安裝與設定

clawhub install community/duckdb-crm

# 初始化 CRM 資料庫
openclaw skill configure duckdb-crm \
--db-path ~/openclaw-crm.duckdb

# 匯入現有聯絡人
openclaw run duckdb-crm --import contacts.csv

# 自然語言查詢
openclaw run "過去 30 天沒有聯繫的客戶有哪些?"
openclaw run "本月新增了多少筆交易?"

依賴與安全

  • 依賴:DuckDB(隨 Skill 自動安裝)
  • 權限需求:本機檔案系統讀寫
  • 安全性:SEC 8/10 — 純本機資料庫,資料不外傳
  • 替代方案:Notion 資料庫 + Notion Skill(#13);Airtable Skill(#47)

#34 — Reddit Readonly

屬性內容
排名#34 / 50
類別Data
總分52 / 80
成熟度🟡 Beta
官方/社群社群 (Community)
安裝方式clawhub install community/reddit-readonly
目標使用者Reddit 使用者、市場研究者

功能說明

唯讀存取 Reddit 內容:

  • 讀取特定 subreddit 的熱門/最新貼文
  • 搜尋 Reddit 內容
  • 讀取貼文和回覆
  • 追蹤特定 subreddit 或關鍵字
  • 情緒分析(搭配 LLM)

為什麼重要

Reddit 是許多社群的核心討論平台。Agent 可以幫你追蹤 r/openclaw、r/artificial 等 subreddit 的最新討論,產生每日摘要,讓你不遺漏重要資訊。唯讀設計確保 Agent 不會意外發文。

評分明細

RELCOMTRCVALMNTRLBSECLRN總分
6766778552

安裝與設定

clawhub install community/reddit-readonly

# 設定 Reddit API(免費)
openclaw skill configure reddit-readonly \
--client-id your_reddit_client_id \
--client-secret your_reddit_secret

# 使用範例
openclaw run "r/openclaw 今天有什麼熱門討論?"
openclaw run "搜尋 Reddit 上關於 OpenClaw skills 安全性的討論"

依賴與安全

  • 依賴:Reddit API credentials(免費取得)
  • 權限需求:Reddit API 唯讀存取
  • 安全性:SEC 8/10 — 唯讀設計,不會意外發文或投票
  • 替代方案:Web Browsing Skill 直接瀏覽 Reddit(不需 API Key 但效率較低)

#45 — CSV Analyzer

屬性內容
排名#45 / 50
類別Data
總分49 / 80
成熟度🟡 Beta
官方/社群社群 (Community)
安裝方式clawhub install community/csv-analyzer
目標使用者資料分析師、需要處理 CSV 的使用者

功能說明

快速分析和處理 CSV 檔案:

  • 讀取並摘要 CSV 結構
  • 自然語言查詢 CSV 資料
  • 產生統計摘要和圖表
  • 資料清理和轉換
  • 匯出為其他格式

評分明細

RELCOMTRCVALMNTRLBSECLRN總分
6746678549

安裝與設定

clawhub install community/csv-analyzer

# 使用範例
openclaw run csv-analyzer --file ~/data/sales.csv
openclaw run "分析 sales.csv,找出銷售額最高的前 10 個產品"

依賴與安全

  • 依賴:DuckDB(底層引擎)
  • 權限需求:本機檔案讀取
  • 安全性:SEC 8/10 — 本機處理
  • 替代方案:DuckDB CRM(#28)提供更完整的資料庫功能

#47 — Airtable

屬性內容
排名#47 / 50
類別Data
總分45 / 80
成熟度🟠 Alpha
官方/社群社群 (Community)
安裝方式clawhub install community/airtable-claw
目標使用者Airtable 使用者

功能說明

與 Airtable 資料庫整合:

  • 讀取和寫入 Airtable 記錄
  • 搜尋和篩選
  • 建立和管理 Views
  • 自動同步資料

評分明細

RELCOMTRCVALMNTRLBSECLRN總分
6546567645

安裝與設定

clawhub install community/airtable-claw

openclaw skill configure airtable-claw \
--api-key your_airtable_api_key \
--base-id appXXXXXXXXXXX

依賴與安全

  • 依賴:Airtable API Key
  • 權限需求:Airtable Base 讀寫
  • 安全性:SEC 7/10 — Airtable API 權限粒度一般
  • 替代方案:Notion(#13)功能更完整;DuckDB CRM(#28)本機方案

資料 Skills 比較表

特性FirecrawlApifyDuckDB CRMRedditCSV AnalyzerAirtable
資料來源網頁網頁本機Reddit本機雲端
規模中~大小~中
成本API 費用API 費用免費免費免費API 費用
即時性
離線可用
結構化程度最高

資料工程師組合推薦

# 網頁資料擷取
clawhub install community/firecrawl-claw
clawhub install community/apify-claw

# 本機資料分析
clawhub install community/duckdb-crm
clawhub install community/csv-analyzer

# 社群監控
clawhub install community/reddit-readonly
clawhub install community/tweetclaw
clawhub install community/summarize