編輯評分: 用戶評分:[總計:0 平均:0] @media(min-width: 500px) { } @media(min-width: 800px) { }
Croft 是一個免費的無代碼數據挖掘 Web 應用程序,它使您能夠在 Internet 上快速提取關鍵和開源信息點擊幾下。除此之外,您還可以使用 Croft 的任務調度功能來保持更新並定期抓取數據。
您需要做的就是構建一次印象,您的數據就可以被抓取了。完成此過程後,您可以以 JSON 格式導出數據。印像是配置元素,用於識別您希望從任何網站提取的詳細信息。每個印像都由其名稱和 URL 描述,來自必須從中抓取數據的網站。
現在讓我們看看 Croft 工作原理的簡要步驟。
工作:
1。 單擊此處導航到 Croft 並使用您的 Google 憑據登錄一個免費帳戶。
2.您現在將被導航到 Croft 儀表板。單擊左側工具欄中的頂部圖標可轉到“目錄”頁面。這些是您可以添加為印象的熱門網站,只需單擊 2 次即可開始數據抓取。
3.單擊任何目錄條目右下角的“+”號,它將作為印象自動添加到儀表板上的相應頁面中。您可以從那裡清楚地查看站點 URL,數據將被抓取。
4.要開始抓取過程,請單擊屏幕右上角的“播放”按鈕並等待一段時間以完成該過程。成功執行抓取後,抓取狀態將顯示為“成功”,您將自動導航到儀表板的“結果”頁面,您可以在其中查看和分析結果。
5.要以 JSON 格式下載數據,只需單擊“結果”頁面右上角的“下載”圖標即可。
6.要從頭開始創建新印象,請單擊工具欄中的“印象”圖標,然後單擊頁面右上角的大“+”號。名稱將自動分配給新印象。如果需要重命名它,然後單擊“創建”按鈕。
7.輸入/粘貼您要抓取的站點的站點 URL,然後像之前一樣單擊“播放”按鈕。抓取完成後,您將能夠在“結果”頁面中查看輸出。
8. Croft 還擁有一個調度功能,可以從網站上抓取數據。單擊工具欄中的“計劃”圖標,然後單擊右上角的“+”號。分配一個計劃標題,從下拉列表中選擇印象並指定數據抓取的頻率——每小時、每天、每週。單擊“創建”,數據抓取將根據您指定的時間表執行。如前所述,數據抓取的結果將在“結果”頁面中可見。
結束評論:
Croft 是一種輕量級且無代碼的基於概念的工具,它您可以使用它輕鬆快速地在 Internet 上輕鬆提取數據和其他開源信息。它還允許您按小時/每天或每周安排數據抓取工作,以便您可以自動保持更新。
繼續嘗試 Croft,讓我們知道您的想法。 單擊此處導航到 Croft。要瀏覽 Croft 文檔,請單擊此處。