后羿采集器官方版是提供網頁數據采集的應用工具,功能十分強大,界面設計也比較簡單。提供豐富的采集功能,可以只需輸入網址就能智能識別數據,還支持多種數據導出方式,更支持全操作系統,無縫切換,操作簡單又便捷。
后羿采集器是杭州快憶科技有限公司旗下的一款采集軟件,本產品由前谷歌搜索技術團隊基于人工智能技術研發,功能強大,操作簡單,可謂是居家旅行隨身神器。
1、功能強大,提供企業級服務
后羿采集器提供豐富的采集功能,無論是采集穩定性或是采集效率,都能夠滿足個人、團隊和企業級采集需求。
豐富的功能: 定時采集,自動導出,文件下載,加速引擎,按組啟動和導出,Webhook,RESTful API,智能識別SKU和大圖等。
2、智能識別數據,小白神器
自動識別:列表、表格、鏈接、圖片、價格等
智能模式:基于人工智能算法,只需輸入網址就能智能識別列表數據、表格數據和分頁按鈕,不需要配置任何采集規則,一鍵采集。
3、可視化點擊,簡單上手
流程圖模式:只需根據軟件提示在頁面中進行點擊操作,完全符合人為瀏覽網頁的思維方式,簡單幾步即可生成復雜的采集規則,結合智能識別算法,任何網頁的數據都能輕松采集。
可模擬操作: 輸入文本、點擊、移動鼠標、下拉框、滾動頁面、等待加載、循環操作和判斷條件等。
4、云端賬號,方便快捷
創建后羿采集器賬號并登錄,您的所有采集任務設置都將自動加密保存到后羿的云端服務器,無需擔心采集任務丟失,任務運行及采集的數據均在您本地,而且非常安全,只有您自己在本地登錄客戶端后才能查看。后羿采集器對賬號沒有終端綁定限制,您切換終端時采集任務也會同步更新,任務管理方便快捷。
5、全平臺支持,無縫切換
同時支持Windows、Mac和Linux全操作系統的采集軟件,各平臺版本完全相同,無縫切換。
6、支持多種數據導出方式
采集結果可以導出到本地,支持TXT、excel、CSV和HTML文件格式,也可以直接發布到數據庫(mysql、MongoDB、sql server、PostgreSQL)供您使用。
1、在極光下載站下載后羿采集器安裝包并解壓,找到安裝程序雙擊安裝
2、閱讀并同意許可協議,點擊下一步
3、選擇安裝存儲位置,點擊安裝
4、等待安裝,安裝完成即可打開使用
步驟1:創建采集任務
1-啟動后羿采集器,進入主界面,點擊創建任務按鈕創建 &向導采集任務&
2-輸入百度搜索的URL,包括三種方式
1、手動輸入:在輸入框中直接輸入URL,多個URL時須要換行分割
2、點擊從文件中讀取方式:用戶選擇一個存放URL的文件,文件中可以有多個URL地址,地址須要換行分割。
3、批量添加方式:通過添加并調整地址參數生成多個有規律的地址
步驟2:定制采集過程
1-點擊創建后自動打開第一個URL進而進入向導設置,此處選擇列表頁,點擊下一步
2-填寫搜索關鍵字和選擇輸入關鍵字的輸入框,點擊下一步。進入第一個關鍵字搜索結果頁面后,點擊設置搜索按鈕,點擊下一步
3-點選列表塊中第一塊元素。再點擊結果列表塊中另外一塊元素,此時自動選中列表塊。點擊下一步
4-選擇下一頁按鈕,選中選擇下一頁選項,然后點擊頁面中的下一頁按鈕填充第一個輸入框,第二個數據框可以調節采集運行中點擊下一頁按鈕的次數。理論上次數越多,采集到的數據越多。點擊下一步
5-選擇要采集的字段:在焦點框中點選要抽取的元素后點擊下一步。選擇不進入詳情頁。點擊保存或保存并運行
步驟3:數據采集及導出
1-采集任務運行中。采集完成后,選擇“導出數據”可以把數據都導出到本地文件
2-選擇“導出方式”,將采集好的數據導出,這里可以選擇excel作為導出為格式
3-采集數據導出
網友評論