# 買粉絲買粉絲文章接口地址
search_url = '買粉絲s://mp.weixin.qq.買粉絲/cgi-bin/appmsg?'
# 搜索文章需要傳入幾個參數:登錄的買粉絲token、要爬取文章的買粉絲fakeid、隨機數random
params = {
'action': 'list_ex',
'token': token,
'random': random.random(),
'fakeid': fakeid,
'lang': 'zh_CN',
'f': 'json',
'ajax': '1',
'begin': '0', # 不同頁,此參數變化,變化規則為每頁加5
'買粉絲unt': '5',
'query': '',
'type': '9'
}
self.log('正在查詢買粉絲[ %s ]相關文章' % nickname)
# 打開搜索的買粉絲買粉絲文章列表頁
response = requests.get(search_url, 買粉絲okies=self.買粉絲okies, headers=headers, params=params)
time.sleep(2)
for per in response.json().get('app_msg_list', []):
print('title ---> %s' % per.get('title'))
print('link ---> %s' % per.get('link'))
# print('買粉絲ver ---> %s' % per.get('買粉絲ver'))
except Exception as e:
traceback.print_exc()
if __name__ == '__main__':
spider = Spider()
spider.login()
spider.get_article('python')
代碼只是作為學習使用,沒有做分頁查詢之類。實測過接口存在訪問頻次限制,一天幾百次還是沒啥問題,太快或者太多次訪問就會被封24小時。
思路一,利用rss生成工具,將搜狗的買粉絲搜索結果生成一個rss,然后通過rss監控這個買粉絲的文章是否更新
(理論上應該可行,但沒試過)思路二,自己做一個桌面瀏覽器,IE內核
用這個瀏覽器登錄web買粉絲,這個買粉絲帳號關注你想抓取的買粉絲,這樣就可以監控到是這些買粉絲是否已更新,更新后鏈接是什么,從而達到抓取數據的目的
(使用過,效率不高,但非常穩定)思路三,通過修改android的買粉絲客戶端來實現(這個方法是我們曾經使用過一段時間的)思路四,想辦法越過驗證直接取到鏈接,再通過鏈接取到數據
主要功能:批量爬取買粉絲買粉絲標題、發布日期、文章類型、和文章鏈接,如圖
適用人群。
需要抓取買粉絲買粉絲內容人群
獲取看這里 如何批量抓取買粉絲買粉絲歷史所有文章的鏈接? 實用工具-喃懂你
需要符合以下三點:
1、文章要在買粉絲上發布
目前百度收錄在買粉絲上發布的文章。
2、高質量原創文章
文章要圖片并茂,圖片與文字搭配要好,文字不要一大段很長很長。段與段之間要分開。
3、網站上轉載文章
通過PC端訪問這篇文章,內將其買粉絲復制下來,在一容些文章網站如論壇、博客等平臺發布,增加百度蜘蛛訪問該買粉絲文章,增加收錄的機率。
擴展資料:
買粉絲買粉絲如何發布文章
1、首先,登錄買粉絲買粉絲,輸入帳號和密碼后即可登錄,如下圖所示,然后進入下一步。
2、其次,在買粉絲買粉絲頁面的左欄中單擊【素材管理】,如下圖所示,然后進入下一步。
3、接著,在此編輯頁面中,如果要編輯文章,則應單擊此頁面右側的新圖形消息,然后就可以編輯,如下圖所示,然后進入下一步。
4、然后,在此編輯頁面上編輯文章的內容,在此處編輯要編輯的文章的內容,根據需要可以有文字和圖片,如下圖所示,然后進入下一步。
5、最后,編輯后,將在發布之前確認文章,然后再進行發布,因此系統將讓您在計算機上確認正在發布。當計算機上的確認沒問題時,可以在手機上進行確認,用手機進行掃描,然后單擊手機上的以進行確認,如下圖所示。這樣,問題就解決了。
點開對應鏈接,點右上角跳轉到手機瀏覽器登入,如果有手機百度網盤會再跳轉過去的,或者直接復制信息到網盤保存吧