close

 

import requests

res = request.get("網址")

#得到網址回傳原始碼

res.text

#接下來需要用json re模塊 去分析

import re


#re可以利用正規表達式分割出要的json區塊
#除了正規表達式中的(.*?) <=== 所有文字
#其他括弧都需要跳脫字元 \
#並將後面的res.text匯入search的函式

rs = re.search('if\(window.__jsonp_cb\)\{__jsonp_cb\((.*?)\)\}',res.text)

#rs.group(1)  <===這就是search用正規表達式(.*?) 取出來的
#再利用json分析出json格式的欄位

import json

jd = json.loads(m.group(1))


#接下來可以利用chrome來排版json
#將取得的json存到abc.json裡面
#w為寫入
# as f 將with open這個動作用f來取得
#json.dumps 全部寫入


with open('abc.json','w') as f:
    f.write(json.dumps(jd))

 

#排版完  可以尋找所要的物件類別
#再將他印出即可

#for item in jd['物件類別']:
#   print item['類別中的類別']

for item in jd['itemList']:
    item['nick']

就可以將所需要的欄位找出來~

 

參考資料:大數學

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 水皮 的頭像
    水皮

    水皮的部落格

    水皮 發表在 痞客邦 留言(0) 人氣()