首页 - 互联网

python爬虫项目

作者: 五速梦信息网
时间: 2026年06月03日 13:34

import requests
import json
import pymysql class mysql_conn(object):

 # 魔术方法, 初始化, 构造函数<br/>
 def __init__(self):<br/>
     self.db = pymysql.connect(host=&#39;127.0.0.1&#39;, user=&#39;root&#39;, password=&#39;abc123&#39;, port=3306, database=&#39;py1011&#39;)<br/>
     self.cursor = self.db.cursor()<br/>
 # 执行modify(修改)相关的操作<br/>
 def execute_modify_mysql(self, sql):<br/>
     self.cursor.execute(sql)<br/>
     self.db.commit()<br/>
 # 魔术方法, 析构化 ,析构函数<br/>
 def __del__(self):<br/>
     self.cursor.close()<br/>
     self.db.close()

headers = {
# 使用抓包工具分析发送数据请求到json格式的cookie数据，这是此次动态抓取的重点

 &#39;Cookie&#39;:  xq_a_token=584d0cf8d5a5a9809761f2244d8d272bac729ed4; xq_r_token=98f278457fc4e1e5eb0846e36a7296e642b8138a;<br/>
 &#39;User-Agent&#39;: &#39;Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36&#39;,<br/>

}
url = ‘https://xueqiu.com/v4/statuses/public_timeline_by_category.json?since_id=-1&max_id=-1&count=10&category=111' response = requests.get(url,headers=headers) res_dict = json.loads(response.text) list_lsit = res_dict[’list‘] db ={}
for list_item_dict in list_lsit:

 data_dict = json.loads(list_item_dict[&#39;data&#39;])

db[’id‘] = data_dict[’id‘]

 db[&#39;title&#39;] = data_dict[&#39;title&#39;]<br/>
 db[&#39;description&#39;] = data_dict[&#39;description&#39;]<br/>
 db[&#39;target&#39;] = data_dict[&#39;target&#39;]<br/>
 try:<br/>
     sql = &#39;insert into xueqiu (uid,title,description,target) values (&#34;{id}&#34;,&#34;{title}&#34;,&#34;{description}&#34;,&#34;{traget}&#34;)&#39;.fromart(**db)<br/>
     mc = mysql_conn()<br/>
     mc.execute_modify_mysql(sql)<br/>
 except:<br/>
     pass