医院网站建设方案phpcms内容管理系统
- 作者: 五速梦信息网
- 时间: 2026年04月20日 07:01
当前位置: 首页 > news >正文
医院网站建设方案,phpcms内容管理系统,做网站带来的好处,找做牙工作上哪个网站Python 语言向来以丰富的第三方库而闻名#xff0c;今天来介绍几个非常nice的库#xff0c;有趣好玩且强大#xff01;推荐好好学习。 文章目录技术交流数据采集AKShareTuShareGoPUPGeneralNewsExtractor爬虫playwright-pythonawesome-python-login-modelDecryptLoginScylla…Python 语言向来以丰富的第三方库而闻名今天来介绍几个非常nice的库有趣好玩且强大推荐好好学习。 文章目录技术交流数据采集AKShareTuShareGoPUPGeneralNewsExtractor爬虫playwright-pythonawesome-python-login-modelDecryptLoginScyllaProxyPoolgetproxyfreeproxyfake-useragentWeb 相关streamlitwagtailfastapidjango-blog-tutorialdashPyWebIOPython 教程practical-pythonlearn-python3python-guide其他pytoolsamazing-qrshtqdmloguruclickKeymouseGo技术交流
技术要学会分享、交流不建议闭门造车。
本文技术由粉丝群小伙伴推荐分享汇总。有趣使用工具、源码、数据、技术交流提升均可加交流群获取群友已超过3000人添加时最好的备注方式为来源兴趣方向方便找到志同道合的朋友。 方式①、添加微信号dkl88191备注来自CSDN 技术交流 方式②、微信搜索公众号Python学习与数据挖掘后台回复加群 数据采集
在当今互联网时代数据实在是太重要了首先我们就来介绍几个优秀的数据采集项目
AKShare
AKShare 是基于 Python 的财经数据接口库目的是实现对股票、期货、期权、基金、外汇、债券、指数、加密货币等金融产品的基本面数据、实时和历史行情数据、衍生数据从数据采集、数据清洗到数据落地的一套工具主要用于学术研究目的。
import akshare as akstock_zh_a_hist_df ak.stock_zh_a_hist(symbol000001, perioddaily, start_date20170301, end_date20210907, adjust)
print(stock_zh_a_hist_df)Output: 日期 开盘 收盘 最高 … 振幅 涨跌幅 涨跌额 换手率
0 2017-03-01 9.49 9.49 9.55 … 0.84 0.11 0.01 0.21
1 2017-03-02 9.51 9.43 9.54 … 1.26 -0.63 -0.06 0.24
2 2017-03-03 9.41 9.40 9.43 … 0.74 -0.32 -0.03 0.20
3 2017-03-06 9.40 9.45 9.46 … 0.74 0.53 0.05 0.24
4 2017-03-07 9.44 9.45 9.46 … 0.63 0.00 0.00 0.17… … … … … … … … …
1100 2021-09-01 17.48 17.88 17.92 … 5.11 0.45 0.08 1.19
1101 2021-09-02 18.00 18.40 18.78 … 5.48 2.91 0.52 1.25
1102 2021-09-03 18.50 18.04 18.50 … 4.35 -1.96 -0.36 0.72
1103 2021-09-06 17.93 18.45 18.60 … 4.55 2.27 0.41 0.78
1104 2021-09-07 18.60 19.24 19.56 … 6.56 4.28 0.79 0.84
[1105 rows x 11 columns]https://github.com/akfamily/akshare TuShare
TuShare 是实现对股票/期货等金融数据从数据采集、清洗加工到数据存储过程的工具满足金融量化分析师和学习数据分析的人在数据获取方面的需求它的特点是数据覆盖范围广接口调用简单,响应快速。
不过该项目有一部分功能是收费的大家选择使用哦
import tushare as tsts.get_hist_data(600848) #一次性获取全部数据Output: open high close low volume p_change ma5
date
2012-01-11 6.880 7.380 7.060 6.880 14129.96 2.62 7.060
2012-01-12 7.050 7.100 6.980 6.900 7895.19 -1.13 7.020
2012-01-13 6.950 7.000 6.700 6.690 6611.87 -4.01 6.913
2012-01-16 6.680 6.750 6.510 6.480 2941.63 -2.84 6.813
2012-01-17 6.660 6.880 6.860 6.460 8642.57 5.38 6.822
2012-01-18 7.000 7.300 6.890 6.880 13075.40 0.44 6.788
2012-01-19 6.690 6.950 6.890 6.680 6117.32 0.00 6.770
2012-01-20 6.870 7.080 7.010 6.870 6813.09 1.74 6.832 ma10 ma20 v_ma5 v_ma10 v_ma20 turnover
date
2012-01-11 7.060 7.060 14129.96 14129.96 14129.96 0.48
2012-01-12 7.020 7.020 11012.58 11012.58 11012.58 0.27
2012-01-13 6.913 6.913 9545.67 9545.67 9545.67 0.23
2012-01-16 6.813 6.813 7894.66 7894.66 7894.66 0.10
2012-01-17 6.822 6.822 8044.24 8044.24 8044.24 0.30
2012-01-18 6.833 6.833 7833.33 8882.77 8882.77 0.45
2012-01-19 6.841 6.841 7477.76 8487.71 8487.71 0.21
2012-01-20 6.863 6.863 7518.00 8278.38 8278.38 0.23https://github.com/waditu/tushare GoPUP
GoPUP 项目所采集的数据皆来自公开的数据源不涉及任何个人隐私数据和非公开数据。不过同样的部分接口是需要注册 TOKEN 才能使用的。
import gopup as gp
df gp.weibo_index(word疫情, time_type1hour)
print(df)Output: 疫情
index
2022-12-17 18:15:00 18544
2022-12-17 18:20:00 14927
2022-12-17 18:25:00 13004
2022-12-17 18:30:00 13145
2022-12-17 18:35:00 13485
2022-12-17 18:40:00 14091
2022-12-17 18:45:00 14265
2022-12-17 18:50:00 14115
2022-12-17 18:55:00 15313
2022-12-17 19:00:00 14346
2022-12-17 19:05:00 14457
2022-12-17 19:10:00 13495
2022-12-17 19:15:00 14133https://github.com/justinzm/gopup GeneralNewsExtractor
该项目基于《基于文本及符号密度的网页正文提取方法》论文使用 Python 实现的正文抽取器可以用来提取 HTML 中正文的内容、作者、标题。 from gne import GeneralNewsExtractor html 经过渲染的网页 HTML 代码 extractor GeneralNewsExtractor()result extractor.extract(html, noise_node_list[//div[classcomment-list]])print(result)Output:
{title: xxxx, publish_time: 2019-09-10 11:12:13, author: yyy, content: zzzz, images: [/xxx.jpg, /yyy.png]}新闻页提取示例 https://github.com/GeneralNewsExtractor/GeneralNewsExtractor 爬虫
爬虫也是 Python 语言的一大应用方向很多朋友也都是以爬虫来入门的我们来看看有哪些优秀的爬虫项目吧
playwright-python
微软开源的浏览器自动化工具可以用 Python 语言操作浏览器。支持 Linux、macOS、Windows 系统下的 Chromium、Firefox 和 WebKit 浏览器。
from playwright.sync_api import sync_playwrightwith sync_playwright() as p:for browser_type in [p.chromium, p.firefox, p.webkit]:browser browser_type.launch()page browser.new_page()page.goto(http://whatsmyuseragent.org/)page.screenshot(pathfexample-{browser_type.name}.png)browser.close()https://github.com/microsoft/playwright-python awesome-python-login-model
该项目收集了各大网站登陆方式和部分网站的爬虫程序。登陆方式实现包含 selenium 登录、通过抓包直接模拟登录等。有助于新手研究、编写爬虫。
不过众所周知爬虫是非常吃后期维护的该项目已经很久没有更新了所以各种登录接口是否还能正常使用还存在疑问大家选择使用或者自行二次开发。 https://github.com/Kr1s77/awesome-python-login-model DecryptLogin
相比于上一个该项目则还在持续更新同样是模拟登录各大网站对于新手还是非常有研究价值的。
from DecryptLogin import login# the instanced Login class object
lg login.Login()
use the provided api function to login in the target website (e.g., twitter)
infos_return, session lg.twitter(usernameYour Username, pdYour Pd)https://github.com/CharlesPikachu/DecryptLogin Scylla Scylla 是一款高质量的免费代理 IP 池工具当前仅支持 Python 3.6。 http://localhost:8899/api/v1/statsOutput: {median: 181.2566407083,valid_count: 1780,total_count: 9528,mean: 174.3290085201 }https://github.com/scylladb/scylladb ProxyPool 爬虫代理IP池项目主要功能为定时采集网上发布的免费代理验证入库定时验证入库的代理保证代理的可用性提供API和CLI两种使用方式。同时也可以扩展代理源以增加代理池IP的质量和数量。该项目设计文档详细、模块结构简明易懂同时适合爬虫新手更好的学习爬虫技术。 import requestsdef get_proxy():return requests.get(http://127.0.0.1:5010/get/).json()def delete_proxy(proxy):requests.get(http://127.0.0.1:5010/delete/?proxy{}.format(proxy))# your spider codedef getHtml():# ….retry_count 5proxy get_proxy().get(proxy)while retry_count 0:try:html requests.get(http://www.example.com, proxies{http: http://{}.format(proxy)})# 使用代理访问return htmlexcept Exception:retry_count - 1# 删除代理池中代理delete_proxy(proxy)return Nonehttps://github.com/Python3WebSpider/ProxyPool getproxy getproxy 是一个抓取发放代理网站获取 http/https 代理的程序每 15 min 更新数据。 (test2.7) ➜ ~ getproxy INFO:getproxy.getproxy:[] Init INFO:getproxy.getproxy:[] Current Ip Address: 1.1.1.1 INFO:getproxy.getproxy:[] Load input proxies INFO:getproxy.getproxy:[] Validate input proxies INFO:getproxy.getproxy:[] Load plugins INFO:getproxy.getproxy:[] Grab proxies INFO:getproxy.getproxy:[] Validate web proxies INFO:getproxy.getproxy:[] Check 6666 proxies, Got 666 valid proxies …https://github.com/fate0/getproxy freeproxy 同样是一个抓取免费代理的项目该项目支持抓取的代理网站非常多而且使用简单。 from freeproxy import freeproxyproxy_sources [proxylistplus, kuaidaili] fp_client freeproxy.FreeProxy(proxy_sourcesproxy_sources) headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36 } response fp_client.get(https://space.bilibili.com/406756145, headersheaders) print(response.text)https://github.com/CharlesPikachu/freeproxy fake-useragent 伪装浏览器身份常用于爬虫。这个项目的代码很少可以阅读一下看看ua.random是如何返回随机的浏览器身份的。 from fake_useragent import UserAgent ua UserAgent()ua.ie
Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US);
ua.msie
Mozilla/5.0 (compatible; MSIE 10.0; Macintosh; Intel Mac OS X 10_7_3; Trident/6.0)
ua[Internet Explorer]
Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; GTB7.4; InfoPath.2; SV1; .NET CLR 3.3.69573; WOW64; en-US)
ua.opera
Opera/9.80 (X11; Linux i686; U; ru) Presto/2.8.131 Version/11.11
ua.chrome
Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.2 (KHTML, like Gecko) Chrome/22.0.1216.0 Safari/537.2
ua.google
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4) AppleWebKit/537.13 (KHTML, like Gecko) Chrome/24.0.1290.1 Safari/537.13
ua[google chrome]
Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11
ua.firefox
Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:16.0.1) Gecko/20121011 Firefox/16.0.1
ua.ff
Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:15.0) Gecko/20100101 Firefox/15.0.1
ua.safari
Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25# and the best one, get a random browser user-agent string
ua.randomhttps://github.com/fake-useragent/fake-useragent Web 相关 Python Web 有太多优秀且老牌的库了比如 DjangoFlask 就不说了大家都知道我们介绍几个小众但是好用的。 streamlit streamlit 能够快速地把数据制作成可视化、交互页面的 Python 框架。分分钟让我们的数据变成图表。 import streamlit as stx st.slider(Select a value) st.write(x, squared is, x * x)Output: https://github.com/streamlit/streamlit wagtail 是一个强大的开源 Django CMS内容管理系统。首先该项目更新、迭代活跃其次项目首页提到的功能都是免费的没有付费解锁的骚操作。专注于内容管理不束缚前端实现。 https://github.com/wagtail/wagtail fastapi 基于 Python 3.6 的高性能 Web 框架。“人如其名”用 FastAPI 写接口那叫一个快、调试方便Python 在进步而它基于这些进步让 Web 开发变得更快、更强。 from typing import Unionfrom fastapi import FastAPIapp FastAPI()app.get(/) def read_root():return {Hello: World}app.get(/items/{item_id}) def read_item(item_id: int, q: Union[str, None] None):return {item_id: item_id, q: q}https://github.com/tiangolo/fastapi django-blog-tutorial 这是一个 Django 使用教程该项目一步步带我们使用 Django 从零开发一个个人博客系统在实践的同时掌握 Django 的开发技巧。 https://github.com/jukanntenn/django-blog-tutorial dash dash 是一个专门为机器学习而来的 Web 框架通过该框架可以快速搭建一个机器学习 APP。 https://github.com/plotly/dash PyWebIO 同样是一个非常优秀的 Python Web 框架在不需要编写前端代码的情况下就可以完成整个 Web 页面的搭建实在是方便。 https://github.com/pywebio/PyWebIO Python 教程 practical-python 一个人气超高的 Python 学习资源项目是 MarkDown 格式的教程非常友好。 https://github.com/dabeaz-course/practical-python learn-python3 一个 Python3 的教程该教程采用 Jupyter notebooks 形式便于运行和阅读。并且还包含了练习题对新手友好。 https://github.com/jerry-git/learn-python3 python-guide Requests 库的作者——kennethreitz写的 Python 入门教程。不单单是语法层面的涵盖项目结构、代码风格进阶、工具等方方面面。一起在教程中领略大神的风采吧~ https://github.com/realpython/python-guide 其他 pytools 这是一位大神编写的类似工具集的项目里面包含了众多有趣的小工具。 截图只是冰山一角全貌需要大家自行探索了 import random from pytools import pytoolstool_client pytools.pytools() all_supports tool_client.getallsupported() tool_client.execute(random.choice(list(all_supports.values())))https://github.com/CharlesPikachu/pytools amazing-qr 可以生成动态、彩色、各式各样的二维码真是个有趣的库。 #3 -n, -d amzqr https://github.com -n github_qr.jpg -d …/paths/https://github.com/x-hw/amazing-qr sh sh 是一个成熟的用于替代 subprocess 的库它允许我们调用任何程序看起来它就是一个函数一样。 \( ./run.sh FunctionalTests.test_unicode_arghttps://github.com/amoffat/sh tqdm 强大、快速、易扩展的 Python 进度条库。 from tqdm import tqdm for i in tqdm(range(10000)):...https://github.com/tqdm/tqdm loguru 一个让 Python 记录日志变得简单的库。 from loguru import loggerlogger.debug(Thats it, beautiful and simple logging!)https://github.com/Delgan/loguru click Python 的第三方库用于快速创建命令行。支持装饰器方式调用、多种参数类型、自动生成帮助信息等。 import clickclick.command() click.option(--count, default1, helpNumber of greetings.) click.option(--name, promptYour name, helpThe person to greet.) def hello(count, name):Simple program that greets NAME for a total of COUNT times.for _ in range(count):click.echo(fHello, {name}!)if __name__ __main__:hello()Output: \) python hello.py –count3 Your name: Click Hello, Click! Hello, Click! Hello, Click!KeymouseGo Python 实现的精简绿色版按键精灵记录用户的鼠标、键盘操作自动执行之前记录的操作可设定执行的次数。在进行某些简单、单调重复的操作时使用该软件可以十分省事儿。只需要录制一遍剩下的交给 KeymouseGo 来做就可以了。 https://github.com/taojy123/KeymouseGo 好了这就是今天分享的全部内容喜欢就点个赞吧~
相关文章
-
医院网站建设的目的seo网站优化详解
医院网站建设的目的seo网站优化详解
- 技术栈
- 2026年04月20日
-
医院网站和公众号建设方案做网站为什么一定要去国外
医院网站和公众号建设方案做网站为什么一定要去国外
- 技术栈
- 2026年04月20日
-
医院网站备案前置审批为什么登录不上wordpress
医院网站备案前置审批为什么登录不上wordpress
- 技术栈
- 2026年04月20日
-
医院网站建设方案需要多少钱xml的文档打开乱码程序打开
医院网站建设方案需要多少钱xml的文档打开乱码程序打开
- 技术栈
- 2026年04月20日
-
医院网站建设联系方式建设中网站
医院网站建设联系方式建设中网站
- 技术栈
- 2026年04月20日
-
医院网站建设需求分析筑龙网登录
医院网站建设需求分析筑龙网登录
- 技术栈
- 2026年04月20日






