说明:
每天早上自己搜新闻太麻烦了,找了个早报网页,直接Python获取就行.
暂时只是爬取到数据、未进行图片可视化操作、后期更新。
效果图:
![图片[1]-[Python] Python爬取每日早报-云言博客](https://yyink.cn/wp-content/uploads/2021/12/QQ截图20211204230001-1024x754.png)
代码如下:
'''
早报
早报地址:https://www.163.com/dy/media/T1603594732083.html
'''
import requests
from lxml import etree
def main():
url="https://www.163.com/dy/media/T1603594732083.html"
rsp=requests.get(url)
html=etree.HTML(rsp.text)
today_url=html.xpath("//h2[@class='media_article_title']/a/@href")[0]
rsp=requests.get(today_url)
html=etree.HTML(rsp.text)
news_list=html.xpath("//div[@class='post_body']/p[2]//text()")
news_list=news_list[1:]
for news in news_list:
print(news)
if __name__ == "__main__":
main()
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
![[Python] Python爬取每日早报-云言博客](https://yyink.cn/wp-content/uploads/2021/12/QQ截图20211204230001-300x221.png)




![[Windows] PC 微信防撤回插件 适用3.9.11.25【2024-8-25更新】-云言博客](https://yyink.cn/wp-content/uploads/2024/08/20240825220614740-Snipaste_2024-08-25_22-03-13.webp)








暂无评论内容