[Python] Python爬取每日早报

说明:

每天早上自己搜新闻太麻烦了,找了个早报网页,直接Python获取就行.

暂时只是爬取到数据、未进行图片可视化操作、后期更新。

效果图:

图片[1]-[Python] Python爬取每日早报-云言博客

代码如下:

'''
早报
早报地址:https://www.163.com/dy/media/T1603594732083.html
'''
import requests
from lxml import etree

def main():
    url="https://www.163.com/dy/media/T1603594732083.html"
    rsp=requests.get(url)
    html=etree.HTML(rsp.text)
    today_url=html.xpath("//h2[@class='media_article_title']/a/@href")[0]
    rsp=requests.get(today_url)
    html=etree.HTML(rsp.text)
    news_list=html.xpath("//div[@class='post_body']/p[2]//text()")
    news_list=news_list[1:]
    for news in news_list:
        print(news)
if __name__ == "__main__":
    main()
© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!评论后一分钟后可见哦~~~
提交
头像

昵称

取消
昵称表情

    暂无评论内容