2024-06-17
爬虫
00
请注意,本文编写于 270 天前,最后修改于 259 天前,其中某些信息可能已经过时。

目录

知识总结
爬抖音数据例子

知识总结

表示按照id元素 @表示按照'@value=登 录属性名找 .表示按class属性查找元素 获取id为'kw'的元素对象 ele = page('#kw') 点击元素 # ele.click() # # 输入文本 # ele.input('some text') # # 获取 class 属性 # attr = ele.attr('class') # # 设置 style 属性 # ele.set.attr('style', 'display:none;') # # 获取其子元素中所有 a 元素 # links = ele.eles('tag:a')

爬抖音数据例子

# 导入模块 from DrissionPage import ChromiumPage import datetime # 打开浏览器 page = ChromiumPage() # 监听数据包 page.listen.start('/aweme/v1/web/danmaku/get_v2/?') # 访问网站 page.get('https://www.douyin.com/discover?modal_id=7380306413391760676') # 等待资源包加载 resp=page.listen.wait() # 直接获取相应数据 json_data= resp.response.body # {'danmaku_id': '7381168136491746085', 'danmaku_type': 0, 'danmaku_type_bits': 0, 'digg_count': 0, 'digg_type': 0, 'dislike_type': 0, 'extra': {'big_thumb': None # }, 'from_copy': False, 'has_emoji': False, 'item_id': '7380306413391760676', 'offset_time': 0, 'score': 0.1718582679, 'show_copy': False, 'show_digg': False, 'status': 1, 'text': '麒麟送子', 'user_id': '58529586201' # }, # 列表打印danmaku_list comments=json_data['danmaku_list'] for comment in comments: user_id=comment['user_id'] text=comment['text'] print(user_id + text) # # 直接获取响应数据 # print(json_data)
如果对你有用的话,可以打赏哦
打赏
ali pay
wechat pay