Python中Selenium如何使用
本篇文章给大家分享的是有关Python中Selenium如何使用,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
成都创新互联专业网站制作、网站建设,集网站策划、网站设计、网站制作于一体,网站seo、网站优化、网站营销、软文营销等专业人才根据搜索规律编程设计,让网站在运行后,在搜索中有好的表现,专业设计制作为您带来效益的网站!让网站建设为您创造效益。
Selenium介绍
Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,Selenium 可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器(2018年开发者说暂停开发,chromedriver也可以实现同样的功能)),可以接收指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏。
安装
pip install selenium
二、Chromedriver的介绍
Chromedriver 也是一个能够被selenium驱动的浏览器,但是和PhantomJS(网上有很多这个的介绍)的区别在于它是有界面的。Chromedriver下载你需要先查看自己的Chrome浏览器的版本,然后选择对应的Chromedriver。
下载地址:https://npm.taobao.org/mirrors/chromedriver
----- Windows 下安装方式 chromedriver_win32.zip : 版本 ChromeDriver v2.32 (2017-08-30) (支持 Chrome v59-61) 1. 解压 chromedriver_win32.zip 2. 将 chromedriver.exe 移动到 Python安装目录下 (其实放哪都可以,但是需要配环境变量,放Python安装目录下省事) 注意:Chromedriver和电脑上的chrome版本有对应关系,建议使用最新的Chromedriver版本并且更新chrome浏览器到最新版
三、Selenium的基本使用
是否开启无头模式(即是否需要界面)
from selenium.webdriver import Chrome from selenium.webdriver.chrome.options import Options option = Options() # 实例化option对象 option.add_argument("--headless") # 给option对象添加无头参数 driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe", # 实例化浏览器对象,可以指定chromedriver的路径,不指定的话 默认会去找python解释器的同级目录 options=option) # 实例化浏览器对象的时候 把option对象带进来
保存当前网页的截图
from selenium.webdriver import Chrome driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe", # 实例化浏览器对象,可以指定chromedriver的路径,不指定的话 默认会去找python解释器的同级目录 # options=option) # 实例化浏览器对象的时候 把option对象带进来 ) driver.get("https://www.baidu.com/") driver.save_screenshot('baidu.png') # 保存当前网页的截图 driver.close() # 关闭当前网页
浏览器窗口最大化
from selenium.webdriver import Chrome driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe") driver.maximize_window() # 浏览器窗口最大化
在input输入框中输入数据
from selenium.webdriver import Chrome driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe") driver.maximize_window() # 浏览器窗口最大化 ele = driver.find_element_by_id("kw") # 找到id为kw的节点 ele.send_keys("数学") # 向input输入框输入数据
模拟点击
from selenium.webdriver import Chrome driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe") driver.maximize_window() # 浏览器窗口最大化 ele = driver.find_element_by_id("kw") # 找到id为kw的节点 ele.send_keys("数学") # 向input输入框输入数据 ele = driver.find_element_by_id('su') # 找到id为su的节点(百度一下) ele.click() # 模拟点击
根据文本值查找节点
# 找到文本值为百度一下的节点 driver.find_element_by_link_text("百度一下") # 根据链接包含的文本获取元素列表,模糊匹配 driver.find_elements_by_partial_link_text("度一下")
获取当前节点的文本
ele.text # 获取当前节点的文本 ele.get_attribute("data-click") # 获取到属性对应的value
打印当前网页的一些信息
print(driver.page_source) # 打印网页的源码 print(driver.get_cookies()) # 打印出网页的cookie print(driver.current_url) # 打印出当前网页的url
关闭浏览器
driver.close() # 关闭当前网页 driver.quit() # 直接关闭浏览器
页面等待
from selenium.webdriver import Chrome import time from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe") driver.get("https://www.baidu.com/") # time.sleep(1) driver.implicitly_wait(5) # 跟time.sleep类似,比time.sleep更加智能,不会被动的等待时间结束 wait = WebDriverWait(driver, 10) # 等待时间 ele = wait.until(EC.presence_of_element_located((By.ID, "kw"))) ele.send_keys("数学") wait = WebDriverWait(driver, 10) ele = wait.until(EC.element_to_be_clickable((By.ID, 'su'))) ele.click() time.sleep(3) driver.close()
四、Selenium切换窗口
1. 获取当前所有的窗口
current_windows = driver.window_handles #返回一个list.
2. 根据窗口索引进行切换
driver.switch_to.window(current_windows[0])
3. selenium切换iframe
driver.switch_to.frame("iframe的id")
4.切换进入alert
alert = driver.switch_to.alert()
五、Selenium滑动界面
from selenium.webdriver import Chrome import time driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe") driver.get( "https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=78000241_12_hao_pg&wd=selenium%20js%E6%BB%91%E5%8A%A8&fenlei=256&rsv_pq=8215ec3a00127601&rsv_t=a763fm%2F7SHtPeSVYKeWnxKwKBisdp%2FBe8pVsIapxTsrlUnas7%2F7Hoo6FnDp6WsslfyiRc3iKxP2s&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_sug3=31&rsv_sug1=17&rsv_sug7=100&rsv_sug2=0&rsv_btype=i&inputT=9266&rsv_sug4=9770") # 1.滚动到网页底部 js = "document.documentElement.scrollTop=800" # 执行js driver.execute_script(js) time.sleep(1) # 滚动到顶部 js = "document.documentElement.scrollTop=0" driver.execute_script(js) # 执行js time.sleep(1) driver.close()
selenium的优缺点
selenium能够执行页面上的js,对于js渲染的数据和模拟登陆处理起来非常容易。
selenium由于在获取页面的过程中会发送很多请求,所以效率非常低,所以在很多时候需要酌情使用。
以上就是Python中Selenium如何使用,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注创新互联行业资讯频道。
本文标题:Python中Selenium如何使用
标题URL:http://pcwzsj.com/article/jdepce.html