《硒》慢慢向下滚动

2022-04-12 00:00:00 python selenium screen-scraping web

问题描述

我正在尝试使用Python语言在呈现为Java脚本的网页上进行动态Web抓取。

1)但是,元素仅在我缓慢向下滚动页面时加载。

我已尝试:

driver.execute_script("window.scrollTo(0, Y)") 

(这不起作用,因为它只滚动到页面上的某个点,而忽略了其他结果)

driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")

(这不起作用,因为元素在向下滚动到页面末尾时不会加载-它需要用户缓慢地滚动整个页面)

2)如何让Selify等待加载完所有元素后再将它们返回给我?

我知道此解决方案存在:

myElem = WebDriverWait(browser, delay).until(EC.presence_of_element_located((By.ID, 'IdOfMyElement')))
但是,如果结果在用户向下滚动页面时不断出现,这将如何工作?此代码会不会在检测到该元素第一次出现时使Selify停止?


解决方案

使用execute_async_script向下滚动到页面末尾:

driver.execute_async_script(
            """
        count = 400;
        let callback = arguments[arguments.length - 1];
        t = setTimeout(function scrolldown(){
            console.log(count, t);
            window.scrollTo(0, count);
            if(count < (document.body.scrollHeight || document.documentElement.scrollHeight)){
              count+= 400;
              t = setTimeout(scrolldown, 1000);
            }else{
              callback((document.body.scrollHeight || document.documentElement.scrollHeight));
            }
        }, 1000);"""
        )

相关文章