百度快排探究(一),Python selenium 实现自然搜索访问目标网站

快排是现在比较火热的seo手段,快排即快速排名,相比传统的优化手段,尤其是企业站而言,快排能够快速占据排名,获取流量及客户,也是最热门的韭菜项目,可谓酸爽至极。

快排有没有用,据观察,应该是有用的,不管是从百度专利算法,还是从百度搜索上的排名体现,都能够看到快排的效果,而本渣渣也关注过不少匪夷所思的网站排名,很难说服自己这不是快排的身影效果。

百度快排探究(一),Python selenium 实现自然搜索访问目标网站

首先声明:

第一:市面上确实有很多快排,至于效果,试过才知道,大部分应该都是智商税;第二:本渣渣不会快排,也没有用过快排;第三:本渣渣在尝试探究快排,至于能否实现,还是一个未知数,欢迎一起探讨交流。

还处于探索研究期,有进度会第一时间总结,分享,大概会出一个系列的探索吧,原创不易,点个在看,关注吧!

手里头有一两份快排源码,参考着探索了一下快排,通过Python selenium 实现了自然搜索访问目标网站,已经在百度统计中获取到访问信息。

感兴趣的大佬哥,欢迎交流分享!

Python selenium 环境配置

  1. python3 安装

官网下载python3安装包,选定路径安装并配置环境变量,可自行百度 相关安装教程。

  1. selenium 安装 通过 python pip 安装即可
pip install selenium
  1. 浏览器驱动安装

本渣渣这里使用的是谷歌浏览器,所以安装的 chromedriver 驱动。

关键点

1.百度搜索翻页

遇到的问题,当翻页到第三页的时候,死活翻不过去,一直在第一页以及第二页循环。

    #百度搜索结果翻页
    def get_nextpage(self):
        self.browser.find_element_by_xpath("//div[@id='page']/div[@class='page-inner']/a[@class='n']").click()
        time.sleep(8)

思考

应该是定位翻页元素丢失,同时结合百度搜索相关问题,找到相关内容。

解决方案

另一个翻页版本

   #百度搜索结果翻页第三页
    def get_newnextpage(self,i):
        self.browser.find_element_by_xpath(f"//div[@id='page']/div[@class='page-inner']/a[{i}]").click()
        time.sleep(8)

2.百度搜索网址转码

把搜索结果的网址转化为正常的网页地址。

获取定位元素,使用get_attribute方法。

    #解密匹配网站
    def get_trueurl(self,searchurl,siteurl):
            search_url=searchurl.get_attribute('href')
            #print(search_url)
            # 解密url
            resulturl = requests.head(search_url).headers['location']
            print(resulturl)

3.找到目标网址,并访问

匹配搜索结果的网页地址,直接用 in 即可,这里需要注意的是,访问目标网址的方式,以网址的访问形式是无法统计到自然流量当中的,只能算是直接访问。

    def get_urlchilk(self,searchurl,resulturl,siteurl):
        if siteurl in resulturl:
            print("找到目标网站,开始访问网站..")
            searchurl.click()
            time.sleep(2)

4.一个莫名的错误,待解决中

出现过一两次的错误,如果解决不了,考虑使用 try/except 来跳过这样的错误内容!Selenium中错误:selenium.common.exceptions.ElementClickInterceptedException: Message: element click inte

5.翻页实现

渣渣就是渣渣,使用了笨方法,完成了百度搜索结果前十页,也就是前百名的搜索。

    def main(self,keyword,siteurl):
        self.get_search(keyword)

        print("正在查询第1页搜索结果..")
        self.get_searchurls(siteurl)

        print("正在查询第2页搜索结果..")
        self.get_nextpage()
        self.get_searchurls(siteurl)

        print("正在查询第3页搜索结果..")
        self.get_newnextpage(3)
        self.get_searchurls(siteurl)

        print("正在查询第4页搜索结果..")
        self.get_newnextpage(4)
        self.get_searchurls(siteurl)

        print("正在查询第5页搜索结果..")
        self.get_newnextpage(5)
        self.get_searchurls(siteurl)

        print("正在查询第6页搜索结果..")
        self.get_newnextpage(6)
        self.get_searchurls(siteurl)

        print("正在查询第7页搜索结果..")
        self.get_newnextpage(7)
        self.get_searchurls(siteurl)

        print("正在查询第8页搜索结果..")
        self.get_newnextpage(7)
        self.get_searchurls(siteurl)

        print("正在查询第9页搜索结果..")
        self.get_newnextpage(7)
        self.get_searchurls(siteurl)

        print("正在查询第10页搜索结果..")
        self.get_newnextpage(7)
        self.get_searchurls(siteurl)


当然代码精简和优化的很大余地,或者考虑换一个方式来实现?

以上,实现了百度搜索结果前十页,也就是前100名的搜索提交,可实现自然流量的访问记录,以关键词的自然搜索方式来进入到目标网站当中,百度统计中可以看到访问来路。

总结和思考

  1. 如果你的人为模拟够给力,刷百度竞价应该可以实现,不知道百度对于竞价过滤的方式是如何,不过考虑到点的越多,消费越多,百度的力度是否有多大呢,那些真正可以实现快排的,应该可以刷竞价吧!
  2. 如果模拟人为搜索,相关参数,以及设置,需要如何模仿,以达到符合用户搜索的行为呢,这都需要下一步的测试,包括,设备,cookies,以及大部分人所说的ip!

参考来源:

分享百度快排发包python源码核心文件

https://www.52pojie.cn/thread-1035569-1-1.html

selenium之百度搜索,结果列表翻页查询

https://www.cnblogs.com/shouke/p/10158134.html

Selenium中错误:selenium.common.exceptions.ElementClickInterceptedException: Message: element click inte

https://blog.csdn.net/please_fix_/article/details/104949016

文章来源:https://blog.csdn.net/minge89/article/details/108525987

本文来自csdn,经授权后发布,本文观点不代表星空seo立场,转载请联系原作者。

(1)
打赏 支付宝扫一扫 支付宝扫一扫
上一篇 2021-07-15 21:18:22
下一篇 2021-07-22

相关推荐

  • SEO外链怎么做?SEO建立链接的真实目思考

    在很长一段时间里,我们花费大量的时间用于企业网站的外部链接建设,但在很大程度上,我们经常是为了外链而链接,这实际上是违背搜索引擎的本意。  根据以往发外链的经验,星空seo,将通过如下内容阐述:  1、链接本质  对于许多SEO外链推广员而言,获得外链的数量,

    2020-08-20
    2.7K0
  • SEO每天工作,尴尬的事有哪些呢?(经验分享)

    对于任何一个SEO从业者,我们刚开始进入这个行业的时候,总是懵懂的,甚至经常会遭遇一些尴尬的窘境,特别是我们遇到一些行业问题的时候,总是需要咨询相关的前辈。  根据以往制定百度推广方案的经验,星空seo,将通过如下内容阐述:  1、SEO是什么  对于新人而言

    2020-08-20
    2.6K0
  • SEO与新媒体平台都喜欢的标题怎么写?(举例说明)

    标题党,这里先简述一下,大部分作者往往将标题党定义为那些利用浮夸标题吸引眼球的写手,基本上文不对题,但实际上我认为“标题党”这个词应该作为中性词。道理很简单,在任何时期,我们都得承认标题的作用,一篇好的文章被创作出来,最核心的目的就是推送给更多潜在的读者,而目

    2020-08-19
    1.7K0
  • 为什么SEO被认为不值钱,且非常难做?

    这是一个我们最近经常讨论的话题,很多人经常认为SEO已经接近尾声,越来越没有去操作的价值,并且对于一个常规企业而言,我们很难可以在短期内得到理想的SEO效果。  有的时候,我们在阶段相关问题的时候,理论上应该一分为二的去看待。  根据以往做搜索引擎优化师的经验

    2020-08-18
    2.4K0
  • 一个页面是否具有检索价值,主要有哪4点决定?(魔贝考题)

    一个页面是否具有检索价值,主要有哪4点决定? (魔贝考题) 答: 一个页面的检索价值,大致受以下四个要素的影响: 感兴趣的受众群大小 该页面的稀缺程度(可替代性) 该页面的质量高低…

    2020-07-13
    3.4K0
  • SEO见到效果再付费,可信吗?

    对于初创企业而言,在官网上线的时候,大部分都不具备自有SEO团队,由于经费有限,通常大部分的企业都会与SEO机构进行合作,进而满足通过线上获取业务订单的需求。  在接洽一些相关SEO公司的时候,经常会谈论到一个问题:SEO见到效果再付费,这是一些中小企业初识S

    2020-08-18
    1.9K0

发表回复

登录后才能评论