WordPress百度自动推送JS优化,规避错误、重复推送问题 | 张戈博客

  • 时间:
  • 浏览:54
  • 来源:七月娱乐网 - 专注共享鑫迪资源网活动

导读:关注SEO、关注收录的站长,应该都知道百度搜索提供了一段自动推送的js代码,可将任意网页推送到搜索引擎,加快收录。而且,这段代码并前会简单的增加到网页中万事大吉了!百度埋坑技术,你我都懂的!本文主要分享埋坑之自动推送JS代码的优化…

一、间题描述

百度近些年推出太久种收录推送工具,比如型态化数据插件、主动推送、自动推送js等等。每一次张戈前会对哪些东西进行优化防止,主什么都 而且哪些工具前会老会 出现重复推送的弊病!随便说说百度并没有 申明重复推送会带来哪些副作用。但根据我当事人的经验,同一篇文章,而且重复推送,而且会让百度蜘蛛认为你这文章更新频繁,不稳定从而进入收录沙盒短期内太久展示!

这你什儿 ,在以往的文章中我都反复提出过:

BaiduSubmit:百度WordPress型态化数据插件(改进版)

WordPress百度链接主动提交插件:Baidu-links-submit优化版

WordPress发布文章主动推送到百度,加快收录保护原创

对于百度最新推出的自动推送JS代码,通过站长平台的反馈来看,依然位于重复推送的坑:

Ps:看一遍你什儿 回复,随便说说我是打心底鄙视了百度一把!这js只都可不里能 加上到新页面?那新页面收录事先,我们我们 再去删除js代码?原来都可不里能 老会 关注页面是前会被收录?那几万个页面的网站还得靠工具检测咯?

重复推送到底有没有 副作用,百度并没有 给我明确的答复。不过管理员明确回复,太久加上主动推送,而是是否是是没有 副作用,已收录的页面也加上自动推送js代码,也会浪费每天的可推送额度( 当天剩余的可推送url条数)!

另外,我们我们 知道,什么都 事先多个url地址随便说说是同有4个多多页面内容,比如:

https://zhang.ge/liuyan.html
https://zhang.ge/liuyan.html/comment-page-34/#comments

而且,我们我们我们 给页面带上查询参数,显示的依然是同有4个多多页面内容,而且Url地址变了!!没有 自动推送js获取到的Url也变了!它就会将你什儿 Url 推送到搜索引擎!实际上,哪些相同内容的页面我们我们 太久说希望重复抓取和收录!

二、间题防止

根据顶端的分析,之类于于自动推送js代码就必须整站加上,什么都 只需加上到未收录且正规Url的页面。

比如:

https://zhang.ge/20093.html 百度已收录,你什儿 页面不加上

https://zhang.ge/20096.html 百度未收录,你什儿 页面要加上

https://zhang.ge/20096.html?from_weixin 百度未收录,但属于重复内容页面,什么都 不加上

已收录、未收录的判断,关注张戈博客的我们我们 肯定记得我事先在博客分享过百度是是是否是是收录的插件和代码吧!而对于是是是否是是正规页面,也只都可不里能 加上有4个多多简单判断。

/**
* WordPress百度搜索自动推送、主动收录JS优化 By 张戈博客
* 文章地址:https://zhang.ge/5200.html
* 转载请保留出处,谢谢合作协议方式!
**/
add_action( 'wp_footer', 'bdPushData', 999);

if(!function_exists('baidu_check_record')){
  function baidu_check_record($url,$post_id){
    $baidu_record  = get_post_meta($post_id,'baidu_record',true);
    if( $baidu_record != 1){
        $url='http://www.baidu.com/s?wd='.$url;
        $curl=curl_init();
        curl_setopt($curl,CURLOPT_URL,$url);
        curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);
        $rs=curl_exec($curl);
        curl_close($curl);
        if( BD_PUSH == 'yes' && !preg_match_all('/提交网址/u',$rs) && preg_match_all('/百度为您找到相关结果/u',$rs)){
            update_post_meta($post_id, 'baidu_record', 1) || add_post_meta($post_id, 'baidu_record', 1, true);
            return 1;
        } else {
            return 0;
        }
    } else {
       return 1;
    }
  }
}

if(!function_exists('bdPushData')){
  function bdPushData() {
    global $wpdb;
    $post_id = ( null === $post_id ) ? get_the_ID() : $post_id;
    $currentUrl = home_url(add_query_arg(array()));
    //这里修改了下:给get_permalink指定了文章ID
    if(baidu_check_record(get_permalink($post_id), $post_id) == 0 && $currentUrl == get_permalink($post_id)) {
        echo "<script>(function(){
            var bp = document.createElement('script');
            var curProtocol = window.location.protocol.split(':')[0];
            if (curProtocol === 'https') {
                bp.src = 'https://zz.bdstatic.com/linksubmit/push.js';        
            } else {
                bp.src = 'http://push.zhanzhang.baidu.com/push.js';
            }
            var s = document.getElementsByTagName('script')[0];
            s.parentNode.insertBefore(bp, s);
            })();
            (function(){
                var src = (document.location.protocol == 'http:') ? 'http://js.passport.qihucdn.com/11.0.1.js?af9e2000e6a4ba6d33cd7f1b088210cf7':'https://jspassport.ssl.qhimg.com/11.0.1.js?af9e2000e6a4ba6d33cd7f1b088210cf7';
                document.write('<script src=\"' + src + '\" id=\"sozz\"><\/script>');
            })();</script>";
   }
 }
}

如上PHP代码,加上到主题functions.php即可。当页面未被百度收录,且被访问的页面地址等于WordPress唯一页面地址时,而且输出百度自动推送js代码,不符合条件的页面则太久输出。

2016年5月31日更新说明:有我们我们 反馈收录判断不准确,花时间DEBUG看一遍下,发现抓取到的百度搜索结果而且是空白内容等错误内容,原因 判断为已收录!

什么都 ,上述代码加入百度搜索结果必要关键词【百度为您找到相关结果】的条件判断,目前来看应该比较准确了,已在使用的我们我们 请更新到最新代码。

三、其是我不好明

和事先分享的百度是是是否是是收录代码一样的工作原理,文章加载时,会在百度搜索当前文章的url地址,而且百度未收录,查询结果中会匹配到【没有 找到该URL。您可不里能 直接访问】或【很抱歉,没有 找到与】文字内容。当代码确认页面已收录时,而且在文章中加上有4个多多值为1的 baidu_record 自定义栏目。

必须当 baidu_record 你什儿 自定义栏目的值不位于时,代码才会去百度查询收录结果。而且在确认未收录事先,才会在网页 footer 中输出自动推送js代码。

原来就规避了已收录页面重复推送和百度实时查询原因 加载慢有4个多多间题!

另外,随便说说还有原来值得关注的坑:百度统计代码也会自动推送,是是是否是是也位于本文提到的间题,就不得而知了。

最后,顺便说明一下,3200搜索也推出了主动收录js代码,喜欢折腾的我们我们 可不里能 参考本文进行优化。

效果补充:实施后,自动推送数量以从200+降为20+,说明已收录的文章太久重复推送了。