首页 > CMS > 帝国Empire > 正文

帝国cms采集后预览提示信息 没有内容?

2024-07-09 22:54:41
字体:
来源:转载
供稿:网友
后台设置采集地址: 预览提示信息 没有内容

查看源码,系统中抓取目标网址的内容采用的方法是:

 
function readfiletext($filepath){
    $filepath=trim($filepath);
    $htmlfp=@fopen($filepath,"r");
    //远程
    if(strstr($filepath,"://")){
        while($data=@fread($htmlfp,500000)) {
            $string.=$data;
        }
    }
    //本地
    else{
        $string=@fread($htmlfp,@filesize($filepath));
    }
    @fclose($htmlfp);
    return $string;
}
这个方法中远程 可以被目标服务器防止采集。

如是附加curl 方法:

 
function curl_get_html($url = ''){
     $ch = curl_init();
     curl_setopt($ch, CURLOPT_URL, $url);
     curl_setopt($ch, CURLOPT_HEADER, false);
     curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); //如果把这行注释掉的话,就会直接输出
     $result=curl_exec($ch);
     curl_close($ch);
     return $result;
}
修改 readfiletext 函数的引用入口:提前判断 远程 与 本程 的区别
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表