首页 > 学院 > 开发设计 > 正文

使用CURL进行模拟登录

2019-11-06 08:31:16
字体:
来源:转载
供稿:网友

        在信息采集的时候,要采集的站点可能需要登录,这样使用简单的采集方式(例如file_get_contents)就无法做到了,我们可以利用php的CURL扩展库来进行模拟登录,下面给出代码示例:

<?php        $cookie_path = './'; //设置cookie保存路径        //-----登录要提交的表单数据---------------        $vars['username'] = '张三';         $vars['pwd'] = '123';         //-------------------------------------        $method_post = true;        //登录提交的url地址(表单中的action的绝对地址)         $url = 'http://****.com/login';        //----------------------------         $ch = curl_init();        $params[CURLOPT_URL] = $url;    //请求url地址        $params[CURLOPT_HEADER] = true; //是否返回响应头信息        $params[CURLOPT_RETURNTRANSFER] = true; //是否将结果返回        $params[CURLOPT_FOLLOWLOCATION] = true; //是否重定向        $params[CURLOPT_USERAGENT] = 'Mozilla/5.0 (Windows NT 5.1; rv:9.0.1) Gecko/20100101 Firefox/9.0.1';            $postfields = '';        foreach ($vars as $key => $value){            $postfields .= urlencode($key) . '=' . urlencode($value) . '&';          }                $params[CURLOPT_POST] = true;        $params[CURLOPT_POSTFIELDS] = $postfields;                //判断是否有cookie,有的话直接使用        if (isset($_COOKIE['cookie_jar']) && ($_COOKIE['cookie_jar'] || is_file($_COOKIE['cookie_jar'])))        {            $params[CURLOPT_COOKIEFILE] = $_COOKIE['cookie_jar']; //这里判断cookie        }        else        {            $cookie_jar = tempnam($cookie_path, 'cookie'); //产生一个cookie文件            $params[CURLOPT_COOKIEJAR] = $cookie_jar; //写入cookie信息            setcookie('cookie_jar', $cookie_jar); //保存cookie路径        }        curl_setopt_array($ch, $params); //传入curl参数        $content = curl_exec($ch); //执行        echo '
';        echo $content; //输出登录结果        /*        //---------登录成功后再次请求其他地址,如果有多个可以循环执行---------        echo '
';        $nexturl = 'http://****.com/test';        $params[CURLOPT_URL] = $nexturl;        $params[CURLOPT_POSTFIELDS] = '';        curl_setopt_array($ch, $params); //传入curl参数        $content = curl_exec($ch); //执行        echo $content; //输出请求结果        //-------------------------------------------------        */        curl_close($ch); //关闭连接        

?>

注:如果遇到无法请求https站点的情况,可能是因为无法验证证书或者域名,只要在curl_setopt_array前增加以下两项就可以了:

$params[CURLOPT_SSL_VERIFYPEER] = false;

$params[CURLOPT_SSL_VERIFYHOST] = false;


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表