使用PHP和Curl登录Google,Cookie是否关闭?

使用PHP和Curl登录Google,Cookie是否关闭?,php,cookies,curl,session-cookies,Php,Cookies,Curl,Session Cookies,我有这段代码,用于使用带有curl的简单DOM解析器登录Google。我尝试添加cookiejar文件,但没有效果。我一直得到这样的信息: 浏览器的cookie功能已关闭。请把它打开 有没有办法解决这个问题 以下是我的代码供参考: $html = file_get_html('https://accounts.google.com/ServiceLogin?hl=en&service=alerts&continue=http://www.google.com/alerts/man

我有这段代码,用于使用带有curl的简单DOM解析器登录Google。我尝试添加cookiejar文件,但没有效果。我一直得到这样的信息:

浏览器的cookie功能已关闭。请把它打开

有没有办法解决这个问题

以下是我的代码供参考:

$html = file_get_html('https://accounts.google.com/ServiceLogin?hl=en&service=alerts&continue=http://www.google.com/alerts/manage');

//... some code for getting post data here

$curl_connection = curl_init('https://accounts.google.com/ServiceLoginAuth');
curl_setopt($curl_connection, CURLOPT_CONNECTTIMEOUT, 30);
curl_setopt($curl_connection, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)");
curl_setopt($curl_connection, CURLOPT_RETURNTRANSFER, true);
curl_setopt($curl_connection, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($curl_connection, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($curl_connection, CURLOPT_COOKIEJAR, COOKIEJAR);
curl_setopt($curl_connection, CURLOPT_COOKIEFILE, COOKIEJAR);
curl_setopt($curl_connection, CURLOPT_HEADER, true);  
curl_setopt($curl_connection, CURLOPT_RETURNTRANSFER,1);
curl_setopt($curl_connection, CURLOPT_CONNECTTIMEOUT, 120);
curl_setopt($curl_connection, CURLOPT_TIMEOUT, 120);
curl_setopt($curl_connection, CURLOPT_POSTFIELDS, $post_string);

$result = curl_exec($curl_connection);
curl_close($curl_connection);

echo $result;

下面是一些经过修改的代码

它首先请求登录页面获取初始cookie并提取登录表单所需的值。接下来,它将向登录服务执行post。然后检查是否试图使用javascript和元标记重定向到目标URL

看起来你已经有了获取表单字段的代码,所以我没有发布我的,但是如果你需要它,请告诉我。只需确保
$formFields
是一个关联数组,其中键是字段名,值是字段值

<?php

/**
 * Log in to Google account and go to account page
 *
 */

$USERNAME = 'youraccount@gmail.com';
$PASSWORD = 'password';
$COOKIEFILE = 'cookies.txt';

// initialize curl handle used for all requests
$ch = curl_init();

// set some options on the handle
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 30);
curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:49.0) Gecko/20100101 Firefox/49.0");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_COOKIEJAR, $COOKIEFILE);
curl_setopt($ch, CURLOPT_COOKIEFILE, $COOKIEFILE);
curl_setopt($ch, CURLOPT_HEADER, 0);  
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 120);
curl_setopt($ch, CURLOPT_TIMEOUT, 120);

// url of our first request fetches the account login page
curl_setopt($ch, CURLOPT_URL, 
  'https://accounts.google.com/ServiceLogin?hl=en&service=alerts&continue=http://www.google.com/alerts/manage');
$data = curl_exec($ch);

// extract form fields from account login page
$formFields = getFormFields($data);

// inject email and password into form
$formFields['Email']  = $USERNAME;
$formFields['Passwd'] = $PASSWORD;
unset($formFields['PersistentCookie']);

$post_string = http_build_query($formFields); // build urlencoded POST string for login

// set url to login page as a POST request
curl_setopt($ch, CURLOPT_URL, 'https://accounts.google.com/ServiceLoginAuth');
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, $post_string);

// execute login request
$result = curl_exec($ch);

// check for "Redirecting" message in title to indicate success
// based on your language - you may need to change this to match some other string
if (strpos($result, '<title>Redirecting') === false) {
    die("Login failed");
    var_dump($result);
}

// login likely succeeded - request account page; unset POST so we do a regular GET
curl_setopt($ch, CURLOPT_URL, 'https://myaccount.google.com/?utm_source=OGB');
curl_setopt($ch, CURLOPT_POST, 0);
curl_setopt($ch, CURLOPT_POSTFIELDS, null);

// execute request for login page using our cookies
$result = curl_exec($ch);

echo $result;


// helpef functions below

// find google "#gaia_loginform" for logging in
function getFormFields($data)
{
    if (preg_match('/(<form.*?id=.?gaia_loginform.*?<\/form>)/is', $data, $matches)) {
        $inputs = getInputs($matches[1]);

        return $inputs;
    } else {
        die('didnt find login form');
    }
}

// extract all <input fields from a form
function getInputs($form)
{
    $inputs = array();

    $elements = preg_match_all('/(<input[^>]+>)/is', $form, $matches);

    if ($elements > 0) {
        for($i = 0; $i < $elements; $i++) {
            $el = preg_replace('/\s{2,}/', ' ', $matches[1][$i]);

            if (preg_match('/name=(?:["\'])?([^"\'\s]*)/i', $el, $name)) {
                $name  = $name[1];
                $value = '';

                if (preg_match('/value=(?:["\'])?([^"\'\s]*)/i', $el, $value)) {
                    $value = $value[1];
                }

                $inputs[$name] = $value;
            }
        }
    }

    return $inputs;
}

您可能应该使用cURL在
file\u get\u html
函数中获取URL,因为它可能会设置一些cookie,验证服务可能正在查看表单。另外,您能否确认正在创建由
COOKIEJAR
指定的文件并包含cookies?我检查了COOKIEJAR文件,是的,其中包含一些文本。我还将curl\u init url设置为与file\u get\u html相同的url,仍然是一样的,我没有cookie(我确实在这里得到了一些标题,这有关系吗?它们是:HTTP/1.1 200 OK Set Cookie:GoogleAccountsLocale_session=en;Secure Set Cookie:GAPS=1:ZuuFm50cJM2_fiqqqqc38hkyucjzxrrg:bmuhasscsckibti1l;Path=/;Expires=Thu,2014年1月23日18:32:24 GMT;安全;HttpOnly内容类型:text/html;charset=UTF-8严格的传输安全性:max age=2592000;包括子域日期:2012年1月24日星期二18:32:24 GMT过期时间:2012年1月24日星期二18:32:24 GMT缓存控制:private,max age=0 X-Content-Type-Options:nosniff X-XSS-Protection:1;mode=block-Content-Length:1848服务器:GSEThey可以,但它正在设置一些coookies,应该为下一个请求保存。哇!谢谢!我尝试过了我登录失败。只需将我的post_数据数组插入您的formFields数组。以下是字符串:continue=http%3A%2F%2Fwww.google.com%2farts%2fmanager&service=alerts&dsh=-65538028468298096&hl=en&GALX=Cg4XgqEmZ&timeStmp=&secTok=&Email=xxxxxxxxxxxx&Passwd=xxxxxxxxxxxxxx&Sign=Sign+Sign+in&rmshow=1失败后,没有其他输出。无需担心,我知道了,谢谢!:D我会尝试看看是什么让你的有效,而我的无效。假设它被传递到正确的curl变量,看起来没问题。我刚刚用获取隐藏字段的完整版本更新了代码。在那里输入你的用户名和密码,看看它是否对你有效。我只是再次确认整个示例有效。如果gin失败了,它应该会自动转储生成的网页。好吧,我看你现在已经开始工作了,干得不错。不管怎样,这个示例现在包含了获取隐藏字段的函数。嗨!万一有人偶然发现这个线程,谷歌似乎在成功后改变了重定向页面的方式,所以行
if(strpos($result,'Redirecting')==false)
总是返回false(至少对我来说是这样),尽管脚本工作正常。我只是省略了那一行,它工作正常。我还用一个文件名替换了constat COOKIEJAR。希望这对某人有所帮助!