php获取网页源码内容有哪些办法

我知道

file_get_contents可以直接把源码读取

fopen($url,'r')是以对话的方式

fsockopen也是

还有curl，fsockopen和curl好像能做更多的请求，不知道怎么用，它发的每个请求都是什么目的呢，为什么就能达到模拟浏览器请求的目的，http头起什么作用，

上面的哪种方式通用性强，各自有什么优缺点，在哪种情况时更适合用这些方式呢，谢谢
1.还有怎么不乱码，为什么会乱码，程序文件的编码和获取的字符的编码不一样，就会乱码吗

2：incov可以编码转换，可怎么用，要知道获取的字符的编码才能对应转换把
3：有函数可以知道当前字符的编码吗
4：字符编码是怎么回事
5：gb2312，utf-8这些编码适用哪些字符的网页呢
6：为什么有些中文会乱码，utf-8是中文吗
7：/如果出现中文乱码使用下面代码
//$getcontent = iconv("gb2312", "utf-8",$contents); //路过我总在获取源码后加这句，会保证不乱码吗，在任何字符的情况下

问的很多，都是平时遇到的疑问，我菜鸟，麻烦说详细点，谢谢大家

举报该问题

推荐答案推荐于2019-08-04

可以参考以下几种方法：

方法一： file_get_contents获取

$url="http://www.baidu.com/";

$fh= file_get_contents

('http://www.hxfzzx.com/news/fzfj/'); echo $fh;

方法二：使用fopen获取网页源代码

$url="http://www.baidu.com/";

$handle = fopen ($url, "rb");

$contents = "";

while (!feof($handle)) {

$contents .= fread($handle, 8192);

}

fclose($handle);

echo $contents; //输出获取到得内容。

方法三：使用CURL获取网页源代码

$url="http://www.baidu.com/";

$UserAgent = 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.0.04506; .NET CLR 3.5.21022; .NET CLR 1.0.3705; .NET CLR 1.1.4322)';

$curl = curl_init(); //创建一个新的CURL资源

curl_setopt($curl, CURLOPT_URL, $url); //设置URL和相应的选项

curl_setopt($curl, CURLOPT_HEADER, 0); //0表示不输出Header，1表示输出

curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); //设定是否显示头信息,1显示，0不显示。//如果成功只将结果返回，不自动输出任何内容。如果失败返回FALSE

curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);

curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);

curl_setopt($curl, CURLOPT_ENCODING, ''); //设置编码格式，为空表示支持所有格式的编码

//header中“Accept-Encoding: ”部分的内容，支持的编码格式为："identity"，"deflate"，"gzip"。

curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent);

curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);

//设置这个选项为一个非零值(象 “Location: “)的头，服务器会把它当做HTTP头的一部分发送(注意这是递归的，PHP将发送形如 “Location: “的头)。

$data = curl_exec($curl);

echo $data;

//echo curl_errno($curl); //返回0时表示程序执行成功

curl_close($curl); //关闭cURL资源，并释放系统资源

拓展资料

PHP（外文名:PHP: Hypertext Preprocessor，中文名：“超文本预处理器”）是一种通用开源脚本语言。语法吸收了C语言、Java和Perl的特点，利于学习，使用广泛，主要适用于Web开发领域。PHP 独特的语法混合了C、Java、Perl以及PHP自创的语法。它可以比CGI或者Perl更快速地执行动态网页。

用PHP做出的动态页面与其他的编程语言相比，PHP是将程序嵌入到HTML（标准通用标记语言下的一个应用）文档中去执行，执行效率比完全生成HTML标记的CGI要高许多；PHP还可以执行编译后代码，编译可以达到加密和优化代码运行，使代码运行更快。

参考资料：PHP（超文本预处理器)-百度百科

温馨提示：答案为网友推荐，仅供参考

当前网址：http://www.wendadaohang.com/zd/1nG3nG51A.html

其他回答

第1个回答 2011-03-30

以下就是几种常用的用php抓取网页中的内容的方法。
1.file_get_contents
PHP代码
代码如下:>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
<?php
$url = "http://www.jb51.net";
$contents = file_get_contents($url);
//如果出现中文乱码使用下面代码
//$getcontent = iconv("gb2312", "utf-8",$contents);
echo $contents;
?>

2.curl
PHP代码
代码如下:>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
<?php
$url = "http://www.jb51.net";
$ch = curl_init();
$timeout = 5;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
//在需要用户检测的网页里需要增加下面两行
//curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_ANY);
//curl_setopt($ch, CURLOPT_USERPWD, US_NAME.":".US_PWD);
$contents = curl_exec($ch);
curl_close($ch);
echo $contents;
?>

3.fopen->fread->fclose
PHP代码
代码如下:>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
<?php
$handle = fopen ("http://www.jb51.net", "rb");
$contents = "";
do {
$data = fread($handle, 1024);
if (strlen($data) == 0) {
break;
}
$contents .= $data;
} while(true);
fclose ($handle);
echo $contents;
?>

注意：
1.使用file_get_contents和fopen必须空间开启allow_url_fopen。方法：编辑php.ini，设置allow_url_fopen = On，allow_url_fopen关闭时fopen和file_get_contents都不能打开远程文件。
2.使用curl必须空间开启curl。方法：windows下修改php.ini，将extension=php_curl.dll前面的分号去掉，而且需要拷贝ssleay32.dll和libeay32.dll到C:\WINDOWS\system32下；Linux下要安装curl扩展。
##############至于说哪种方法好,这个不好说,看你要完成的任务有多难来定吧,我一般用CURL比较多....自己去网上搜搜,有很多博客里有教程,感兴趣的事加上聪明的人,一下下就学会了哦..祝你好运.本回答被提问者和网友采纳

第2个回答推荐于2016-11-14

php已提供相关函数。

file_get_contents() 函数把整个文件读入一个字符串中。

$ret = file_get_contents('要采集的网页URL');
// 若需要从页面中获取内容，可以用正则匹配
$begin=change_match_string('匹配开头的字符串');
$end=change_match_string('匹配结尾的字符串');
$p = "{$begin}(.*){$end}";
// 使用正则进行匹配
if (eregi($p,$ret,$rs)) return $rs[1];
else return false;

相似回答

如何查看php页面的源代码?答：PHP是后端语言，前端是无法查看的，前端看到的是最终运算之后的结果，PHP源代码是无法查看的。如果能直接查看PHP源代码那还得了，如果你是单纯想看看网页代码，那就在浏览器右键-查看源码就可以看见。

怎么提取一个网站的PHP源码?答：您可以寻找一下该网站的页脚或者IE的顶部，是否存在类似 powered by xxx 这里的XX就是该PHP源码系统。然后百度搜索一下就可以找到了。如果不存在类似的信息，那就不能通过正规途径获取了。除非是利用某种不良途径获取。那就是寻找改网站的漏洞，通过入侵手段获取。不过这是违法的，不建议此种方式。

php如何获得网页内容php如何获得网页内容答：php来获取指定的网页内容这样的方法有三种。第一种方法 url=；curl_setopt($c，CURLOPT_URL，$URL)；curl_setopt($c，CURLOPT_RETURNTRANSFER，1)；data=curl_exec($c)；curl_close($c)；pos=strpos($data，utf-8);if($pos===false){$data=iconv(gbk，$data)；} preg_match(/title\/...

php获取指定网页内容答：一、用file_get_contents函数,以post方式获取url <?php url= 'http://www.domain.com/test.php?id=123';data= array('foo'=> 'bar');data= http_build_query($data);opts= array('http'=> array('method'=> 'POST','header'=>"Content-type: application/x-www-form-urlencoded\r\...

如何查看PHP网站的源代码答：你将源文件下载到本地机上，然后用记事本就可以察看。

php 获取网页头部信息和网页和网页源代码查看答：<?php / http下载类库 / class Httplib{ // 目标网站无法打开时返回的错误代码 var $_ERROR_CONNECT_FAILURE = 600;// 自定义 UserAgent 字符串 var $_SEND_USER_AGENT = 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; LazyCMS.net::DownLoader)';var $_url,$_method,$_...

有没有什么好的PHP获取网页meta的源码或写法答：meta 中有个charset 可以截取获取编码方式然后转码上面行不通 curl、socket可以返回网页头信息头信息里有编码然后转码

如何获取某网站php源代码?答：PHP语言为服务器端的脚本，是在服务器上被执行，与Javascript不同，javascript、CSS、图片都能完全被保存。客户端请求时，PHP语言被解析执行，生成html代码，通过web服务器发送给浏览器，浏览器上已经没有PHP语言的任何信息。如果通过浏览器，是永远无法获取PHP源码。当然，通过其他非常规手法，可能性是存在...

如何查看别人网站的PHP源代码答：这个是不能直接查看的只有几种途径：PHP是编译的运行程序，在浏览器看到的是编译执行之后的展示页面，并不是源代码。网站站长，公开共享免费提供网站源码整站下载的，可以拿到查看。网站提供后台，给一定的人群，有一定的管理权限。可以解除代码。服务器，部分网站因为某些原因，服务器是共享的，可以看到源...

大家正在搜

php获取网页源码网页_取网页源码 php网页聊天室源码 php源码网 php源码网站安装开源php源码微网站php源码 php源码怎么搭建网站网店源码 php