有没有什么好的PHP获取网页meta的源码或写法

我要用采集很多网站的标题,关键词,描述!用了N种方式但是我要获取的是不同的编码!GBK,GBK2312,UTF8……可能还有很多种。。
怎么可以在什么情况下获得我想要的?

meta 中有个charset 可以截取获取编码方式 然后转码

上面行不通 curl、socket可以返回网页头信息 头信息里有编码 然后转码追问

可以详细点吗?

追答

$content=file_get_contents("http://www.php100.com");
preg_match('/charset=([^">]+)/is',$content,$result);
$encoding=$result[1];
echo $encoding;

追问

我知道如何获取charset=
我想知道怎么来转?例如 我要把目标站(UTF8)转为 GBK2312
又例如目标 是 GBK 转为 GBK2312
貌似一个UTF8 又分几种。。。有的可以转 有的不可以。。。

追答

gbk gb2312 这两个没必要转 一样的 范围不一样 gbk是gb2312的扩展
iconv mb_convert_encoding 好好看看吧

温馨提示:答案为网友推荐,仅供参考
第1个回答  2011-03-12
用正则表达式先获取网页的编码格式追问

可以详细点吗?

相似回答