我要用采集很多网站的标题,关键词,描述!用了N种方式但是我要获取的是不同的编码!GBK,GBK2312,UTF8……可能还有很多种。。
怎么可以在什么情况下获得我想要的?
可以详细点吗?
追答$content=file_get_contents("http://www.php100.com");
preg_match('/charset=([^">]+)/is',$content,$result);
$encoding=$result[1];
echo $encoding;
我知道如何获取charset=
我想知道怎么来转?例如 我要把目标站(UTF8)转为 GBK2312
又例如目标 是 GBK 转为 GBK2312
貌似一个UTF8 又分几种。。。有的可以转 有的不可以。。。
gbk gb2312 这两个没必要转 一样的 范围不一样 gbk是gb2312的扩展
iconv mb_convert_encoding 好好看看吧
可以详细点吗?