php 采集
<?php
$con= file_get_contents("http://17173.com");
$preg = "#<A href='(.*)' target='_blank'>(.*)</A>#";
preg_match_all($preg, $con, $arr);
//print_r($arr);
foreach($arr[1] as $id=>$v){
echo "<a href=$v>".$v."</a> ".$arr[2][$id]."<br>";
}
?>
此段代码用于采集页面表面和url地址
但是采集不到数据
但此网站上,是有此类页面地址的:<A href="http://news.17173.com/" target=_blank>新闻中心</A>
不知道为啥采集不到
$preg = "#<A href='(.*)' target='_blank'>(.*)</A>#";
这句中的两个#号是什么作用,去除会报错
[解决办法]
$preg = '/<A href="(.*)" target=_blank>(.*)</A>/Ui';
[解决办法]
<?php
$con= file_get_contents("http://17173.com");
$preg = '#<A href="(.*)" target="_blank">(.*)</A>#i';
preg_match_all($preg, $con, $arr);
//print_r($arr[1]);
foreach($arr[1] as $id=>$v){
echo "<a href=$v>".$v."</a> ".$arr[2][$id]."<br>";
}
?>
# 与 / 同理
注意单双引号
大小写