1. <div id="11111"></div>

    1. <div id="11111"></div>

      1. <div id="11111"></div>

        PHP代码:获取指定URL页面中的所有链接

        日期: 标签:php 3 条留言
        如需帮忙改代码,或者WordPress二次开发、PHP网站建设等需求,可联系我购买付费服务:  点此联系我

        以下代码可以获取到指定URL页面中的所有链接,即所有a标签的href属性:

        // 获取链接的HTML代码
        $html = file_get_contents('http://www.example.com');
        
        $dom = new DOMDocument();
        @$dom->loadHTML($html);
        
        $xpath = new DOMXPath($dom);
        $hrefs = $xpath->evaluate('/html/body//a');
        
        for ($i = 0; $i < $hrefs->length; $i++) {
           $href = $hrefs->item($i);
           $url = $href->getAttribute('href');
           echo $url.'<br />';
        }

        这段代码会获取到所有a标签的href属性,但是href属性值不一定是链接,我们可以在做个过滤,只保留http开头的链接地址:

        // 获取链接的HTML代码
        $html = file_get_contents('http://www.example.com');
        
        $dom = new DOMDocument();
        @$dom->loadHTML($html);
        
        $xpath = new DOMXPath($dom);
        $hrefs = $xpath->evaluate('/html/body//a');
        
        for ($i = 0; $i < $hrefs->length; $i++) {
           $href = $hrefs->item($i);
           $url = $href->getAttribute('href');
           
           // 保留以http开头的链接
           if(substr($url, 0, 4) == 'http')
              echo $url.'<br />';
        }

        -- 完 --

        本文采用 「CC BY-NC-SA 4.0」创作共享协议,转载请标注以下信息:
        原文出处:露兜博客 http://www.szeverich.net.cn/php-find-all-links-on-a-page.html
        露兜
        kaapass@outlook.com  QQ 825533758

        业余编程爱好者,主业是淘宝店主,卖些工艺品,感兴趣可以到我的淘宝店看看(旺旺不提供技术咨询):西西弗sisyphe

        3 条留言

        点此留言
        1. china1040

          露兜儿 我有个问题想请教你-0-

        2. 购物生活好店品

          小教程,不错

        3. OneDou

          怎么不用正则呢?

        发表留言

        可以挣钱的游戏 873| 903| 661| 393| 205| 806| 684| 943| 519| 950| 145| 457| 888| 754| 725| 538| 641| 941| 808| 688| 647| 304| 973| 38| 721| 234| 706| 219| 87| 139| 454| 257| 507| 560| 323| 836|