返回列表 發帖

使用regular expression抓連結

大家好,我初次使用regular expression,想抓下網頁原始碼中可以正常使用的連結,

目前抓一般的連結標籤可以,但尚無法解決遇到<xmp>和註解(<!-- -->)的情形。

請問我該怎樣使用regular expreesion讓他避開被<xmp></xmp>或<!-- -->包住的連結??



我是使用xmlHTTP.responseText的方式抓下整個網頁的原始碼,

本想用replace把被<xmp></xmp>或註解包住的內容都換成空字串,

但發現responseText似乎不支援replace,況且並不是很了解responseText究竟是什麼樣的格式。



麻煩各位解答,非常感謝!

返回列表 回復 發帖