Linux使用GREP,awk删除指定行求助
<url>
<loc>http://www.ucat.cc/index.php?ctl=register</loc>
<lastmod>2013-11-18</lastmod>
<changefreq>always</changefreq>
<priority>0.9</priority>
</url>
<url>
<loc>http://www.ucat.cc/index.php?ctl=login</loc>
<lastmod>2013-11-18</lastmod>
<changefreq>always</changefreq>
<priority>0.9</priority>
</url>
<url>
<loc>http://www.ucat.cc/tenders/</loc>
<lastmod>2013-11-18</lastmod>
<changefreq>always</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.ucat.cc/systemContent/main/1.html</loc>
<lastmod>2013-11-18</lastmod>
<changefreq>always</changefreq>
<priority>0.9</priority>
</url>
<url>
<loc>http://www.ucat.cc/case/</loc>
<lastmod>2013-11-18</lastmod>
<changefreq>always</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.ucat.cc/home/</loc>
<lastmod>2013-11-18</lastmod>
<changefreq>always</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.ucat.cc/javascript:AddFavorite();</loc>
<lastmod>2013-11-18</lastmod>
<changefreq>always</changefreq>
<priority>0.9</priority>
</url>
<url>
<loc>http://www.ucat.cc/tenders/javascript:AddFavorite();</loc>
<lastmod>2013-11-18</lastmod>
<changefreq>always</changefreq>
<priority>0.7</priority>
</url>
这样的文本怎样才能包含javascript的段落,意思是所有包含javascript的行,上1行下4行都不要
我用grep -i -B1 -A4 "javascript" index.html
这样可以提取不需要的行,但是我需要的是另外的部分,于是我用
grep -iv -B1 -A4 "javascript" index.html>sitemap1.xml.new
结果返回的和原文件一摸一样啊。
应该怎么写呢???
[解决办法]
awk -vRS="</url>\n" '!/javascript:/{print $0"</url>"}' index.html > sitemap1.xml.newsed '/<url>/{:1;N;/<\/url>/!b1;/javascript/d}' index.html > sitemap1.xml.new