读书人

请教一个正则表达式的有关问题

发布时间: 2012-02-03 22:02:47 作者: rapoo

请问一个正则表达式的问题
我有这样一个文章,内容有100 多M,格式如下
.T 1
testatea
teate
.A
小越,小东
.Context
这是一个小文章
这是
这是
这是
这是


.T 2
哈哈
teate.

。。。。。。。。。
一直重复


.T 1 表示文章1 ,然后第二行开始就是标题
.A 表示作者,
.Context 表示内容

这三个的内容都不知道有多少行, 一直到遇到下一个 . 什么的


这个文件里有几万个文章

请问怎样才能高效的把这一个文件, 按格式(标题,作者,内容) 分成 几万个 单独的文章


我现在的做法是 一行一行的读,然后遇到 . 开始的标识, 就记下来,然后用 StringBuilder 记内容
然后直到遇到下一个 . ....

总感觉效率不好,请问大家有什么好的做法


谢谢了


[解决办法]
Scanner 的 public String next(Pattern pattern) 使用正则 一次 读 一篇文章、、不知道这样可否

读书人网 >J2EE开发

热点推荐