python提取txt文本里的资料
ss.txt文本有下面一些内容:(1:2:3:代表的是行数)从第6行开始为我们所要的资料---->表示间隔空格
1:Name of Building Year Built
2: Address
3:宇名 地址 落成年份
4:
5:
6:A. Sun Plaza------->3 San Hop Lane,---->屯新合里 3 ----->1997
7:*善中心------->Tuen Mun
8:
9:A.D. & F.D. of Pok Oi Hospital------->111 So Kwun Wat Rd.,------->屯------->-
10:Mrs. Cheng Yam On------->Tuen Mun------->管笏路 111
11:Millennium School
12:博院理
13:任安夫人千禧小
14:
15:Abbey Court------->19-21 On King St.,------->沙田------->1991
16:雅碧------->Pictorial Garden Phase 1,------->碧花第 1 期
17: ------->Sha Tin ------->安景街 19-21
Abiding School (Nam Pin Wai) DD 115 Nam Pin Wai 元朗十八 -
遵道校(南) House Lot 239, 南第一巷第 115
1st Lane Nam Pin Wai, 南屋宇地段
Shap Pat Heung, Yuen Long 第 239
Acacia Villa 60 Cheung Sha Sheung 大山 1997
Tsuen, Lantau Island 沙上村 60
Admiralty Heights 52 Tai Chung Kiu Rd., 沙田富豪花 1982
都 Belair Gardens, Sha Tin 大涌路 52
现在要将里面的中英文建筑名称及地址分别提取出来输出到csvfile(2列为Name of Building,address)
例如:英文:
Name of Building address
A. Sun Plaza 3 San Hop Lane,Tuen Mun
A.D. & F.D. of Pok Oi Hospital Mrs. Cheng Yam On Millennium School 111 So Kwun Wat Rd.,
Abbey Court 19-21 On King St., Pictorial Garden Phase 1,Sha Tin
中文csvfile(2列为大厦名,地址)
大厦名 地址
*善中心 屯新合里 3
博院理任安夫人千禧小 屯管笏路 111
雅碧 沙田碧花第 1 期安景街 19-21
由于文本都上传不上来,所以只好自己敲上去
备注:每两条记录之间会有一行空白作为分隔符,特别要注意的是有些建筑物名称或者地址是分在其下方的另一行中(中英文状态下都有)
例如:第一条记录的英文地址就写在了2行, 3 San Hop Lane,
Tuen Mun
所以读取时完整的英文地址为:3 San Hop Lane, MunTuen Mun
类似的还有中文大厦名,第二条记录 博院理
任安夫人千禧小
完整的中文大厦名:博院理任安夫人千禧小
[解决办法]
间隔空格和普通的空格能区分开吗?如果它们一样,就很难处理了。
[解决办法]
看不出格式,估计比较难以处理
[解决办法]
空格直接用空格表示,估计看的顺眼些。
[解决办法]
放到[code=Python][/code]中,空格就会被保留。