python-pandas指定行格式

2021-01-08 21点热度 0人点赞 0条评论
我想用 pandas 来阅读SCEDC提供的 earthquake catalogues 。可能出于历史原因,文件格式相当模糊,如README所述:

col len format name comment
--- --- ------ ---- -------
 1   4    a4   year YYYY
 6   2    a2   mon  MM
 9   2    a2   day  DD
13   2    a2   hour HH  (UTC time:
16   2    a2   min  mm   7 hours ahead of Pacific Daylight Time
19   5   f5.2  sec  SS.ss    8 hours ahead of Pacific Standard Time)
    25   3    i3   lat  degrees 
    29   5   f5.2  lat      minutes 
    34   4    i4   lon  degrees  
    39   5   f5.2  lon  minutes
45   1    a1   quality  location quality
                'A'  +- 1 km horizontal distance
                     +- 2 km depth
                'B'  +- 2 km horizontal distance
                     +- 5 km depth
                'C'  +- 5 km horizontal distance
                     no depth restriction
                'D'  >+- 5 km horizontal distance
                'Z'  no quality listed in database
47   3   f3.1  magnitude
54   6   f6.2  depth    kilometers
60   3    i3   nph  number of picked phases
67   5   f5.2  rms  root mean square of travel times
73   8    i8   eventid  event ID

相当于:

#YYY MM DD  HH mm SS.ss  LATITUDE LONGITUDE Q MAG     DEPTH NPH    RMS   EVID
2008 01 01  02 37 08.85  33 35.95-116 43.56 A 0.7     13.16 41     0.16 10297549
2008 01 01  05 12 06.46  33 37.12-116 39.90 A 0.8     13.03 48     0.23 10297553
2008 01 02  18 31 42.73  34 50.89-118 45.92 C 1.1     -1.28 11     0.28 10297805

虽然我不介意用空格分隔的格式,但 LATITUDELONGITUDE 两列中的情况越来越糟:每个坐标分量都是 [degrees] [minutes] 格式的(例如,第一次地震时 33 35.95-116 43.56 ),但经纬度之间没有空格( 33 35.95-116 43.56 ),这使得很难分割P线。很不错。

有没有一种方法可以向 a4 a2 f5.2 i3 提供这种模糊的( pandas.read_csv 等)格式,以指定如何分割和解释目录中的每一行?

查看隐藏内容需要支付:¥1
查看

未经允许不得转载!python-pandas指定行格式

本文地址:https://ans.52learn.online/2165

ANS52LEARN

DO BEST