Partner and Status Table 相关:http://www.askmaclean.com/archives/know-oracle-asm-basic-html.html 一般来说aun=1 是保留给Partner and Status Table(PST)的拷贝使用的。 一般5个ASM DISK将包含一份PST拷贝。多数的PST内容必须相同且验证有效。否则无法
Partner and Status Table
相关:http://www.askmaclean.com/archives/know-oracle-asm-basic-html.html
一般来说aun=1 是保留给Partner and Status Table(PST)的拷贝使用的。 一般5个ASM DISK将包含一份PST拷贝。多数的PST内容必须相同且验证有效。否则无法判断哪些ASM DISK实际拥有相关数据。
在 PST中每一条记录对应Diskgroup中的一个ASM DISK。每一条记录会对一个ASM disk枚举其partners的ASM DISK。同时会有一个flag来表示该DISK是否是ONLINE可读写的。这些信息对recovery是否能做很重要。
PST表的Blkn=0是PST的header,存放了如下的信息:
- Timestamp to indicate PST is valid
- Version number to compare with other PST copies
- List of disks containing PST copies
- Bit map for shadow paging updates
PST的最后一个块是heartbeat block,当diskgroup mount时其每3秒心跳更新一次。
以下为PST header
kfed read /oracleasm/asm-disk01 aun=1 blkn=0 aus=4194304 |less kfbh.endian: 1 ; 0x000: 0x01kfbh.hard: 130 ; 0x001: 0x82kfbh.type: 17 ; 0x002: KFBTYP_PST_METAkfbh.datfmt: 2 ; 0x003: 0x02kfbh.block.blk: 1024 ; 0x004: blk=1024kfbh.block.obj: 2147483648 ; 0x008: disk=0kfbh.check: 3813974007 ; 0x00c: 0xe3549ff7kfbh.fcn.base: 0 ; 0x010: 0x00000000kfbh.fcn.wrap: 0 ; 0x014: 0x00000000kfbh.spare1: 0 ; 0x018: 0x00000000kfbh.spare2: 0 ; 0x01c: 0x00000000kfdpHdrPairBv1.first.super.time.hi:32999670 ; 0x000: HOUR=0x16 DAYS=0x7 MNTH=0x2 YEAR=0x7dekfdpHdrPairBv1.first.super.time.lo:1788841984 ; 0x004: USEC=0x0 MSEC=0x3e4 SECS=0x29 MINS=0x1akfdpHdrPairBv1.first.super.last: 2 ; 0x008: 0x00000002kfdpHdrPairBv1.first.super.next: 2 ; 0x00c: 0x00000002kfdpHdrPairBv1.first.super.copyCnt: 5 ; 0x010: 0x05kfdpHdrPairBv1.first.super.version: 1 ; 0x011: 0x01kfdpHdrPairBv1.first.super.ub2spare: 0 ; 0x012: 0x0000kfdpHdrPairBv1.first.super.incarn: 1 ; 0x014: 0x00000001kfdpHdrPairBv1.first.super.copy[0]: 0 ; 0x018: 0x0000kfdpHdrPairBv1.first.super.copy[1]: 1 ; 0x01a: 0x0001kfdpHdrPairBv1.first.super.copy[2]: 2 ; 0x01c: 0x0002kfdpHdrPairBv1.first.super.copy[3]: 3 ; 0x01e: 0x0003kfdpHdrPairBv1.first.super.copy[4]: 4 ; 0x020: 0x0004kfdpHdrPairBv1.first.super.dtaSz: 15 ; 0x022: 0x000fkfdpHdrPairBv1.first.asmCompat:186646528 ; 0x024: 0x0b200000kfdpHdrPairBv1.first.newCopy[0]: 0 ; 0x028: 0x0000kfdpHdrPairBv1.first.newCopy[1]: 0 ; 0x02a: 0x0000kfdpHdrPairBv1.first.newCopy[2]: 0 ; 0x02c: 0x0000kfdpHdrPairBv1.first.newCopy[3]: 0 ; 0x02e: 0x0000kfdpHdrPairBv1.first.newCopy[4]: 0 ; 0x030: 0x0000kfdpHdrPairBv1.first.newCopyCnt: 0 ; 0x032: 0x00kfdpHdrPairBv1.first.contType: 1 ; 0x033: 0x01kfdpHdrPairBv1.first.spares[0]: 0 ; 0x034: 0x00000000kfdpHdrPairBv1.first.spares[1]: 0 ; 0x038: 0x00000000kfdpHdrPairBv1.first.spares[2]: 0 ; 0x03c: 0x00000000kfdpHdrPairBv1.first.spares[3]: 0 ; 0x040: 0x00000000kfdpHdrPairBv1.first.spares[4]: 0 ; 0x044: 0x00000000kfdpHdrPairBv1.first.spares[5]: 0 ; 0x048: 0x00000000kfdpHdrPairBv1.first.spares[6]: 0 ; 0x04c: 0x00000000kfdpHdrPairBv1.first.spares[7]: 0 ; 0x050: 0x00000000kfdpHdrPairBv1.first.spares[8]: 0 ; 0x054: 0x00000000kfdpHdrPairBv1.first.spares[9]: 0 ; 0x058: 0x00000000kfdpHdrPairBv1.first.spares[10]: 0 ; 0x05c: 0x00000000kfdpHdrPairBv1.first.spares[11]: 0 ; 0x060: 0x00000000kfdpHdrPairBv1.first.spares[12]: 0 ; 0x064: 0x00000000kfdpHdrPairBv1.first.spares[13]: 0 ; 0x068: 0x00000000kfdpHdrPairBv1.first.spares[14]: 0 ; 0x06c: 0x00000000kfdpHdrPairBv1.first.spares[15]: 0 ; 0x070: 0x00000000kfdpHdrPairBv1.first.spares[16]: 0 ; 0x074: 0x00000000kfdpHdrPairBv1.first.spares[17]: 0 ; 0x078: 0x00000000kfdpHdrPairBv1.first.spares[18]: 0 ; 0x07c: 0x00000000kfdpHdrPairBv1.first.spares[19]: 0 ; 0x080: 0x00000000
- super.time wall clock time of last PST commit
- super.last? last committed content version number
- super.next next available content version number
- super.copyCnt? # of disks holding PST copies
- super.version?? version of PST header format
- super.ub2spare? pad to ub4 align
- super.incarn incarnation of list
- super.copy[0]? disks holding the P本文来源gao.dai.ma.com搞@代*码(网$ST copies
- super.dtaSz? data entries in PST
- newCopy[0]?? new disks holding PST copies
- newCopyCnt? new # disks holding PST copies
以下为PST table block:
kfed read /oracleasm/asm-disk02 aun=1 blkn=3 aus=4194304 |less kfbh.endian: 1 ; 0x000: 0x01kfbh.hard: 130 ; 0x001: 0x82kfbh.type: 18 ; 0x002: KFBTYP_PST_DTAkfbh.datfmt: 2 ; 0x003: 0x02kfbh.block.blk: 1027 ; 0x004: blk=1027kfbh.block.obj: 2147483649 ; 0x008: disk=1kfbh.check: 4204644293 ; 0x00c: 0xfa9dc7c5kfbh.fcn.base: 0 ; 0x010: 0x00000000kfbh.fcn.wrap: 0 ; 0x014: 0x00000000kfbh.spare1: 0 ; 0x018: 0x00000000kfbh.spare2: 0 ; 0x01c: 0x00000000kfdpDtaEv1[0].status: 127 ; 0x000: I=1 V=1 V=1 P=1 P=1 A=1 D=1kfdpDtaEv1[0].fgNum: 1 ; 0x002: 0x0001kfdpDtaEv1[0].addTs: 2022663849 ; 0x004: 0x788f66a9kfdpDtaEv1[0].partner[0]: 49154 ; 0x008: P=1 P=1 PART=0x2kfdpDtaEv1[0].partner[1]: 49153 ; 0x00a: P=1 P=1 PART=0x1kfdpDtaEv1[0].partner[2]: 49155 ; 0x00c: P=1 P=1 PART=0x3kfdpDtaEv1[0].partner[3]: 49166 ; 0x00e: P=1 P=1 PART=0xekfdpDtaEv1[0].partner[4]: 49165 ; 0x010: P=1 P=1 PART=0xdkfdpDtaEv1[0].partner[5]: 49164 ; 0x012: P=1 P=1 PART=0xckfdpDtaEv1[0].partner[6]: 49156 ; 0x014: P=1 P=1 PART=0x4kfdpDtaEv1[0].partner[7]: 49163 ; 0x016: P=1 P=1 PART=0xbkfdpDtaEv1[0].partner[8]: 10000 ; 0x018: P=0 P=0 PART=0x2710kfdpDtaEv1[0].partner[9]: 0 ; 0x01a: P=0 P=0 PART=0x0kfdpDtaEv1[0].partner[10]: 0 ; 0x01c: P=0 P=0 PART=0x0kfdpDtaEv1[0].partner[11]: 0 ; 0x01e: P=0 P=0 PART=0x0kfdpDtaEv1[0].partner[12]: 0 ; 0x020: P=0 P=0 PART=0x0kfdpDtaEv1[0].partner[13]: 0 ; 0x022: P=0 P=0 PART=0x0kfdpDtaEv1[0].partner[14]: 0 ; 0x024: P=0 P=0 PART=0x0kfdpDtaEv1[0].partner[15]: 0 ; 0x026: P=0 P=0 PART=0x0kfdpDtaEv1[0].partner[16]: 0 ; 0x028: P=0 P=0 PART=0x0kfdpDtaEv1[0].partner[17]: 0 ; 0x02a: P=0 P=0 PART=0x0kfdpDtaEv1[0].partner[18]: 0 ; 0x02c: P=0 P=0 PART=0x0kfdpDtaEv1[0].partner[19]: 0 ; 0x02e: P=0 P=0 PART=0x0kfdpDtaEv1[1].status: 127 ; 0x030: I=1 V=1 V=1 P=1 P=1 A=1 D=1kfdpDtaEv1[1].fgNum: 2 ; 0x032: 0x0002kfdpDtaEv1[1].addTs: 2022663849 ; 0x034: 0x788f66a9kfdpDtaEv1[1].partner[0]: 49155 ; 0x038: P=1 P=1 PART=0x3kfdpDtaEv1[1].partner[1]: 49152 ; 0x03a: P=1 P=1 PART=0x0kfdpDtaEv1[1].partner[2]: 49154 ; 0x03c: P=1 P=1 PART=0x2kfdpDtaEv1[1].partner[3]: 49166 ; 0x03e: P=1 P=1 PART=0xekfdpDtaEv1[1].partner[4]: 49157 ; 0x040: P=1 P=1 PART=0x5kfdpDtaEv1[1].partner[5]: 49156 ; 0x042: P=1 P=1 PART=0x4kfdpDtaEv1[1].partner[6]: 49165 ; 0x044: P=1 P=1 PART=0xdkfdpDtaEv1[1].partner[7]: 49164 ; 0x046: P=1 P=1 PART=0xckfdpDtaEv1[1].partner[8]: 10000 ; 0x048: P=0 P=0 PART=0x2710kfdpDtaEv1[1].partner[9]: 0 ; 0x04a: P=0 P=0 PART=0x0kfdpDtaEv1[1].partner[10]: 0 ; 0x04c: P=0 P=0 PART=0x0kfdpDtaEv1[1].partner[11]: 0 ; 0x04e: P=0 P=0 PART=0x0kfdpDtaEv1[1].partner[12]: 0 ; 0x050: P=0 P=0 PART=0x0kfdpDtaEv1[1].partner[13]: 0 ; 0x052: P=0 P=0 PART=0x0kfdpDtaEv1[1].partner[14]: 0 ; 0x054: P=0 P=0 PART=0x0kfdpDtaEv1[1].partner[15]: 0 ; 0x056: P=0 P=0 PART=0x0kfdpDtaEv1[1].partner[16]: 0 ; 0x058: P=0 P=0 PART=0x0
- kfdpDtaEv1[0].status: 127 ; 0×000: I=1 V=1 V=1 P=1 P=1 A=1 D=1 disk status
- fgNum?? fail group number
- addTs?? timestamp of the addition to the diskgroup
- kfdpDtaEv1[0].partner[0]:???????? 49154 ; 0×008: P=1 P=1 PART=0×2? partner list
aun=1 的最后第二个block中备份了一份KFBTYP_DISKHEAD
[oracle@mlab2 hzy]$ kfed read /oracleasm/asm-disk02 aun=1 blkn=1022 aus=4194304 |less kfbh.endian: 1 ; 0x000: 0x01kfbh.hard: 130 ; 0x001: 0x82kfbh.type: 1 ; 0x002: KFBTYP_DISKHEADkfbh.datfmt: 1 ; 0x003: 0x01kfbh.block.blk: 1022 ; 0x004: blk=1022kfbh.block.obj: 2147483649 ; 0x008: disk=1kfbh.check: 3107059260 ; 0x00c: 0xb931f63ckfbh.fcn.base: 0 ; 0x010: 0x00000000kfbh.fcn.wrap: 0 ; 0x014: 0x00000000kfbh.spare1: 0 ; 0x018: 0x00000000kfbh.spare2: 0 ; 0x01c: 0x00000000kfdhdb.driver.provstr: ORCLDISK ; 0x000: length=8kfdhdb.driver.reserved[0]: 0 ; 0x008: 0x00000000kfdhdb.driver.reserved[1]: 0 ; 0x00c: 0x00000000kfdhdb.driver.reserved[2]: 0 ; 0x010: 0x00000000kfdhdb.driver.reserved[3]: 0 ; 0x014: 0x00000000kfdhdb.driver.reserved[4]: 0 ; 0x018: 0x00000000kfdhdb.driver.reserved[5]: 0 ; 0x01c: 0x00000000kfdhdb.compat: 186646528 ; 0x020: 0x0b200000kfdhdb.dsknum: 1 ; 0x024: 0x0001kfdhdb.grptyp: 3 ; 0x026: KFDGTP_HIGHkfdhdb.hdrsts: 3 ; 0x027: KFDHDR_MEMBERkfdhdb.dskname: DATA1_0001 ; 0x028: length=10kfdhdb.grpname: DATA1 ; 0x048: length=5kfdhdb.fgname: DATA1_0001 ; 0x068: length=10kfdhdb.capname: ; 0x088: length=0kfdhdb.crestmp.hi: 32999670 ; 0x0a8: HOUR=0x16 DAYS=0x7 MNTH=0x2 YEAR=0x7dekfdhdb.crestmp.lo: 1788720128 ; 0x0ac: USEC=0x0 MSEC=0x36d SECS=0x29 MINS=0x1akfdhdb.mntstmp.hi: 32999670 ; 0x0b0: HOUR=0x16 DAYS=0x7 MNTH=0x2 YEAR=0x7dekfdhdb.mntstmp.lo: 1812990976 ; 0x0b4: USEC=0x0 MSEC=0x3 SECS=0x1 MINS=0x1bkfdhdb.secsize: 512 ; 0x0b8: 0x0200kfdhdb.blksize: 4096 ; 0x0ba: 0x1000kfdhdb.ausize: 4194304 ; 0x0bc: 0x00400000
AUN=1 的最后一个block为KFBTYP_HBEAT 心跳表:
[oracle@mlab2 hzy]$ kfed read /oracleasm/asm-disk02 aun=1 blkn=1023 aus=4194304 |less kfbh.endian: 1 ; 0x000: 0x01kfbh.hard: 130 ; 0x001: 0x82kfbh.type: 19 ; 0x002: KFBTYP_HBEATkfbh.datfmt: 2 ; 0x003: 0x02kfbh.block.blk: 2047 ; 0x004: blk=2047kfbh.block.obj: 2147483649 ; 0x008: disk=1kfbh.check: 1479766671 ; 0x00c: 0x5833728fkfbh.fcn.base: 0 ; 0x010: 0x00000000kfbh.fcn.wrap: 0 ; 0x014: 0x00000000kfbh.spare1: 0 ; 0x018: 0x00000000kfbh.spare2: 0 ; 0x01c: 0x00000000kfdpHbeatB.instance: 1 ; 0x000: 0x00000001kfdpHbeatB.ts.hi: 32999734 ; 0x004: HOUR=0x16 DAYS=0x9 MNTH=0x2 YEAR=0x7dekfdpHbeatB.ts.lo: 3968041984 ; 0x008: USEC=0x0 MSEC=0xe1 SECS=0x8 MINS=0x3bkfdpHbeatB.rnd[0]: 1065296177 ; 0x00c: 0x3f7f2131kfdpHbeatB.rnd[1]: 857037208 ; 0x010: 0x33155998kfdpHbeatB.rnd[2]: 2779184235 ; 0x014: 0xa5a6fc6bkfdpHbeatB.rnd[3]: 2660793989 ; 0x018: 0x9e987e85
- kfdpHbeatB.instance?? instance id
- kfdpHbeatB.ts.hi timestamp
- kfdpHbeatB.rnd[0]? 随机加盐
- ?External Redundancy一般有一个PST
- Normal Redundancy至多有个3个PST
- High Redundancy 至多有5个PST
如下场景中PST 可能被重定位:
- 存有PST的ASM DISK不可用了(当ASM启东时)
- ASM DISK OFFLINE了
- 当对PST的读写发生了I/O错误
- disk被正常DROP了
- ?在读取其他ASM metadata之前会先检查PST
- 当ASM实例被要求mount diskgroup时,GMON进程会读取diskgroup中所有磁盘去找到和确认PST拷贝
- 如果他发现有足够的PST,那么会mount diskgroup
- 之后,PST会被缓存在ASM缓存中,以及GMON的PGA中并使用排他的PT.n.0锁保护
- 同集群中的其他ASM实例也将缓存PST到GMON的PGA,并使用共享PT.n.o锁保护
- 仅仅那个持有排他锁的GMON能更新磁盘上的PST信息
- 每一个ASM DISK上的AUN=1均为PST保留,但只有几个磁盘上真的有PST数据