HP rp3440 의 DAT drive (DAT 72)의 버튼이 눌리지 않아서 새것으로 교체.
아래 문서를 참고.
http://www.ischo.net/hpux/6449
외장 1U DAT이므로, 서버를 끌 필요는없었고, kcmodule 로 커널의 tape 상태 확인. ioscan하면 디바이스 화일은 생성되어 있으나, 실제 작동하지 않음. 그래서, insf -eC tape한후 작동시켜 보니 잘 됨.
HP rp3440 의 DAT drive (DAT 72)의 버튼이 눌리지 않아서 새것으로 교체.
아래 문서를 참고.
http://www.ischo.net/hpux/6449
외장 1U DAT이므로, 서버를 끌 필요는없었고, kcmodule 로 커널의 tape 상태 확인. ioscan하면 디바이스 화일은 생성되어 있으나, 실제 작동하지 않음. 그래서, insf -eC tape한후 작동시켜 보니 잘 됨.
처음 에러 메시지
Dec 13 06:47:11 solaris9 picld[60]: [ID 679711 daemon.error] NOTICE: Device FAN_TRAY_0 (CPU1_FAN) OK
Dec 13 06:47:11 solaris9 picld[60]: [ID 114988 daemon.error] FSP_GEN_FAULT_LED has turned OFF
Dec 13 08:22:26 solaris9 picld[60]: [ID 562987 daemon.error] WARNING: FAN_TRAY_0 (CPU1_FAN) failure detected
Dec 13 08:22:28 solaris9 picld[60]: [ID 691918 daemon.error] FSP_GEN_FAULT_LED has turned ON
Dec 13 08:22:41 solaris9 picld[60]: [ID 562987 daemon.error] WARNING: FAN_TRAY_0 (CPU1_FAN) failure detected
Dec 13 08:22:57 solaris9 picld[60]: [ID 679711 daemon.error] NOTICE: Device FAN_TRAY_0 (CPU1_FAN) OK
Dec 13 08:22:58 solaris9 picld[60]: [ID 114988 daemon.error] FSP_GEN_FAULT_LED has turned OFF
FAN TRAY를 교체하려고 준비했을때는 아래와 같이 바뀌었음.
Jan 19 15:24:11 solaris9 picld[60]: [ID 562987 daemon.error] WARNING: FAN_TRAY_0 (CPU0_FAN) failure detected
Jan 19 15:24:11 solaris9 picld[60]: [ID 562987 daemon.error] WARNING: FAN_TRAY_0 (CPU1_FAN) failure detected
Jan 19 15:24:11 solaris9 picld[60]: [ID 562987 daemon.error] WARNING: FAN_TRAY_0 (CPU2_FAN) failure detected
Jan 19 15:24:26 solaris9 picld[60]: [ID 679711 daemon.error] NOTICE: Device FAN_TRAY_0 (CPU0_FAN) OK
Jan 19 15:24:26 solaris9 picld[60]: [ID 679711 daemon.error] NOTICE: Device FAN_TRAY_0 (CPU1_FAN) OK
Jan 19 15:24:26 solaris9 picld[60]: [ID 562987 daemon.error] WARNING: FAN_TRAY_0 (CPU2_FAN) failure detected
Jan 19 15:26:41 solaris9 last message repeated 9 times
FAN TRAY를 교체하고 (이때 FAN Tray의 fan 3개는 모두 정상적으로 돌고 있었음.) 재부팅했을때 아래와 같음.
Jan 19 15:38:59 solaris9 ntpdate[234]: [ID 558275 daemon.notice] adjust time server 10.100.88.42 offset 0.266879 sec
Jan 19 15:39:02 solaris9 xntpd[292]: [ID 702911 daemon.notice] xntpd 3-5.93e Mon Sep 20 15:47:11 PDT 1999 (1)
Jan 19 15:39:02 solaris9 xntpd[292]: [ID 301315 daemon.notice] tickadj = 5, tick = 10000, tvu_maxslew = 495, est. hz = 100
Jan 19 15:39:02 solaris9 xntpd[292]: [ID 798731 daemon.notice] using kernel phase-lock loop 0041
Jan 19 15:39:02 solaris9 last message repeated 1 time
Jan 19 15:39:04 solaris9 picld[60]: [ID 562987 daemon.error] WARNING: FAN_TRAY_0 (CPU2_FAN) failure detected
Jan 19 15:39:05 solaris9 picld[60]: [ID 691918 daemon.error] FSP_GEN_FAULT_LED has turned ON
Jan 19 15:39:19 solaris9 picld[60]: [ID 562987 daemon.error] WARNING: FAN_TRAY_0 (CPU2_FAN) failure detected
Jan 19 15:40:05 solaris9 last message repeated 3 times
일단 팬트레이를 교체해도 문제가 해결되지 않아서 더 찾아보니, picld 버그일 가능성이 있다고 한다. 패치를 찾아서 시도해 보아야 할 상황인데, 패치를 받기가 힘들다. sun이 오라클에 합병당해서
HPUX 디스크 추가.(1개를 통채로 잡는방법)
pvcreate -f /dev/rdisk/disk39
cd /dev
mkdir vg05
cd vg05
mknod group c 64 0×050000
vgcreate -s 32 /dev/vg05 /dev/disk/disk39
vgdisplay vg05
lvcreate -l `vgdisplay Free PE값’ /dev/vg05
newfs -F vxfs -o largefiles /dev/vg05/rlvol1
# strings /etc/lvmtab
/dev/vg00
/dev/disk/disk1_p2
/dev/vg02
/dev/disk/disk68
/dev/vg03
/dev/disk/disk42
/dev/vg01
/dev/disk/disk41
/dev/vg04
/dev/disk/disk40
/dev/vg05
/dev/disk/disk39
/dev/vg06
/dev/disk/disk38
# bdf
Filesystem kbytes used avail %used Mounted on
/dev/vg00/lvol3 115048448 14713576 99557352 13% /
/dev/vg00/lvol1 2097152 192504 1889856 9% /stand
/dev/vg02/lvol1 24760320 3563645 19872682 15% /oracle
/dev/vg01/lvol1 517963776 193597 485409550 0% /archive
/dev/vg01/lvol1 517963776 193597 485409550 0% /archive
/dev/vg03/lvol1 517963776 3965111 481873868 1% /oradata/data1
/dev/vg04/lvol1 517963776 193597 485409550 0% /oradata/data2
/dev/vg05/lvol1 517963776 193597 485409550 0% /oradata/data3
/dev/vg06/lvol1 517963776 193597 485409550 0% /oradata/data4
볼륨 삭제.(vg01을 삭제하고자 할때)
vgchange -a n vg01
vgexport vg01
우분투리눅스(11.04)에서 디스크 두개를 mdadm으로 미러 구성을 하고, 메타디바이스를 md0로 설정하였다.
하지만, 재부팅하면 md0는 사라지고 대신 md127로 인식을 하는 현상이 발생.
mdadm –detail /dev/md127 하여나오는 결과중에 UUID와 Name을 아래 화일에 설정해 준다.
/dev/md127:
Version : 1.2
Creation Time : Tue Nov 29 21:22:23 2011
Raid Level : raid1
Array Size : 488382841 (465.76 GiB 500.10 GB)
Used Dev Size : 488382841 (465.76 GiB 500.10 GB)
Raid Devices : 2 Total Devices : 2
Persistence : Superblock is persistent
Update Time : Fri Dec 2 17:14:15 2011
State : clean
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
Name : fox:0 (local to host fox)
UUID : 4c2ddcae:30672ec0:f6065242:f4702e40
Events : 19
Number Major Minor RaidDevice State
0 8 17 0 active sync /dev/sdb1
1 8 33 1 active sync /dev/sdc1
/etc/mdadm/mdadm.conf
ARRAY /dev/md0 devices=/dev/sdb1,/dev/sdc1 name=fox:0 UUID=4c2ddcae:30672ec0:f6065242:f4702e40 level=1 num-devices=2 auto=yes
여기서 fox는 호스트네임.
이후 아래커맨드 실행 후 재부팅 하면, 정상적으로 md0로 인식됨.
update-initramfs -u
1. connect MP (serial cable, ctrl+B)
[mp00215a9a04db] MP>
MP MAIN MENU:
CO: Console
VFP: Virtual Front Panel
CM: Command Menu
CL: Console Log
SL: Show Event Logs
CSP: Connect to Service Processor
SE: Enter OS Session
HE: Main Help Menu
X: Exit Connection
System state Activity # of logs since boot
————— ——– ——————–
HPUX init process start 746
2. show display Front system LED : VFP command
LEDs | LOCATOR | SYSTEM | POWER
—————————————————————————–
| OFF | FLASH RED | ON GREEN
—————————————————————————–
Status | Fatal System State detected. Check System Event Log (SL) for error
| messages.
—————————————————————————–
3. execute dc command.( CM -> dc)
[mp00215a9a04db] MP> cm
[mp00215a9a04db] MP:CM> dc
DCThis command will restore all MP Configurations to their default values.
To restore specific configurations to their defaults use the following commands:
Remote Console Serial Port Modem configuration: CA -remote DEFAULT
MP IP configuration : LC -all DEFAULT
Remote Access Configuration : SA -all
DEFAULT Command Interface configuration : IT -all
DEFAULT MP Security configuration : SO -opt DEFAULT
MP Session configuration : IT -all DEFAULT
MP User configuration : UC -all DEFAULT
MP LDAP directory configuration : LDAP -all DEFAULT
SNMP Configuration : SNMP -all DEFAULT
Restore All MP configuration default values? (Y/[N]):
Restore All MP configuration default values? (Y/[N]): yy
-> All MP configuration will be reset to its default values.
-> Users may be disconnected in this process
Command execution may take 25 seconds.
-> MP IP configuration
-> Remote Console Serial Port Modem configuration
-> Paging configuration
-> Remote Access
-> MP Security configuration
*************************************************************************
This is a private system.
Do not attempt to login unless you are an authorized user.
Any authorized or unauthorized access or use may be monitored and can
result in criminal or civil prosecution under applicable law.
*************************************************************************
*************************************************************************
Only default users are configured. Use one of the following user/password pairs to login:
Admin/Admin Oper/Oper
*************************************************************************
MP login:
4. MP login and VFP , then red led were turn offed.
LEDs | LOCATOR | SYSTEM | POWER
—————————————————————————–
| OFF | OFF | ON GREEN
—————————————————————————–
Status | No code is executing. System is Off.
—————————————————————————–
CISCO 1720
TFTP server: 10.0.0.58
Router Ethernet: 10.0.0.57
Router#sh flash
System flash directory:
File Length Name/status
1 3038760 c1700-y-mz.121-3
[3038824 bytes used, 5349784 available, 8388608 total]
8192K bytes of processor board System flash (Read/Write)
Router#copy flash tftp
Source filename []? c1700-y-mz.121-3
Address or name of remote host []? 10.0.0.58
Destination filename [c1700-y-mz.1213]?
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
3038760 bytes copied in 19.132 secs (159934 bytes/sec)
구성:
sda: OS 디스크
sdb, sdc : 미러링할 디스크(빈것, 사용중인것도 가능함)
아래 커맨드로, 커널 모듈이 실행되고 있는지 확인. 없으면, insmod로 모듈 올려줌.
lsmod | grep -i linear
lsmod | grep -i raid
일단, sdb를 fdisk로 통채로 파티션 잡아줌
fdisk /dev/sdb
Command (m for help): p
Disk /dev/sdb (Sun disk label): 4 heads, 1093 sectors, 65533 cylindersUnits = cylinders of 4372 * 512 bytes
Device Flag Start End Blocks Id System/dev/sdb1 r 0 65533 143255138 fd Linux raid autodetect
sdc도 sdb와 동일하게 파티션. sfdisk를 이용해도 됨(sfdisk -l /dev/sdb | sfdisk /dev/sdc) . 파티션 타입을 fd로 설정해야한다.
mdadm –create –verbose /dev/md0 –level=1 –raid-device=2 /dev/sdb1 /dev/sdb2
mkfs.ext3 /dev/md0
아래 커맨드로 확인
mdadm –detail /dev/md0
마지막으로 마운트하여 사용하면 된다.
cat /proc/mdstat 로 미러 상태 확인가능.
참고문서 :
http://www.howtoforge.com/redundant-array-of-inexpensive-disks-raid-technical-paper
http://tldp.org/HOWTO/Software-RAID-HOWTO-5.html#ss5.6
HP 9000 rp3440 시스템에 경고등이 들오와있다.
어떤것은 주황색, 또 어떤것은 빨강색, 또 어떤것은 초록색…
초록은 정상. 주황은 위험수위가 낮은 이벤트, 빨강은 위험 수위가 높은 이벤트가 발생한것.
문제는, 내가 보기 시작한것은 최근이고, 그 이전의 상황은 알 수가 없다는것.
일단, /var/adm/syslog/syslog.log 상에는 최근 error나 warning이 없고, 아주 옛날에
temperature 가 한계치 까지 치솟았던 상황이나, cpu 캐쉬쪽 문제가 보였다.
일단, 최근 에러 상황이 없었고, 경고등이 들어오면서 재부팅된적이 없기때문에, 일시적 장애로 보고,
경고등을 정상인 초록으로 만들어야 했다. 그냥은 안되고, MP (Maintenance Processor) 상에서
vfp 메뉴로 들어갔더니, 정상으로 바뀌었다.
MP 진입은 serial console접속한후 ctrl+B로 진입한다고한다. 오늘 시스템은 시리얼 콘솔로 접속하니
바로 MP 로그인 화면이 나왔다. 디폴트는 Admin/Admin 이다.
이 시스템은 일단 system LED가 amber(주황)인 상황이었고, VFP들어갔더니 그냥 green으로 바뀌었다.
MP MAIN MENU:
CO: Console
VFP: Virtual Front Panel
CM: Command Menu
CL: Console Log
SL: Show Event Logs
CSP: Connect to Service Processor
SE: Enter OS Session
HE: Main Help Menu
X: Exit Connection
[mp001b78e5d56d] MP> vfp
Welcome to the Virtual Front Panel (VFP).
Use Ctrl-B to exit.
System state Activity # of logs since boot
————— ——– ——————–
HPUX init process start 570
E indicates error since last boot
LEDs | LOCATOR | SYSTEM | POWER
—————————————————————————–
| OFF | ON GREEN | ON GREEN
—————————————————————————–
Status | System running normally.
—————————————————————————–
[mp001b78e5d56d] MP:VFP(Use ‘?’ to display VFP terminal info or Ctrl-B to Quit)>
RED인 시스템은 다음 기회에 … ;^^
errpt 를 봐도 별다른 에러 사항이 없는데, 경고등이 켜져 있다.
이것 저것 찾아보다보니, 의외로 비슷한 경우가 종종 있는것 같네?
IBM AIX서버 경고등 끄기.
http://heeya12.tistory.com/entry/AIX-%EC%84%9C%EB%B2%84-LED-%EA%B2%BD%EA%B3%A0%EB%93%B1-%EB%81%84%EA%B8%B0
/usr/lpp/diagonostics/bin/usysfault -s normal
Bad Behavior has blocked 31 access attempts in the last 7 days.