Ceph OSDS Full Troubleshooting

Pada percobaan kali ini kita akan mensimulasikan bagaimana ketika OSD Ceph dalam kondisi full dan cara troubleshooting.

Kondisi normal, environment sama dengan production:

Environment Production:

ceph-production

ceph-status

Environment Test server:

Dilakukan penambahan data/disk secara terus menerus:

Lalu kondisi ceph berubah dari status health_ok menjadi health_err:

health-status

osd 8 menjadi full:

full-osd8

detail space osd:

detail-space

semua operation tidak bisa berjalan sempurna:

shutoff

Ada 2 cara untuk menyeimbangkan full cluster ceph:

Menambahkan OSDs baru akan secara otomatis mendistribusikan pages ceph.

lihat berikut:

dari 10 osd ditambah 2 osd menjadi 12 osd:

12-osd

data pages ceph akan secara otomatis rebalanced

hasil akhir:

recovery osd12

Distribusikan storage dengan perintah seperti berikut:

ceph osd reweight-by-utilization

reweight-by-utilization

Running the command will make adjustments to a maximum of 4 OSDs that are at 120% utilization

hasil akhir setelah redistribute:

ceph-osd-status

hasil-akhir-resdistribute

Ref: