存储治理问题一则
历经大半年的大数据上云也算在近期告一段落。数据上云也是为了更稳定,减少维护成本,增缩容更方便。
数据上云过程中,我又主导了新的一期数据治理。以下记录下存储治理的一个问题排查过程。
问题
现阶段业务并没有爆发增长,但是每日新增存储 GAP (每日新增 0.4%)还挺大,结合 80%的总存储水位线,整体集群存储可用时间只剩 100 天!结合业务知识背景,这显然不合理。
排查
现阶段生命周期设置
主要耗费存储的地方在数仓分层底层部分
占用量前 1% 的表占比 90% 的存储。
占用量 千分之一...