IBM построила самое большое в мире хранилище данных
Голубой гигант воплотил в реальность 120-петайбайтную систему хранения данных, составленную из 200 тыс. обычных жестких дисков. Хранилище, в десять раз превышающее прежние самые крупные, создано по заказу одного из клиентов, нуждавшегося в новом суперкомпьютере для подробного моделирования реальных явлений.
120 петабайт — это 120 миллионов гигабайт, в которых можно разместить триллион файлов, и подобного объема хватило бы для полноценного моделирования погоды и климата, сейсмических процессов в нефтяной отрасли, молекулярного исследования геномов и белков. Чтобы представить весь кошмарный объем, напомним, что оригинальный 5-Гбайт iPod хранил «1000 песен в кармане», значит, на гигабайт приходилось 200 MP3-файлов, соответственно, 120 Пбайт охватят 24 млрд аудиотреков. Иначе: массива хватит на 60 копий самого подробного архива Интернета Internet Archive WayBack Machine, составленного из 150 млрд веб-страниц.
Для управления монстром IBM пришлось придумать новые аппаратные и программные технологии, дабы заставить все элементы системы работать слаженно. Винчестеры размещены в типичном центре обработки данных на широких стойках с водяным охлаждением. Как только какой-либо из носителей приходит в негодность, система воспроизводит утерянную информацию на здоровый винчестер. Применяется файловая система GPFS, распространяющая отдельные файлы по множеству дисков так, что части файлов могут быть прочитаны и записаны одновременно. Производительность GPFS позволяет индексировать 10 млрд файлов за 45 минут.
© СОТОВИК