Для большинства из нас компьютер, вероятно, кажется достаточно быстрым, если он может воспроизводить видео 8K или последнюю версию Far Cry со скоростью 60 кадров в секунду без замедления. Однако есть много сложных задач, которые требуют миллиардов вычислений в секунду, чего не может сделать настольный компьютер с процессором i9.
Вот где суперкомпьютеры пригодятся. Они предлагают высокий уровень производительности, который позволяет правительствам и организациям решать проблемы, которые были бы невозможны с обычными компьютерами.
Современные суперкомпьютеры строятся с учетом рабочих нагрузок ИИ (искусственного интеллекта). В дополнение к прогнозированию погоды, климатическим исследованиям, физическому моделированию и разведке нефти и газа, суперкомпьютеры помогают ученым открывать более устойчивые строительные материалы и изучать белки человека и клеточные системы с экстремальным уровнем детализации.
Обычно производительность суперкомпьютера измеряется в операциях с плавающей запятой в секунду (флопы). В области научных вычислений флоп — это более точная цифра, чем измерительные инструкции в секунду.
Первый суперкомпьютер — Livermore Atomic Research Computer — был построен для Центра исследований и разработок ВМС США в 1960 году.
Чтобы показать вам, как далеко мы продвинулись с тех пор, мы составили подробный список самых быстрых суперкомпьютеров в мире. Все они являются нераспределенными компьютерными системами, работающими на Linux.
Скорость: 17,1 петафлопс
Ядра: 1,572,864
Поставщик: IBM.
Расположение: Ливерморская национальная лаборатория им. Лоуренса, США.
Sequoia использует серверы IBM BlueGene/Q для достижения теоретической пиковой производительности в 20 петафлопсов. Он имеет 123% больше ядер и является на 37% более энергоэффективным, чем его предшественник компьютер K.
Хотя машина в основном используется для моделирования ядерного оружия, она также доступна для многих научных целей, таких как изменение климата и анализ генома человека. Он также продемонстрировал свою большую масштабируемость с помощью 3D-моделирования электрофизиологии человеческого сердца.
Скорость: 17.8 петафлопс
Ядра: 291,024
Поставщик: IBM
Расположение: Центр технических и научных исследований CSTJF в Пау, Франция.
Pangea III опирается на высокопроизводительную архитектуру IBM, оптимизированную для искусственного интеллекта. IBM и NVIDIA работали вместе над созданием единственного в отрасли соединения между процессорами и графическими процессорами NVLink, которое обеспечивает более чем в 5 раз более высокую пропускную способность памяти между процессорами IBM POWER9 и NVIDIA Tesla V100 Tensor Core, чем традиционные системы на базе x86.
Архитектура не только повышает производительность вычислений, но и повышает энергоэффективность. Новая система использует менее 10% потребления энергии на петафлоп, как и ее предшественница, Pangea I и II.
Pangea III имеет различные применения, особенно в трех различных областях — разведка и разработка сейсмических изображений, модели разработки и добычи, а также оценка и селективность активов.
Скорость: 18.2 петафлопс
Ядра: 288,288
Поставщик: IBM
Расположение: Ливерморская национальная лаборатория им. Лоуренса, США.
Лассен предназначен для несекретной симуляции и анализа. Он устанавливается в той же лаборатории и использует те же компоненты здания, что и Sierra (самый быстрый суперкомпьютер № 2).
Несмотря на то, что Sierra — большая система, Lassen сам по себе имеет приличный размер: он составляет ровно 1/6 от размера старшего брата. Система Lassen содержится в 40 стойках, в то время как Sierra поднимается на 240 стоек.
Процессоры IBM Power9 и 253 терабайта оперативной памяти помогают Лассену достигать невероятной производительности в 23 петафлопс.
Скорость: 19.4 петафлопс
Ядра: 305,856
Поставщик: Lenovo
Расположение: Суперкомпьютерный центр Лейбница, Германия
SuperMUC-NG имеет 6400 вычислительных узлов Lenovo ThinkSystem SD650 с непосредственным водяным охлаждением и более 700 терабайт основной памяти и 70 петабайт дискового пространства.
Он подключен к мощным системам визуализации, которые содержат большой 4K стереоскопический сетевой экран и 5-стороннюю среду искусственной виртуальной реальности CAVE.
Суперкомпьютер обслуживает европейских ученых во многих областях, включая анализ генома, гидродинамику, квантовую хромодинамику, науки о жизни, медицину и астрофизику.
Скорость: 19.8 петафлопс
Ядра: 391,680
Поставщик: Fujitsu
Расположение: Национальный институт передовых промышленных наук и технологий, Япония.
Это первая в мире крупномасштабная вычислительная инфраструктура с открытым ИИ, которая обеспечивает 32,577 петафлопс пиковой производительности. Она насчитывает 1088 узлов, каждый из которых содержит 2 золотых процессора Intel Xenon Gold Scalable, 4 GPU NVIDIA Tesla V100, 2 HCA InfiniBand EDR и 1 твердотельный накопитель NVMe.
Fujitsu Limited утверждает, что суперкомпьютер может достичь 20-кратной тепловой плотности обычных центров обработки данных и охлаждающей способности стойки мощностью 70 кВт с использованием горячей воды и воздушного охлаждения.
Скорость: 21.2 петафлопс
Ядра: 979,072
Продавец: Cray
Расположение: Лос-Аламосская национальная лаборатория, США
Trinity построен для обеспечения экстраординарных вычислительных возможностей для предприятия по ядерной безопасности NNSA. Он направлен на повышение геометрических и физических достоверностей в коде моделирования ядерного оружия, обеспечивая при этом безопасность, надежность и эффективность ядерного арсенала.
Суперкомпьютер разрабатывался в два этапа: на первом этапе использовался процессор Intel Xeon Haswell, а на втором — значительное повышение производительности с использованием процессора Intel Xeon Phi Knights Landing. Он может обеспечить максимальную производительность более 41 петафлопс.
Скорость: 21.2 петафлопс
Ядра: 387,872
Продавец: Cray
Расположение: Швейцарский национальный суперкомпьютерный центр, Швейцария
Этот суперкомпьютер, названный в честь горы Piz Daint в швейцарских Альпах, работает на микропроцессоре Intel Xeon E5-26xx и NVIDIA Tesla P100.
Piz Daint использует DataWarp в «режиме импульсного буфера», чтобы увеличить эффективную полосу пропускания для устройств хранения и обратно. Это ускоряет скорость ввода / вывода данных, облегчая анализ миллионов небольших неструктурированных файлов.
В дополнение к своим ежедневным задачам, он может выполнять анализ данных некоторых из самых интенсивных проектов в мире, таких как данные, полученные в результате экспериментов на Большом адронном коллайдере.
Скорость: 23.5 петафлопс
Ядра: 448,448
Поставщик: Dell EMC
Расположение: Техасский вычислительный центр, США
Frontera открывает новые возможности в разработке и исследованиях, предоставляя обширные вычислительные ресурсы, которые облегчают ученым решение многих сложных задач в широком диапазоне областей.
Frontera имеет две вычислительные подсистемы: первая ориентирована на производительность с двойной точностью, а вторая — на потоковую память одинарной точности. Он также имеет облачные интерфейсы и несколько узлов приложений для размещения виртуальных серверов.
Скорость: 61.4 петафлопс
Ядра: 4,981,760
Поставщик: NUDT
Расположение: Национальный суперкомпьютерный центр в Гуанчжоу, Китай
Обладая более чем 16 000 компьютерными узлами, Tianhe-2A представляет собой крупнейшую в мире установку процессоров Intel Ivy Bridge и Xeon Phi. Хотя каждый узел имеет 88 гигабайт памяти, общая память (процессор+сопроцессор) составляет 1375 тебибайт.
Китай потратил 2,4 миллиарда юаней (390 миллионов долларов США) на строительство этого суперкомпьютера. В настоящее время он в основном используется в приложениях моделирования, анализа и государственной безопасности.
Скорость: 93 петафлопса
Ядра: 10,649,600
Поставщик: NRCPC
Расположение: Национальный суперкомпьютерный центр в Уси, Китай
Вычислительная мощность TaihuLight исходит от собственного многоядерного процессора SW26010, который включает в себя как элементы вычислительной обработки, так и элементы управления обработкой.
Один SW26010 обеспечивает пиковую производительность более 3 терафлопс благодаря 260 вычислительным элементам (интегрированным в один процессор). Каждый вычислительный обрабатывающий элемент имеет скрэтчпад-память, которая служит кэш-памятью, управляемой пользователем, что значительно уменьшает узкие места в памяти в большинстве приложений.
В дополнение к наукам о жизни и фармацевтическим исследованиям, TaihuLight используется для моделирования Вселенной с 10 триллионами цифровых частиц. Однако Китай пытается достичь гораздо большего: страна уже заявила о своей цели стать лидером в области искусственного интеллекта к 2030 году.
Скорость: 94.6 петафлопс
Ядра: 1.572.480
Поставщик: IBM.
Расположение: Ливерморская национальная лаборатория им. Лоуренса, США.
Sierra предлагает до 6 раз устойчивую производительность и в 7 раз производительность рабочей нагрузки своего предшественника Sequoia. Он сочетает в себе два типа процессорных чипов: процессоры IBM Power 9 и графические процессоры Nvidia Volta.
Sierra специально предназначена для оценки эффективности систем ядерного оружия. Он используется для прогнозных применений в управлении запасами, американской программе испытаний надежности и технического обслуживания ядерного оружия без каких-либо ядерных испытаний.
Скорость: 148,6 петафлопс
Ядра: 2,414,592
Поставщик: IBM.
Расположение: Национальная лаборатория Ок-Риджа, США.
Summit является самым быстрым суперкомпьютером в мире, который может обеспечить 200 петафлопс в пике. Это эквивалентно 200 квадриллионам операций с плавающей запятой в секунду.
Это также третий по величине энергосберегающий суперкомпьютер в мире с зарегистрированной эффективностью энергопотребления 14,66 гигафлопс на ватт.
На 4600+ серверах Summit, занимающих два баскетбольных поля, размещено более 9 200 процессоров IBM Power9 и более 27 600 графических процессоров NVIDIA Tesla V100. Система соединена волоконно-оптическим кабелем длиной 298 км и потребляет достаточно энергии для работы 8 100 домов.
В 2018 году Summit стал первым суперкомпьютером, преодолевшим эксафлопный барьер. Анализируя геномные данные, он достиг пиковой пропускной способности в 1,88 эксафлопс, что составляет почти 2 миллиарда миллиардов вычислений в секунду.