Самый мощный компьютер в мире. Подписка на новости Суперкомпьютеры в современном мире

Данная новость была прочитана 12443 раза

45-й рейтинг TOP500 самых мощных суперкомпьютеров мира. Новинка первой десятки списка - система Shaheen II, установленная в Научно-технологическом университете имени короля Абдаллы (Саудовская Аравия). Лидером рейтинга с 2013 года остаётся Tianhe-2 (Китай). На нашем сайте представлены фотографии всех суперкомпьютеров из Top10

13 июля 2015 года на международной конференции по суперкомпьютерным технологиям International Supercomputing Conference (ISC"15) во Франкфурте, Германия был представлен 45-й TOP500 - рейтинг пятисот самых быстрых суперкомпьютеров в мире, основанный на тестах Linpack (HPL). Список обновляется раз в шесть месяцев, и за прошедшие полгода первая его десятка не подверглась кардинальным изменениям. Единственной новинкой в ТOP-10 стал суперкомпьютер Shaheen II , установленный в Научно-технологическом университете имени короля Абдаллы (Саудовская Аравия), который занял 7-ю позицию в рейтинге. Он также стал единственным в первой десятке, запущенным в работу в 2015 году. Возглавляет список в пятый раз подряд Tianhe-2 , созданный в Оборонном научно-техническом университете КНР (National University of Defense Technology, NUDT) в 2013 году. Как отмечают составители рейтинга, остальные восемь систем-лидеров TOP500 были созданы в 2011-2012 годах.

Суммарная производительность всех систем списка увеличилась за полгода с 309 до 363 петафлопс. Среднее количество вычислительных ядер на систему выросло с 46 288 до 50 495.

По количеству установленных систем в TOP500 традиционно лидируют Hewlett-Packard - 178 (179 в 44-й редакции TOP500) и IBM - 111 (153). 20 систем списка отмечены как IBM-Lenovo, ещё 3 - Lenovo. 71 система установлена компанией Cray . По суммарной производительности лидируют системы производства Cray - 24% (22% полгода назад), на втором месте IBM - 23% (26%), на третьем Hewlett-Packard - 14.2% (15.6%). NUDT, представленный суперкомпьютерами Tianhe-2 и Tianhe-1A на четвертом месте - 10.9% (12.7%).

Суперкомпьютер Tianhe-2 - TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH Express-2, Intel Xeon Phi 31S1P

1. Tianhe-2

Расположение: Национальный суперкомпьютерный центр в Гуанчжоу (National Super Computer Center in Guangzhou), Китайская Народная Республика

Количество ядер: 3 120 000
Максимальная производительность согласно тесту Linpack (HPL): 33,863 петафлопса
Теоретическая пиковая производительность системы: 54,902 петафлопса
Мощность: 17,808 МВт
Операционная система: Linux (Kylin)

Tianhe-2 создан по инициативе правительства Китая Оборонным научно-техническим университетом КНР (NUDT) и компанией Inspur (Китай) . Состоит из 16 тысяч вычислительных узлов, в каждом из которых расположено по два процессора Intel Xeon E5-2692 на архитектуре Ivy Bridge и по три векторных сопроцессора Intel Xeon Phi 31S1P. На каждый процессор выделяется по 32 ГБ оперативной памяти стандарта DDR3 с коррекцией ошибок, а на каждый сопроцессор — по 8 ГБ памяти стандарта GDDR5.

Оперативная память составляет 1,4 петабайт, а запоминающего устройства - 12,4 петабайт.

В течение 2015 года планировалось удвоить производительность системы (до 110 теоретических петафлопс), но в начале 2015 года правительство США отказало в прошении Intel предоставить экспортную лицензию на центральные процессоры и сопроцессоры для этого проекта; также разработчики компьютера были внесены в список обязательного рассмотрения (лицензирования) каждой поставки по экспортному законодательству США в связи с подозрением об их участии в разработке оружия массового уничтожения (ядерном).

Согласно официальному пресс-релизу NUDT , суперкомпьютер Tianhe -2 используется для решения задач из области материаловедения, метеорологии, астрофизики и биохимии.

Суперкомпьютер Titan - Cray XK7 , Opteron 6274 16C 2.200GHz, коммуникационная сеть Cray Gemini, NVIDIA K20x

2. Titan

Расположение: Окриджская национальная лаборатория (Oak Ridge National Laboratory, ORNL) - Национальный исследовательский центр Министерства энергетики США в Ок-Ридже

Количество ядер: 560 640
Максимальная производительность согласно тесту Linpack (HPL): 17,590 петафлопса
Теоретическая пиковая производительность системы: 27,113 петафлопса
Операционная система: Linux (CLE, SLES based)
Мощность: 8,209 МВт

Titan построен на платформе Cray XK7 с гибридной архитектурой: помимо 16-ядерных процессоров AMD Opteron 6274 в каждый из 18 688 узлов суперкомпьютерной системы установлен графический ускоритель NVIDIA K20x.

Titan используется в научных проектах, таких как моделирование поведения нейтронов в ядерном реакторе, прогнозирование климатических изменений на ближайшие 1-5 лет, изучение биотоплива и др.

Суперкомпьютер Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz

3. Sequoia

Расположение: Ливерморская национальная лаборатория им. Э. Лоуренса (Lawrence Livermore National Laboratory, LLNL) - Национальный исследовательский центр Министерства энергетики США в Ливерморе

Количество ядер: 1 572 864
Максимальная производительность согласно тесту Linpack (HPL): 17,173 петафлопса
Теоретическая пиковая производительность системы: 20,133 петафлопса
Мощность: 7,89 МВт

Sequoia разработана корпорацией IBM для Национальной администрации по ядерной безопасности (National Nuclear Security Administration) для задач моделирования ядерных взрывов. Также Sequoia применяется для проектов в астрономии, энергетики, изучения человеческого генома и изменения климата.

Sequoia построена на платформе Blue Gene/Q (последнее поколение в линейке суперкомпьютерных архитектур Blue Gene). Суперкомпьютер состоит из 98 304 вычислительных узлов и имеет 1,6 Пб памяти в 96 стойках, вместе занимающих площадь в 300 квадратных метров. Используются 16-ти ядерные центральные процессоры Power.

Суперкомпьютер K computer - SPARC64 VIIIfx 2.0GHz, коммуникационная сеть Tofu

4. K computer

Расположение: Институт физико-химических исследований RIKEN, Япония

Количество ядер: 705 024
Максимальная производительность согласно тесту Linpack (HPL): 10,510 петафлопса
Теоретическая пиковая производительность системы: 11,280 петафлопса
Мощность: 12,66 МВт
Операционная система: Linux

K computer производства компании Fujitsu построен при поддержке Министерства образования, культуры, спорта, науки и технологий Японии. Сразу после запуска в 2011 году занял в TOP500 первую позицию, на один год став самым высокопроизводительным в мире. А в ноябре 2011 года K Computer первым в истории достиг мощности выше 10 петафлопс. Система оснащена 88 128 8-ядерными процессорами SPARC64 VIIIfx.

Суперкомпьютер используется в таких исследовательских задачах, как прогнозирование стихийных бедствий (землетрясений и цунами), моделирование в области медицины и др.

Суперкомпьютер Mira - BlueGene/Q, Power BQC 16C 1.60GHz

5. Mira

Расположение: Аргоннская национальная лаборатория (Argonne National Laboratory, ANL) - Национальный исследовательский центр Министерства энергетики США в Аргонне

Количество ядер: 786 432
Максимальная производительность согласно тесту Linpack (HPL): 8,586 петафлопса
Теоретическая пиковая производительность системы: 10,066 петафлопса
Мощность: 3,945 МВт
Операционная система: Linux

Mira разработан компанией IBM на платформе Blue Gene/Q. Расположенный на 48 стойках Mira имеет 49152 вычислительных узлов, оборудованных 16-ядерными процессорами Power BQC. Система использует 70Пб дискового пространства.

Mira участвует в различных научных проектах - моделирование происходящих во Вселенной процессов, предсказательное моделирование климатических и сейсмических явлений и др.

Суперкомпьютер Piz Daint - Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect , NVIDIA K20x

6. Piz Daint

Расположение: Швейцарский национальный центр суперкомпьютерных вычислений (Swiss National Supercomputing Centre, Centro Svizzero di Calcolo Scientifico, CSCS)

Количество ядер: 115 984
Максимальная производительность согласно тесту Linpack (HPL): 6,271 петафлопса
Теоретическая пиковая производительность системы: 7,788 петафлопса
Мощность: 2,325 МВт
Операционная система: Cray Linux Environment

Мощнейший суперкомпьютер в Европе был разработан компанией Cray и принадлежит к семейству XC30, в рамках которого является наиболее производительным. В системе используются 8-ядерные процессоры Intel Xeon E5-2670 и ускорители NVIDIA K20x.

Piz Daint применяется в различных исследовательских целях, например, для компьютерного моделирования в таких областях, как материаловедение, физика высоких энергий, изучение климата, метеорология и геофизика.

Shaheen II - Cray XC40, Xeon E5-2698v3 16C 2.3GHz, сеть Aries

7. Shaheen II

Расположение: Научно-технологический университет имени короля Абдаллы (King Abdullah University of Science and Technology, KAUST), Саудовская Аравия

Количество ядер: 196 608
Максимальная производительность согласно тесту Linpack (HPL): 5.537 петафлопса
Теоретическая пиковая производительность системы: 7.235 петафлопса
Мощность: 2,834 МВт
Операционная система: Linux (CLE)

Shaheen II построен на платформе CRAY XC40. В системе используются 16-ядерные процессоры Intel Xeon E5-2698V3.

Суперкомпьютер применяется для решения сложных вычислительных задач в нуждах нефтегазовой, энергетической, геологоразведывательной и других отраслей. Также среди перспективных направлений для работы указывается биоинжиниринг.

Суперкомпьютер Stampede - PowerEdge C8220, Xeon E5-2680 8C 2.700GHz, сеть Infiniband FDR, Intel Xeon Phi SE10P

8. Stampede

Расположение: Texas Advanced Computing Center, США

Количество ядер: 462 462
Максимальная производительность согласно тесту Linpack (HPL): 5,168 петафлопса
Теоретическая пиковая производительность системы: 8,520 петафлопса
Мощность: 4,51 МВт
Операционная система: Linux

Суперкомпьютер Stampede создан компанией Dell совместно с Intel для Национального Научного Фонда США (National Science Foundation, NSF). Система включает в себя 6400 узлов Dell C8220, каждый из них управляется двумя 8-ядерными процессорами Intel Xeon E5 и 61-ядерным сопроцессором Intel Xeon Phi Knights Corner. 128 компьютерных узлов оборудовано производительными графическими процессорами NVIDIA на архитектуре Kepler K20.

Stampede используется для таких задач, как моделирование изменений климата, предсказание землетрясений и ураганов, изучение ДНК вирусов, молекулярные исследования, космические исследования.

Суперкомпьютер JUQUEEN - BlueGene/Q, Power BQC 16C 1.600GHz

9. Juqueen

Расположение: Исследовательский центр Юлих (Forschungszentrum Juelich, FZJ), Германия

Количество ядер: 458 752

Максимальная производительность согласно тесту Linpack (HPL): 5,008 петафлопса

Теоретическая пиковая производительность системы: 5,872 петафлопса
Мощность: 2,301 МВт
Операционная система: Linux (RHEL, CNK)

Juqueen - второй по мощности суперкомпьютер в Европе, разработан при участии корпорации IBM. Juqueen базируется на архитектуре Blue Gene/Q. Количество процессоров в системе - 294 912 (16-ядерные Power BQC).

Исследовательский центр, в котором установлен Juqueen, является крупнейшим в Европе. FZJ ведет различного рода работы, связанные с сопровождением существующих и созданием перспективных термоядерных реакторов.

Суперкомпьютер Vulcan - BlueGene/Q, Power BQC 16C 1.600GHz

10. Vulcan

Расположение: Ливерморская национальная лаборатория им. Э. Лоуренса (Lawrence Livermore National Laboratory, LLNL)

Количество ядер: 393 216
Максимальная производительность согласно тесту Linpack (HPL): 4,293 петафлопса
Теоретическая пиковая производительность системы: 5,033 петафлопса
Мощность: 1,972 МВт
Операционная система: Linux (RHEL, CNK)

Vulcan , разработанный компанией IBM, также относится к семейству Blue Gene поколения Q. Суперкомпьютер используется для различных исследований, в том числе для моделирования аномальных природных явлений . Научные группы и учреждения могут получить доступ к системе по заявке в Центр инноваций в области высокопроизводительных вычислений США.

Российские суперкомпьютеры в TOP 500

  • «Ломоносов-2» (Московский государственный университет им. М. В. Ломоносова) —31 место, производительность по тесту Linpack - 1,849 петафлопса.
  • «Ломоносов» (Московский государственный университет им. М. В. Ломоносова) - 78 место; 0,902 петафлопса.
  • «Торнадо» (Санкт-Петербургский политехнический университет Петра Великого) - 107 место; 0,658 петафлопса.
  • MVS -10P (Межведомственный суперкомпьютерный центр РАН) - 176-е место; 0,376 петафлопса.
  • «Лобачевский» (Нижегородский государственный университет имени Н. И. Лобачевского) - 242-е место; 0,29 петафлопса.
  • «Торнадо ЮУрГУ» (Южно-Уральский государственный университет) - 245-е место; 0,288 петафлопса.
  • Суперкомпьютер компании Hewlett-Packard, используемый неуказанным российским поставщиком услуг в сфере информационных технологий - 413-е место; 0,189 петафлопса.
  • RSC PetaStream (Санкт-Петербургский Политехнический университет Петра Великого) - 466 место; 0,171 петафлопса.

О проекте TOP500

Рейтинг TOP500 впервые был опубликован в июне 1993 года. Цель проекта — сравнение быстродействия самых мощных суперкомпьютеров в мире и демонстрация роста их производительности со временем. Участие в списке добровольное и требует исполнения теста Linpack, который определяет, насколько быстро компьютер может решать большие системы линейных уравнений. TOP500 составляется специалистами Манниверситета Теннессигеймского университета (Германия), Университета Теннесси (США) и Национальной лаборатории им. Лоуренса в Беркли (США).

Публикация подготовлена сотрудниками CompMechLab ® по материалам



До Марса человечество так и не долетело, лекарство от всех болезней еще не изобретено, автомобили не летают, но, тем не менее, существуют области, в которых люди достигли небывалых высот. Вычислительная мощность компьютеров – одна из таких. Для начала разберемся, что же является ключевым параметром при оценке этой характеристики суперкомпьютеров. Флопс – величина, показывающая число операций с плавающей запятой, которое ЭВМ может выполнить за секунду. На основании этого показателя и был составлен наш рейтинг самых мощных компьютеров в мире, по данным 2019 года.

Рейтинг был представлен на конференции International Supercomputing Conference, топ-500 суперкомпьютеров был составлен учеными-математиками Национальной лаборатории имени Лоуренса и Университета штата Теннесси.

10 Trinity – производительность 8,1 Пфлоп/сек

Этот суперкомпьютер стоит «на страже» военной безопасности США, поддерживая эффективность национального ядерного арсенала. Учитывая это, можно подумать, что стоит этот аппарат невероятно дорого, однако, начиная с 2015 года, его начали вытеснять новые более мощные суперкомпьютеры. Trinity работает на базе системы Cray XC40, производительность его составляет 8,1 Пфлоп/сек.

9 Mira – 8,6 Пфлоп/сек

Mira – еще один гениальный продукт компании Cray. Стоит отметить, что проект этого суперкомпьютера был разработан по заказу Министерства энергетики Соединенных Штатов. Главная область применения Mira – государственные промышленные и научно-исследовательские проекты. Вычислительная мощность этого компьютера составляет 8,6 петафлопс в секунду.

8 K Computer – 10,5 Пфлоп/сек

Особенность этого суперкомпьютера кроется в его названии, которое происходит от японского слова «кэй» и означает 10 квадриллионов. Примерно в эту цифру упирается производительная мощность K Computer – 10,5 петафлопс. Специфика этой техники заключается также в том, что система использует водяное охлаждение, что позволяет значительно снизить потребление энергии и снизить скорость компоновки.

7 Oakforest-Pacs – 13,6 Пфлоп/сек

Японская компания Fujitsu, которая также занималась разработкой K Computer, о котором упоминалось ранее, создала суперкомпьютер нового поколения (поколения Knights Landing). Проект был выполнен по заказу Токийского и Цукубского университетов. Несмотря на то, что изначально планировалось оснастить компьютер памятью в 900 Тбайт и производительностью в 25 квадриллионов операций, вычислительная мощность его составляет 13,6 петафлопс/c.

6 Cori – 14 Пфлоп/сек

До 2019 года Cori занимал твердую 5 позицию в мировом рейтинге самых мощных компьютеров, но в условиях быстро развивающегося технического прогресса он все же уступил одну рейтинговую «строчку» новейшим суперкомпьютерам. Находится он в Национальной лаборатории имени Лоуренса и Беркли, в США. Cori уже внес свой неповторимый вклад в развитие науки: с его помощью швейцарские ученые сумели смоделировать 45-кубитную квантовую вычислительную систему. 14 петафлопс – производительная мощность этой «супермашины».

5 Sequoia – 17,2 Петафлопс

Многие эксперты называют Sequoia самым быстрым суперкомпьютером в мире, и неспроста: арифметическая производительность его равна скорости работы 6,7 млрд. человек, которые в течение 320 лет выполняли бы идентичное задание при помощи калькуляторов. Отличается Sequoia и своими размерами: компьютер занимает площадь в 390 квадратных метров и состоит из 96 стоек. 17,2 петафлопс – его производительность, что равняется практически шестнадцати тысячам триллионов операций.

4 Titan – 17,6 Пфлоп/сек

Помимо того, что Titan входит в топ самых быстрых компьютеров в мире, он также считается одним из самых энергоэффективных, имея показатель 2142,77 мегафлопс на Ватт потребляемой энергии. Секрет экономии электроэнергии состоит в использовании ускорителей Nvidia, обеспечивающих до 90% всей вычислительной мощности, которая, к слову, составляет 17,6 петафлопс. Благодаря им же Titan заметно уменьшил свои габариты – сейчас для размещения ему достаточно всего 404 квадратных метра.

3 Piz Daint – 19,6 Петафлопс

Проект суперкомпьютера Piz Daint был запущен еще в 2013 году, в швейцарском городе Лугано. Располагается он там же – в Швейцарском национальном центре суперкомпьютеров. Piz Daint собрал почти все положительные характеристики вышеперечисленных аналогов, включая энергоэффективность и высокую скорость, кроме компактности: аппарат состоит из 28 крупногабаритных стоек. Его вычислительная мощь составляет 19,6 петафлопс.

2 Tianhe-2 – 33,9 Петафлопс

Суперкомпьютер с романтическим названием «Млечный путь» (в переводе с китайского) до июня 2016 года возглавлял топ-500 самых мощных компьютеров мира. Мощность его обеспечивает скорость 2507 триллионов операций в секунду, что равняется 33,9 петафлопс. Тяньхэ-2 нашел свое «призвание» в области строительства: при расчетах застроек и прокладки дорог. Стоит отметить, что с начала 2013 года, как только «Млечный путь» был выпущен, он не оставлял ведущую позицию рейтингов, что является по-настоящему мощным показателем.

1 Sunway TaihuLight – 93 Петафлопс

Внутри этого компьютера находятся 40 960 производительных процессоров, чем и объясняется его габаритность: сам Sunway занимает площадь около 1000 квадратных метров. В 2016 году на международной конференции в Германии он был признан самым быстрым в своем роде. На сегодняшний день Sunway TaihuLight является первым в рейтинге и единственным в топ-10 суперкомпьютеров, способным вырабатывать скорость в 93 петафлопс.




Если рассматривать технический прогресс в разрезе его влияния на человека, общество в целом и окружающую среду, очевидно, что он имеет глобальные недостатки. Сегодня нам доступно великое множество компьютеров, различных приборов и роботов. Но высшей целью является найти достойное применение великим изобретениям человечества и направить их использование во благо нашего общего будущего, не превращая их в бессмысленные игрушки.

Пятый раз подряд китайский Tianhe-2 (Млечный путь 2) становиться самым быстрым суперкомпьютером в мире с производительностью 33.86 петафлопс или квадриллион операций с плавающей запятой в секунду. Таков вердикт списка самых мощных суперкомпьютеров TOP500, который выпускается дважды в год.

Несмотря на ожидаемый результат, в последнем издании все же есть немного интересной информации. Соединенные Штаты по-прежнему имеют больше систем в списке, чем любая другая страна - 233 машины (для сравнения полгода назад было 231, а год назад 265). Второе и третье места занимают системы из США, в то время как 141 машина из списка, размещена в Европе. Примечательно, что три новых компьютера принадлежат китайской компании Lenovo, хотя сам Китай представлен всего 37 суперкомпьютерами, по сравнению с 61 в прошлом году.
Средняя производительность TOP500 значительно выросла за последние 6 месяцев. Суммарная мощность всех 500 суперкомпьютеров составила 363 петафлопс/c, что заметно больше, чем 309 в прошлом ноябре и 274 год назад. 98% систем используют процессоры с шестью ядрами и более, в то время как, по крайней мере, 88,2%, имеют 8 ядер на процессор. Восемьдесят восемь из пятисот систем использовали ускорители / сопроцессоры, среди которых Nvidia (52), ATI Radeon (4), и Intel Xeon Phi (33). Четыре системы используют комбинацию процессоров Xeon и Nvidia.
Топ-10 состоит из машин, запущенных в 2011 и 2012 году, за исключением нового участника из Саудовской Аравии под номером 7. Вот как выглядят список 10 наиболее мощных суперкомпьютеров мира.

  1. Tianhe-2: Кластер TH-IVB-FEP; Национальный суперкомпьютерный центр в Гуанчжоу, Китай; 3.12 миллиона ядер (33.86 Пфлопс/с).
  2. Titan: Система Cray XK7, Национальная лаборатория Оук-Ридж, США. 560 640 ядер (17.59 Пфлопс/с).
  3. Sequoia: Система IBM BlueGene/Q, Ливерморская национальная Лаборатория 1.57 миллиона ядер, (17.2 Пфлопс/с).
  4. K Computer: Система SPARC64 с 705 024 ядрами в RIKEN Институт передовой вычислительной науки в Институте физико-химических исследований (RIKEN), Япония. (10.5 Пфлопс/с).
  5. Mira: IBM BlueGene/Q; DOE/SC/ Аргоннская национальная лаборатория, США; 786 000 ядер IBM. (8.59 Пфлопс/с).
  6. Piz Daint: Cray XC30 с 116 000 ядер от Xeon и Nvidia; located at the Швейцарский национальный вычислительный центр. (6.27 Пфлопс/с).
  7. Shaheen II: Система Cray XC40. Университет науки и технологий Короля Абдуллы в Саудовской Аравии. (5.536 Пфлопс/с).
  8. Stampede: Система Dell PowerEdge C8220 с 462 462 ядрами Xeon Phi в Университете Техаса (5.17 Пфлопс/с).
  9. JUQUEEN: BlueGene/Q, 458 752 ядра IBM. Юлихский исследовательский центр, Германия. (5 Пфлопс/с).
  10. Vulcan: BlueGene/Q, 393 216 ядер IBM, Департамент Энергетики США.

Нужно помнить, что расклады могут резко измениться, если кто-то создаст настоящий квантовый компьютер. IBM пошли на рекорд, собираясь создать компьютер на 50 кубитов (с текущим максимумом в 4), который может стать мощнее, чем любая система в этом списке.
Тем временем Департамент Энергетики США заказал две системы IBM/Nvidia в сделке на $ 425 млн. Поставка машин запланирована на 2017 и 2018 год, а пиковая мощность может составить 150 петафлопс.


Суперкомпютер (англ. supercomput er, СуперЭВМ) вычислительная машина, значительно превосходящая по своим техническим параметрам большинство существующих компьютеров. Как правило, современные суперкомпьютеры представляют собой большое число высокопроизводительных серверных компьютеров, соединённых друг с другом локальной высокоскоростной магистралью для достижения максимальной производительности в рамках подхода распараллеливания вычислительной задачи.. Супер-ЭВМ в Мюнхенском техническом университете. Супер- ЭВМ второго поколения,находящийся в ВНИИЭФ


1. Максимальная арифметическая производительность процессора; 2. эффективность работы операционной системы и удобство общения с ней для программиста; 3. Эффективность трансляции с языков высокого уровня и исключение написания программ на автокоде; 4. Эффективность распараллеливания алгоритмов для параллельных архитектур; 5. Повышение надежности.


Параллельная обработка. Если некое устройство выполняет одну операцию за единицу времени, то тысячу операций оно выполнит за тысячу единиц. Если предположить, что есть пять таких же независимых устройств, способных работать одновременно, то ту же тысячу операций система из пяти устройств может выполнить уже не за тысячу, а за двести единиц времени. Конвейерная обработка. Целое множество мелких операций таких, как сравнение порядков, выравнивание порядков, сложение мантисс, нормализация и т.п. Процессоры первых компьютеров выполняли все эти "микрооперации" для каждой пары аргументов последовательно одна за одной до тех пор, пока не доходили до окончательного результата, и лишь после этого переходили к обработке следующей пары слагаемых. Все самые первые компьютеры (EDSAC, EDVAC, UNIVAC) имели разрядно- последовательную память, из которой слова считывались последовательно бит за битом. Иерархия памяти. Иерархия памяти прямого отношения к параллелизму не имеет, однако, безусловно, относится к тем особенностям архитектуры компьютеров, которые имеет огромное значение для повышения их производительности (сглаживание разницы между скоростью работы процессора и временем выборки из памяти). Основные уровни: регистры, кэш- память, оперативная память, дисковая память. Время выборки по уровням памяти от дисковой памяти к регистрам уменьшается, стоимость в пересчете на 1 слово (байт) растет. В настоящее время, подобная иерархия поддерживается даже на персональных компьютерах.


Наиболее распространёнными программными средствами суперкомпьютеров, также как и параллельных или распределённых компьютерных систем являются интерфейс программирования приложений (API) на основе MPI и PVM, и решения на базе открытого программного обеспечения, наподобие Beowulf и openMosix, позволяющего создавать виртуальные суперкомпьютеры даже на базе обыкновенных рабочих станций и персональных компьютеров. Для быстрого подключения новых вычислительных узлов в состав узкоспециализированных кластеров применяются технологии наподобие ZeroConf. Примером может служить реализация рендеринга в программном обеспечении Shake, распространяемом компанией Apple. Для объединения ресурсов компьютеров, выполняющих программу Shake, достаточно разместить их в общем сегменте локальной вычислительной сети. В настоящее время границы между суперкомпьютерным и общеупотребимым программным обеспечением сильно размыты и продолжают размываться ещё более вместе с проникновением технологий параллелизации и многоядерности в процессорные устройства персональных компьютеров и рабочих станций. Исключительно суперкомпьютерным программным обеспечением сегодня можно назвать лишь специализированные программные средства для управления и мониторинга конкретных типов компьютеров, а также уникальные программные среды, создаваемые в вычислительных центрах под «собственные», уникальные конфигурации суперкомпьютерных систем


К первому классу (последовательные компьютеры фон Неймана) принадлежат обычные скалярные однопроцессорные системы: одиночный поток команд - одиночный поток данных (SISD). Персональный компьютер имеет архитектуру SISD, причем не важно, используются ли в ПК конвейеры для ускорения выполнения операций. Второй класс характеризуется наличием одиночного потока команд, но множественного потока данных (SIMD). К этому архитектурному классу принадлежат однопроцессорные векторные или, точнее говоря, векторно-конвейерные суперкомпьютеры. Они также имеют векторные команды и реализуют векторную обработку, но не посредством конвейеров, как в векторных суперкомпьютерах, а с помощью матриц процессоров. К третьему классу - MIMD - относятся системы, имеющие множественный поток команд и множественный поток данных. К нему принадлежат не только многопроцессорные векторные суперЭВМ, но и вообще все многопроцессорные компьютеры. Подавляющее большинство современных суперЭВМ имеют архитектуру MIMD. Четвертый класс в систематике Флинна, MISD, не представляет практического интереса. В последнее время в литературе часто используется также термин SPMD (одна программа - множественные данные). Он относится не к архитектуре компьютеров, а к модели распараллеливания программ и не является расширением систематики Флинна. SPMD обычно относится к MPP (т.е. MIMD) - системам и означает, что несколько копий одной программы.

Супер-ЭВМ это достаточно гибкий и очень широкий термин. В общем понимании супер-ЭВМ это компьютер значительно мощнее всех имеющихся доступных на рынке компьютеров. Некоторые инженеры, шутливо, называют суперкомпьютером любой компьютер масса которого превосходит одну тонну. И хотя большинство современных супер-ЭВМ действительно весят более тонны. Не всякую ЭВМ можно назвать «супер», даже если она весит более тонны. Марк-1, Эниак – тоже тяжеловесы, но суперкомпьютерами не считаются даже для своего времени.

Скорость технического прогресса настолько велика, что сегодняшняя супер-ЭВМ через 5 -10 лет будет уступать домашнему компьютеру. Термин супервычисления появился еще 20-х годах прошлого века, а термин супер-ЭВМ в 60-х годах. Но получил широкое распространение во многом благодоря Сеймура Крея и его супер-ЭВМ Cray-1, Cray-2. Хотя сам Сеймур Крей не предпочитает использовать данный термин. Называет свои машины, просто компьютер.

В 1972 году С.Крэй покидает CDC и основывает свою компанию Cray Research, которая в 1976г. выпускает первый векторно-конвейерный компьютер CRAY-1 : время такта 12.5нс, 12 конвейерных функциональных устройств, пиковая производительность 160 миллионов операций в секунду, оперативная память до 1Мслова (слово - 64 разряда), цикл памяти 50нс. Главным новшеством является введение векторных команд, работающих с целыми массивами независимых данных и позволяющих эффективно использовать конвейерные функциональные устройства.

Cray-1 принято считать одним из первых супер-ЭВМ. В процессорах компьютера был огромный, по тем временам, набор регистров. Которые разделялись на группы. Каждая группа имело свое собственное функциональное назначение. Блок адресных регистров который отвечал за адресацию в памяти ЭВМ. Блок векторных регистров, блок скалярных регистров.

Сборка компьютера Cray-1

Компьютер Cray-2

Первый советский супер-ЭВМ

В самом начале появления супер-ЭВМ было связано с потребностью быстрой обработки больших массивов данных и сложных математически - аналитических вычислениях. Поэтому первые суперкомпьютеры по своей архитектуре мало отличались от обычных ЭВМ. Только их мощность была во много раз больше стандартных рабочих станций. Изначально супер-ЭВМ оснащались векторными процессорами, обычные скалярными. К 80-м перешли на параллельную работу нескольких векторных процессоров. Но данный путь развития оказался не рациональным. Супер-ЭВМ перешли на параллельно работающие скалярные процессоры.

Массивно-параллельные процессоры стали базой для супер-ЭВМ. Тысячи процессорных элементов объединялись создавая мощную платформу для вычислений. Большинство параллельно работающих процессоров создавались на основе архитектуры RISC. RISC (Reduced Instruction Set Computing) – вычисления с сокращенным набором команд. Под этим термином производители процессоров понимают концепцию, где более простые инструкции выполняться быстрее. Данный метод позволяет снизить себестоимость производства процессоров. Одновременно увеличить их производительность.

Потребность в мощных вычислительных решениях быстро возрастала. Супер-ЭВМ слишком дорогие. Требовалась альтернатива. И на смену им пришли кластеры. Но и на сегодняшний день мощные компьютеры называют суперкомпьютерами. Кластер это множество серверов объеденных в сеть и работают над одной задачей. Эта группа серверов обладает высокой производительностью. Во много раз больше чем то же самое количество серверов которые работали бы отдельно. Кластер дает высокую надежность. Выход из строя одного сервера не приведет к аварийной остановке всей системы, а лишь не много отразиться на ее производительности. Возможно произвести замену сервера в кластере без остановки всей системы. Не нужно сразу выкладывать огромные суммы за супер-ЭВМ. Кластер можно наращивать постепенно, что значительно амортизирует затраты предприятия.

Университетский кластер

Цели Супер-ЭВМ

1.Максимальная арифметическая производительность процессора;

2.эффективность работы операционной системы и удобство общения с ней для программиста;

3.Эффективность трансляции с языков высокого уровня и исключение написания программ на автокоде;

4.Эффективность распараллеливания алгоритмов для параллельных архитектур;

5.Повышение надежости.

Архитектура современных Супер-ЭВМ

Архитектура ЭВМ охватывает значительный круг проблем, связанных с созданием комплекса аппаратных и программных средств и учитывающих большое количество определяющих факторов. Среди этих факторов основными являются: стоимость, сфера применения, функциональные возможности, удобство в эксплуатации, а одним из основных компонентов архитектуры считаются аппаратные средства.Архитектура ЭВМ включает в себя как структуру, отражающую состав ПК, так и программно – математическое обеспечение. Структура ЭВМ - совокупность элементов и связей между ними. Основным принципом построения всех современных ЭВМ является программное управление.

Все компьютеры делятся на четыре класса в зависимости от числа потоков команд и данных.

К первому классу (последовательные компьютеры фон Неймана) принадлежат обычные скалярные однопроцессорные системы: одиночный поток команд - одиночный поток данных (SISD). Персональный компьютер имеет архитектуру SISD, причем не важно, используются ли в ПК конвейеры для ускорения выполнения операций.

Второй класс характеризуется наличием одиночного потока команд, но множественного nomoka данных (SIMD). К этому архитектурному классу принадлежат однопроцессорные векторные или, точнее говоря, векторно-конвейерные суперкомпьютеры, например, Cray-1 . В этом случае мы имеем дело с одним потоком (векторных) команд, а потоков данных - много: каждый элемент вектора входит в отдельный поток данных. К этому же классу вычислительных систем относятся матричные процессоры, например, знаменитый в свое время ILLIAC-IV. Они также имеют векторные команды и реализуют векторную обработку, но не посредством конвейеров, как в векторных суперкомпьютерах, а с помощью матриц процессоров.

К третьему классу - MIMD - относятся системы, имеющие множественный поток команд и множественный поток данных. К нему принадлежат не только многопроцессорные векторные суперЭВМ, но и вообще все многопроцессорные компьютеры. Подавляющее большинство современных суперЭВМ имеют архитектуру MIMD.

Четвертый класс в систематике Флинна, MISD, не представляет практического интереса,по крайней мере для анализируемых нами компьютеров. В последнее время в литературе часто используется также термин SPMD (одна программа - множественные данные). Он относится не к архитектуре компьютеров, а к модели распараллеливания программ и не является расширением систематики Флинна. SPMD обычно относится к MPP (т.е. MIMD) - системам и означает, что несколько копий одной программы.

Задачи супер-ЭВМ

В самом начале появления супер-ЭВМ было связано с потребностью быстрой обработки больших массивов данных и сложных математически - аналитических вычислениях. ЭВМ - машины для крупно-маштабных задач.

1.Для решения сложных и больших научных задач, в управлении, разведке

2.Новейшее архитектурные разработки с использованием современной элементарной базы и арифметических ускорителей

3.Проектирование и имитационное моделирование

4.Повышение производительности

5. Централизованное хранилище информции

6.Оценка сложности решаемых на практике задач

Супер-ЭВМ в Мюнхенском техническом университете

Супер-ЭВМ второго поколения,находящийся в ВНИИЭФ

Харакеристики производительности Супер-ЭВМ

За полвека производительность компьютеров выросла более, чем в семьсот миллионов раз. При этом выигрыш в быстродействии, связанный с уменьшением времени такта с 2 микросекунд до 1.8 наносекунд, составляет лишь около 1000 раз.Использование новых решений в архитектуре компьютеров. Основное место среди них занимает принцип параллельной обработки данных, воплощающий идею одновременного (параллельного) выполнения нескольких действий. Параллельная обработка данных, воплощая идею одновременного выполнения нескольких действий, имеет две разновидности: конвейерность и собственно параллельность.Параллельная обработка данных, воплощая идею одновременного выполнения нескольких действий, имеет две разновидности: конвейерность и собственно параллельность.

Параллельная обработка. Если некое устройство выполняет одну операцию за единицу времени, то тысячу операций оно выполнит за тысячу единиц. Если предположить, что есть пять таких же независимых устройств, способных работать одновременно, то ту же тысячу операций система из пяти устройств может выполнить уже не за тысячу, а за двести единиц времени. Аналогично система из N устройств ту же работу выполнит за 1000/N единиц времени. Подобные аналогии можно найти и в жизни: если один солдат вскопает огород за 10 часов, то рота солдат из пятидесяти человек с такими же способностями, работая одновременно, справятся с той же работой за 12 минут - принцип параллельности в действии!

Конвейерная обработка Целое множество мелких операций таких, как сравнение порядков, выравнивание порядков, сложение мантисс, нормализация и т.п. Процессоры первых компьютеров выполняли все эти "микрооперации" для каждой пары аргументов последовательно одна за одной до тех пор, пока не доходили до окончательного результата, и лишь после этого переходили к обработке следующей пары слагаемых.

Все самые первые компьютеры (EDSAC, EDVAC, UNIVAC) имели разрядно-последовательную память, из которой слова считывались последовательно бит за битом. Первым коммерчески доступным компьютером, использующим разрядно-параллельную память (на CRT) и разрядно-параллельную арифметику, стал IBM 701, а наибольшую популярность получила модель IBM 704 (продано 150 экз.), в которой, помимо сказанного, была впервые применена память на ферритовых сердечниках и аппаратное АУ с плавающей точкой. Иерархия памяти. Иерархия памяти пямого отношения к параллелизму не имеет, однако, безусловно, относится к тем особенностям архитектуры компьютеров, которые имеет огромное значение для повышения их производительности (сглаживание разницы между скоростью работы процессора и временем выборки из памяти). Основные уровни: регистры, кэш-память, оперативная память, дисковая память. Время выборки по уровням памяти от дисковой памяти к регистрам уменьшается, стоимость в пересчете на 1 слово (байт) растет. В настоящее время, подобная иерархия поддерживается даже на персональных компьютерах.

В настоящее время исрльзуются:

1. Векторно-конвейерные компьютеры. Конвейерные функциональные устройства и набор векторных команд

2. Массивно-параллельные компьютеры с распределенной памятью.

3. Параллельные компьютеры с общей памятью. Вся оперативная память таких компьютеров разделяется несколькими одинаковыми процессорами

4.Использование параллельных вычислительных систем

Список самых мощных компьютеров в мире

Организация, где установлен компьютер Тип компьютера Количество вычислительных ядер Максимальная производительность Электропотребление
Jaguar - Cray XT5-HE Opteron Six Core 2.6 GHz / 2009 224162 1759.00 6950.60
National Supercomputing Centre in Shenzhen (NSCS) Nebulae - Dawning TC3600 Blade, Intel X5650, NVidia Tesla C2050 GPU / 2010 120640 1271.00 2984.30
DOE/NNSA/LANL Roadrunner - BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz, Voltaire Infiniband / 2009 122400 1042.00 2345.50
National Institute for Computational Sciences/University of Tennessee Kraken XT5 - Cray XT5-HE Opteron Six Core 2.6 GHz / 2009 98928 831.70 2569
JUGENE - Blue Gene/P Solution / 2009 294912 825.50 2268.00
National SuperComputer Center in Tianjin/NUDT Tianhe-1 - NUDT TH-1 Cluster, Xeon E5540/E5450, ATI Radeon HD 4870 2, Infiniband / 2009 71680 563.10 2578
DOE/NNSA/LLNL BlueGene/L - eServer Blue Gene Solution / 2007 212992 478.20 2329.60
Argonne National Laboratory Intrepid - Blue Gene/P Solution / 2007 163840 458.61 1260
Sandia National Laboratories / National Renewable Energy Laboratory Red Sky - Sun Blade x6275, Xeon X55xx 2.93 Ghz, Infiniband / 2010

Sun Microsystems

42440 433.50 1254
Texas Advanced Computing Center/Univ. of Texas Ranger - SunBlade x6420, Opteron QC 2.3 Ghz, Infiniband / 2008

Sun Microsystems

62976 433.20 2000.00
DOE/NNSA/LLNL Dawn - Blue Gene/P Solution / 2009 147456 415.70 1134
Moscow State University - Research Computing Center Russia Lomonosov - T-Platforms T-Blade2, Xeon 5570 2.93 GHz, Infiniband QDR / 2009 T-Platforms 35360 350.10 1127
Forschungszentrum Juelich (FZJ) JUROPA - Sun Constellation, NovaScale R422-E2, Intel Xeon X5570, 2.93 GHz, Sun M9/Mellanox QDR Infiniband/Partec Parastation / 2009 26304 274.80 1549.00
KISTI Supercomputing Center TachyonII - Sun Blade x6048, X6275, IB QDR M9 switch, Sun HPC stack Linux edition / 2009

Sun Microsystems

26232 274.20 307.80
University of Edinburgh HECToR - Cray XT6m 12-Core 2.1 GHz / 2010 43660 274.70 1189.80
NERSC/LBNL Franklin - Cray XT4 QuadCore 2.3 GHz / 2008 38642 266.30 1150.00
Grand Equipement National de Calcul Intensif - Centre Informatique National de l"Enseignement Supц╘rieur (GENCI-CINES) Jade - SGI Altix ICE 8200EX, Xeon E5472 3.0/X5560 2.8 GHz / 2010 23040 237.80 1064.00
Institute of Process Engineering, Chinese Academy of Sciences Mole-8.5 - Mole-8.5 Cluster Xeon L5520 2.26 Ghz, nVidia Tesla, Infiniband / 2010

IPE, nVidia Tesla C2050, Tyan

33120 207.30 1138.44
Oak Ridge National Laboratory Jaguar - Cray XT4 QuadCore 2.1 GHz / 2008 30976 205.00 1580.71}