FLOPS

FLOPS (англ. Floating Point Operations Per Second — «операцій з рухомою комою на секунду») — одиниця вимірювання швидкодії обчислювальних приладів, особливо в галузі наукових обчислень.

Обчислювальні прилади мають широкий діапазон швидкодії, тому використовуються одиниці більші ніж просто FLOPS. Для цього можуть використовуватись стандартні префікси системи SI, що приводить до появи таких одиниць, як мегафлопс (англ. megaFLOPS, MFLOPS, 10⁶FLOPS), гігафлопс (англ. gigaFLOPS, GFLOPS, 10⁹ FLOPS), терафлопс (англ. TFLOPS, 10¹² FLOPS), петафлопс (англ. petaFLOPS, PFLOPS, 10¹⁵ FLOPS) та ексафлопс (англ. exaFLOPS, EFLOPS, 10¹⁸ FLOPS).

Флопс як міра продуктивності

Як і більшість інших показників продуктивності, дана величина визначається шляхом запуску на комп'ютері тестової програми, яка вирішує задачу з відомою кількістю операцій та підраховує час, за який вона була вирішена. Найпопулярнішим тестом продуктивності на сьогоднішній день є програма LINPACK, яка використовується, в тому числі, при складанні рейтингу суперкомп'ютерів TOP500 [Архівовано 21 січня 2005 у Wayback Machine.].

Одним з найважливіших плюсів показника флопс є те, що він до деяких меж може бути витлумачений як абсолютна величина і вирахуваний теоретично, в той час як більшість інших популярних мір є відносними і дозволяють оцінити систему тільки в порівнянні з рядом подібних. Ця особливість дає можливість використати для оцінки результати роботи різноманітних алгоритмів, а також оцінити продуктивність обчислювальних систем, які ще не існують або знаходяться в розробці.

Межі застосування

Попри начебто однозначність, у реальності FLOPS є досить поганою мірою продуктивності, оскільки неоднозначне вже саме його визначення. Під «операцією з рухомою комою» можна розуміти різні поняття, не кажучи вже про те, що істотну роль в обчисленнях відіграє розрядність операндів, яка ніде не згадується.

Крім того, величина флопс підлягає впливу дуже багатьох факторів, безпосередньо не пов'язаних із продуктивністю обчислювального модуля, таких як: пропускна здатність каналів зв'язку з оточенням процесора, продуктивність основної пам'яті та синхронність роботи кеш-пам'яті різних рівнів.

Все це, в кінцевому підсумку, призводить до того, що результати, отримані на одному й тому ж комп'ютері за допомогою різних програм, можуть суттєво відрізнятися, більш того, з кожним новим випробуванням різні результати можна отримати при використанні одного алгоритму. Частково ця проблема вирішується договором про використання одноманітних тестових програм (тієї ж LINPACK benchmarks) з виведенням середніх результатів, але з часом можливості комп'ютерів «переростають» межі прийнятого тесту й він починає давати штучно занижені результати, оскільки не використовує нові можливості ЕОМ. А до деяких систем загальноприйняті тести зовсім не можуть бути застосовані, в результаті чого питання про їх продуктивність залишається відкритим.

Наприклад, 24 червня 2006 року громадськості представили суперкомп'ютер MDGrape-3, розроблений в японському науково-дослідному інституті RIKEN (Йокогама), із рекордною теоретичною продуктивністю в 1 Пфлопс. Однак цей комп'ютер не є комп'ютером загального призначення, він призначений для вирішення вузького спектру конкретних задач, і стандартний тест LINPACK на ньому виконати неможливо через особливості його архітектури.

Також високу продуктивність на специфічних задачах показують графічні процесори сучасних відеокарт та ігрових приставок. Наприклад, заявлена продуктивність ігрової приставки Xbox 360 становить 1 Тфлопс, а приставки PlayStation 3 і зовсім 2 Тфлопс^{[джерело?]}, що ставить їх поряд із суперкомп'ютерами початкового рівня. Такі високі показники пояснюються тим, що вони оперують 32-бітними числами, тоді як для суперкомп'ютерів зазвичай вказують продуктивність на 64-розрядних даних. Крім того, ці приставки й відео-процесори розраховані на операції з трьохвимірною графікою, які добре піддаються розпаралелюванню, однак їх процесори не в змозі виконувати більшість задач загального призначення, їх продуктивність складно оцінити класичним тестом LINPACK і складно порівняти з іншими системами.

Причини широкого розповсюдження

Незважаючи на велику кількість суттєвих недоліків, показник флопс продовжує з успіхом використовуватися для оцінки продуктивності, базуючись на результатах тесту LINPACK. Причини такої популярності обумовлені, по-перше, тим, що флопс, як говорилось вище, є абсолютною величиною. А по-друге, дуже багато задач інженерної та наукової практики в кінцевому підсумку зводяться до вирішення систем лінійних алгебраїчних рівнянь, а тест LINPACK якраз і базується на вимірюванні швидкості вирішення таких систем. Крім того, більшість комп'ютерів (включаючи суперкомп'ютери) побудовані за класичною архітектурою з використанням стандартних процесорів, що дозволяє використовувати загальноприйняті тести з великою достовірністю.

Для підрахунку максимальної кількості FLOPS для процесора треба враховувати, що сучасні процесори в кожному своєму ядрі містять декілька виконавчих блоків кожного типу (в тому числі і для операцій з рухомою комою), які працюють паралельно, і можуть виконувати більше однієї інструкції за такт. Ця особливість архітектури називається суперскалярністю і вперше з'явилась ще в самому першому процесорі Pentium в 1993 році. Ядро Intel Core 2 також є суперскалярним і містить 2 пристрої обчислень над 64-бітними числами з рухомою комою, які можуть завершувати по 2 послідовні операції (множення і наступне додавання, MAC) в кожному такті, що теоретично дозволяє досягти пікової продуктивності до 4-х операцій за 1 такт в кожному ядрі — мікроархитектура Core 2. Таким чином, для процесора, що має в своєму складі 4 ядра (Core 2 Quad) і працює на частоті 3.5 ГГц, теоретична межа продуктивності становить 4х4х3.5=56 гігафлопс, а для процесора, що має 2 ядра (Core 2 Duo) і працює на частоті 3 ГГц — 2х4х3=24 гігафлопс, що добре погоджується з практичними результатами, отриманими на тесті LINPACK. Типова продуктивність тесту LINPACK становить 80-95% від теоретичного максимуму.

Суперкомп'ютери

Докладніше: ТОП500 та Суперкомп'ютер

Комп'ютер ENIAC, збудований в 1946 році, при масі 27 т і енергоспоживанні 150 кВт, забезпечував продуктивність в 300 флопс
IBM 709 (1957) — 5 Кфлопс
БЭСМ-6 (1968) — 1 Мфлопс (операцій ділення)
Cray-1 (1974) — 160 Мфлопс
БЭСМ-6 на базі Эльбрус-1К2 (1980-х) — 6 Мфлопс (операцій ділення)
Ельбрус-2 (1984) — 125 Мфлопс
Cray Y-MP (1988) — 2,3 Гфлопс
Електроніка СС БІС (1991) — 500 Мфлопс
ASCI Red (1993) — 1 Тфлопс
Blue Gene/L (2006) — 478,2 Тфлопс
Jaguar (суперкомп'ютер) (2008) — 1,059 Пфлопс
IBM Roadrunner (2008) — 1,042 Пфлопс
Jaguar Cray XT5-HE (2009) — 1,759 Пфлопс
IBM Sequoia (2012) — 20 Пфлопс
Summit (2018) — 200 Пфлопс
Fugaku (суперкомп'ютер) (2020) — 442 Пфлопс

Персональні комп'ютери

IBM PC/XT 4,77 МГц (1983) — 6,9 Кфлопс
Intel 80386 40 МГц (1985) — 0,6 Мфлопс
Pentium 75 МГц (1993) — 7,5 Мфлопс
Intel Pentium II 300 МГц (1997) — 50 Мфлопс
Intel Pentium III 600 МГц (1999) — 625 Мфлопс
Intel Pentium III 1 ГГц (1999) — 2 Гфлопс?
AMD Athlon XP1800+ 1533 МГц (2002) — 3 Гфлопс
AMD Athlon 64 2,211 ГГц (2003) — 8 Гфлопс
AMD Athlon 64 X2 4200 2,2 ГГц (2006) — 13.2 Гфлопс
Intel Core 2 Duo 2,4 ГГц (2006) — 19,2 Гфлопс

Більше 50 Гфлопс

Intel Core i7-975 XE 3,33 ГГц (2009) — 53.28 Гфлопс
AMD Phenom II X4 965 BE 3,4 ГГц, 4 ядра (2009) — 54,4 Гфлопс
AMD Phenom II X6 1100T 3,3 ГГц , 6 ядер (2010) — 79,2 Гфлопс
Intel Core i5-2500K (Sandy Bridge), частоти 3,3-3,7 ГГц (2011) — 105,6-118 Гфлопс^[1]
FX-8350 4,0 ГГц, 8 ядер (2012) — 69,13 Гфлопс FP64^[2]
Intel Core i7-4930K (Ivy Bridge), частоти 3,4-3,9 ГГц, 6 ядер (2013) — 151 - 173 Гфлопс FP64 ^[3]
Loongson-3B1500 (MIPS64), 1,5 ГГц, 8 ядер (2016) — до 192 Гфлопс.^[4]
IBM Power8 4.4 ГГц, 12 ядер, (2013), 290 ГФлопс.
Intel Core i7-5960X (Extreme Edition Haswell-E), частоти 3,0-3,5 ГГц (2014) — до 350 Гфлопс ^[5]

Кишенькові комп'ютери

КПК на основі процесора Samsung S3C2440 400 МГц (архитектура ARM9) — 1,3 Мфлопс
Intel XScale PXA270 520 МГц — 1,6 Мфлопс
Intel XScale PXA270 624 МГц — 2 Мфлопс

Примітка: Наведені процесори не мають апаратної підтримки обчислень з рухомою комою. Сучасніші процесори цього класу (I.MX31, OMAP-Lx) з апаратним FPU мають на 2 порядки більшу продуктивність.

Розподілені системи

Дані наведені станом на 4 квітня 2020 року

Folding@home — понад 1,5 Ефлопс
BOINC — понад 20 Пфлопс
SETI@home — понад 700 Тфлопс
Einstein@Home — понад 492 Тфлопс
Rosetta@home — понад 90 Тфлопс

Ігрові приставки

Вказані операції з рухомою комою над 32-розрядними даними

Sega Dreamcast — 1,4 Гфлопс
Microsoft Xbox — 6,3 Гфлопс
Sony PlayStation 2 — 6,2 Гфлопс
Sony PlayStation Portable — 2,6 Гфлопс
Nintendo Gamecube — 10,5 Гфлопс
Microsoft Xbox 360 — 116 Гфлопс
Sony PlayStation 3 — 218 Гфлопс

Див. також

Примітки

↑ [1] [Архівовано 3 грудня 2013 у Wayback Machine.] http://www.intel.com/support/processors/sb/CS-032815.htm [Архівовано 3 грудня 2015 у Wayback Machine.]
↑ Flops/2012 - AMD FX-8350.txt at master · Mysticial/Flops · GitHub
↑ Архівована копія. Архів оригіналу за 7 червня 2020. Процитовано 26 червня 2020.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання)
↑ Alex Voica (3 вересня 2015). New MIPS64-based Loongson processors break performance barrier (англ.). Архів оригіналу за 5 лютого 2017. Процитовано 4 лютого 2017. [Архівовано 2017-02-05 у Wayback Machine.]
↑ Linpack performance Haswell E (Core i7 5960X and 5930K) — Puget Custom Computers. Архів оригіналу за 27 березня 2015. Процитовано 22 травня 2019.

Посилання

TOP500 [Архівовано 21 січня 2005 у Wayback Machine.] Рейтинг суперкомп'ютерів TOP500 (англ.)
The Performance Database Server [Архівовано 31 жовтня 2010 у Wayback Machine.] Велика база даних продуктивності обчислювальних систем (англ.)
Roy Longbottom’s PC Benchmark Collection Підбірка тестових програм для ПК (включаючи LINPACK) і результатів випробувань (англ.)
Linpack CPU Benchmark for Pocket PC [Архівовано 23 липня 2010 у Wayback Machine.] Версія LINPACK для КПК (англ.)
Історія суперкомп'ютерів (англ. яз; pdf) [Архівовано 18 березня 2011 у Wayback Machine.]
FLOPS — сторінка на англомовній вікіпедії.

Це незавершена стаття про апаратне забезпечення.
Ви можете допомогти проєкту, виправивши або дописавши її.

Це незавершена стаття про програмування.
Ви можете допомогти проєкту, виправивши або дописавши її.

Портал «Інформаційні технології» Портал «Програмування»

[1] [1] [Архівовано 3 грудня 2013 у Wayback Machine.] http://www.intel.com/support/processors/sb/CS-032815.htm [Архівовано 3 грудня 2015 у Wayback Machine.]

[2] Flops/2012 - AMD FX-8350.txt at master · Mysticial/Flops · GitHub

[3] Архівована копія. Архів оригіналу за 7 червня 2020. Процитовано 26 червня 2020.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання)

[4] Alex Voica (3 вересня 2015). New MIPS64-based Loongson processors break performance barrier (англ.). Архів оригіналу за 5 лютого 2017. Процитовано 4 лютого 2017. [Архівовано 2017-02-05 у Wayback Machine.]

[5] Linpack performance Haswell E (Core i7 5960X and 5930K) — Puget Custom Computers. Архів оригіналу за 27 березня 2015. Процитовано 22 травня 2019.

[1]

[2]

[3]

[4]

[5]