tNavigator на рабочих станциях

Для повышения эффективности вычислений на рабочих станциях в tNavigator были реализованы следующие решения, ранее не используемые в области гидродинамических вычислений:

  • Распараллелены все входящие в расчет элементы: решение системы линейных уравнений, заполнение матрицы, уравнения  для скважин, и т.д.
  • Внутри каждого процессора процесс обмена данными между расчетными ядрами идет напрямую через системные потоки исполнения - Threads (Ускорение ~30-40%).
  • Поддержана технология неоднородного доступа к памяти многопроцессорных компьютеров – NUMA (Ускорение ~50%).
  • Поддержана технологи оптимизации конвейерной загрузки многоядерного процессора - Hyperthreading (Ускорение ~15%).
  • Поддержано использование CPU+GPU. Ускорение расчета решения систем линейных уравнений на графических ускорителях Nvidia. Поддерживаются только GPU с Pascal архитектурой и последние драйверы CUDA (Ускорение расчета с помощью GPU зависят от специфики модели, соотношения вычислительной мощности CPU и GPU).

Базовый алгоритм распараллеливания расчета в tNavigator, предназначенный для многоядерных рабочих станций, построен на использовании потоков исполнения, что является оптимальным при разделении задач между несколькими ядрами одного процессора. Данный алгоритм позволяет нам достигать практически линейного ускорения расчета на современных многоядерных рабочих станциях.

В настоящий момент наблюдается продолжение роста эффективности персональных рабочих станций за счет увеличения количества расчетных ядер. Таким образом, на столе каждого современного инженера может быть оборудовано рабочее место сопоставимое по возможностям с суперкомпьютером.

Примеры ускорения на следующих рабочих станциях:

2011: Dual Xeon X5650, (2x6) 12 cores, 2.66GHz, 3 channels DDR3 1333 MHz (e.g. HP Z800)

2012: Dual Xeon E2680, (2x8) 16 cores, 2.7GHz, 4 channels DDR3 1600 MHz (e.g. HP Z820)

2013: Dual Xeon E2697v2, (2x12) 24 cores, 2.7GHz, 4 channels DDR3 1866 MHz (e.g. HP Z820)

2014: Dual Xeon E2697v3, (2x12) 28 cores, 2.6GHz, 4 channels DDR4 2133 MHz (e.g. HP Z840)

2016: Dual Xeon E2699v4, (2x22) 44 cores, 2.2GHz, 4 channels DDR4 2400 MHz (e.g. HP Z840)

workstations