Сертификат "Программирование на современных мультиядерных архитектурах (на примере Intel Xeon Phi))"
  • Сертификат "Программирование на современных мультиядерных архитектурах (на примере Intel Xeon Phi))"
  • Сертификат "Программирование на современных мультиядерных архитектурах (на примере Intel Xeon Phi))"
Сертификат "Программирование на современных мультиядерных архитектурах (на примере Intel Xeon Phi))"
  • Сертификат "Программирование на современных мультиядерных архитектурах (на примере Intel Xeon Phi))"
  • Сертификат "Программирование на современных мультиядерных архитектурах (на примере Intel Xeon Phi))"

Программирование на современных мультиядерных архитектурах (на примере Intel Xeon Phi))

700,00 руб.
В течение часа!
Экзамен "Программирование на современных мультиядерных архитектурах (на примере Intel Xeon Phi))" для пользователей и системных администраторов.
Количество
Есть в наличии!

Форма сдачи теста: Экстерн
Количество вопросов: 30
Проходной балл: 90% и выше
Срок действия сертификата: неограничен

Сертификат появляется в профиле ресурса INTUIT, и Вы можете заказать его бумажную версию на сайте INTUIT.
11723 шт.
Внимание !
Вопросы к тесту выложены исключительно в ознакомительных целях: количество вопросов может не совпадать с действительным, актуальность не поддерживается,- за решением теста Welcome to the cashier!

Какой режим работы библиотеки Intel MKL наиболее подходит для обеспечения автоматического запуска функций библиотеки на сопроцессоре и требует минимальной модификации кода (при этом основной код программы работает на CPU):

Native Execution
Automatic Offload, AO
Compiler Assisted Offload, CAO


Какие режимы исполнения поддерживает библиотка Intel MKL:

исполнение на многоядерных центральных процессорах, на Intel Xeon Phi в режиме работы только на сопроцессоре и в режиме offload
исполнение только на многоядерных центральных процессорах
исполнение как на многоядерных центральных процессорах, так и на Intel Xeon Phi в режиме работы только на сопроцессоре


Какие режимы исполнения поддерживает библиотека Intel MKL:

исполнение только на многоядерных центральных процессорах
исполнение как на многоядерных центральных процессорах, так и на Intel Xeon Phi в режиме работы только на сопроцессоре
исполнение на многоядерных центральных процессорах, на Intel Xeon Phi в режиме работы только на сопроцессоре и в режиме offload


Какой режим работы библиотеки Intel MKL позволяет использовать ее функции при выполнении кода на сопроцессоре (CPU не используется, основная программа работает на сопроцессоре):

Compiler Assisted Offload, CAO
Native Execution
Automatic Offload, AO


Какой режим работы библиотеки Intel MKL позволяет использовать ее функции при выполнении кода на сопроцессоре (CPU не используется, основная программа работает на сопроцессоре):

Native Execution
Automatic Offload, AO
Compiler Assisted Offload, CAO


Библиотека Intel MKL не содержит функционал из следующих областей:

быстрое преобразование Фурье
решение дифференциальных уравнений
методы компьютерного зрения
линейная алгебра


Библиотека Intel MKL содержит функционал из следующих областей:

быстрое преобразование Фурье
решение дифференциальных уравнений
линейная алгебра
методы компьютерного зрения


Какой режим работы библиотеки Intel MKL дает максимальные возможности управления передачей данных при запуске функций библиотеки на сопроцессоре (при этом основной код программы работает на CPU):

Native Execution
Automatic Offload, AO
Compiler Assisted Offload, CAO


Какой из предложенных ниже типов анализа инструмента Intel VTune Amplifier XE показывает эффективность использования ядер процессора во время выполнения программы и демонстрирует качество распараллеливания кода и участки, которые следует распараллелить?

Concurrency
Hotspots
Locks and Waits


Какой из предложенных ниже типов анализа инструмента Intel VTune Amplifier XE предназначен для выявления «узких мест» в программе и помогает определять, какие функции или участки программы работают дольше всего?

Concurrency
Hotspots
Locks and Waits


Какой из предложенных ниже типов анализа инструмента Intel VTune Amplifier XE показывает точки блокировки и время ожидания потоков и предназначен для оценки эффективности используемой схемы синхронизации?

Concurrency
Hotspots
Locks and Waits


Выберите описание, соответствующее типу анализа "Hotspots" инструмента Intel VTune Amplifier XE:

предназначен для выявления «узких мест» в программе. Определяет, какие функции или участки программы работают дольше всего. В основном используется на первом этапе оптимизации для выявления областей кода, требующих ускорения
показывает эффективность использования ядер процессора во время выполнения программы. Демонстрирует качество распараллеливания кода и участки, которые следует распараллелить
показывает точки блокировки и время ожидания потоков. Предназначен для оценки эффективности используемой схемы синхронизации


Выберите описание, соответствующее типу анализа "Locks and Waits" инструмента Intel VTune Amplifier XE:

показывает точки блокировки и время ожидания потоков. Предназначен для оценки эффективности используемой схемы синхронизации
показывает эффективность использования ядер процессора во время выполнения программы. Демонстрирует качество распараллеливания кода и участки, которые следует распараллелить
предназначен для выявления «узких мест» в программе. Определяет, какие функции или участки программы работают дольше всего. В основном используется на первом этапе оптимизации для выявления областей кода, требующих ускорения



Выберите описание, соответствующее типу анализа "Concurrency" инструмента Intel VTune Amplifier XE:

показывает точки блокировки и время ожидания потоков. Предназначен для оценки эффективности используемой схемы синхронизации
показывает эффективность использования ядер процессора во время выполнения программы. Демонстрирует качество распараллеливания кода и участки, которые следует распараллелить
предназначен для выявления «узких мест» в программе. Определяет, какие функции или участки программы работают дольше всего. В основном используется на первом этапе оптимизации для выявления областей кода, требующих ускорения


Какой из предложенных ниже типов анализа инструмента Intel VTune Amplifier XE для сопроцессора Intel Xeon Phi предназначен для анализа пропускной способности памяти?

Lightweight Hotspots
General Exploration
Bandwidth


Какой из предложенных ниже типов анализа инструмента Intel VTune Amplifier XE для сопроцессора Intel Xeon Phi позволяет выявить микроархитектурные особенности, отрицательно влияющие на производительность?

Lightweight Hotspots
Bandwidth
General Exploration


Какой из предложенных ниже типов анализа инструмента Intel VTune Amplifier XE для сопроцессора Intel Xeon Phi позволяет определить функции и участки кода, на выполнение которых тратится больше всего времени?

General Exploration
Lightweight Hotspots
Bandwidth


Выберите описание, соответствующее типу анализа "General Exploration" инструмента Intel VTune Amplifier XE для сопроцессора Intel Xeon Phi:

позволяет определить функции и участки кода, на выполнение которых тратится больше всего времени
предназначен для анализа пропускной способности памяти
позволяет выявить микроархитектурные особенности, отрицательно влияющие на производительность. Это могут быть, например, частые промахи L1 или L2 кэша, промахи TLB кэша или степень векторизации кода


Выберите описание, соответствующее типу анализа "Lightweight Hotspots" инструмента Intel VTune Amplifier XE для сопроцессора Intel Xeon Phi:

позволяет выявить микроархитектурные особенности, отрицательно влияющие на производительность. Это могут быть, например, частые промахи L1 или L2 кэша, промахи TLB кэша или степень векторизации кода
позволяет определить функции и участки кода, на выполнение которых тратится больше всего времени
предназначен для анализа пропускной способности памяти


Выберите описание, соответствующее типу анализа "Bandwidth" инструмента Intel VTune Amplifier XE для сопроцессора Intel Xeon Phi:

позволяет определить функции и участки кода, на выполнение которых тратится больше всего времени
предназначен для анализа пропускной способности памяти
позволяет выявить микроархитектурные особенности, отрицательно влияющие на производительность. Это могут быть, например, частые промахи L1 или L2 кэша, промахи TLB кэша или степень векторизации кода


Выберите описание, соответствующее метрике производительности "memory bandwidth"?

индикатор того, как сильно латентность доступа к памяти влияет на производительность приложения
величина показателя пропускной способности памяти
показывает среднее число векторных операций, приходящихся на один доступ к кэш памяти
показывает среднее число векторных операций, приходящихся на один доступ к кэш памяти


Выберите описание, соответствующее метрике производительности "vectorization intensity"?

индикатор того, как сильно латентность доступа к памяти влияет на производительность приложения
показывает среднее число векторных операций, приходящихся на один доступ к кэш памяти
величина показателя пропускной способности памяти
показывает отношение числа векторных операций к числу векторных инструкций, выполняемых потоком


Выберите описание, соответствующее метрике производительности "cycles per instruction, CPI"?

величина показателя пропускной способности памяти
индикатор того, как сильно латентность доступа к памяти влияет на производительность приложения
показывает среднее число векторных операций, приходящихся на один доступ к кэш памяти
показывает отношение числа векторных операций к числу векторных инструкций, выполняемых потоком


Выберите описание, соответствующее метрике производительности "compute to data access ratio"?

величина показателя пропускной способности памяти
показывает среднее число векторных операций, приходящихся на один доступ к кэш памяти
показывает отношение числа векторных операций к числу векторных инструкций, выполняемых потоком
индикатор того, как сильно латентность доступа к памяти влияет на производительность приложения


Какая метрика производительности показывает среднее число векторных операций, приходящихся на один доступ к кэш памяти?

memory bandwidth
compute to data access ratio
cycles per instruction, CPI
vectorization intensity


Какая метрика производительности является показателем пропускной способности памяти?

memory bandwidth
какая метрика производительности является показателем пропускной способности памяти?
vectorization intensity
compute to data access ratio


Какая метрика производительности является индикатором того, как сильно латентность доступа к памяти влияет на производительность приложения?

vectorization intensity
cycles per instruction, CPI
compute to data access ratio
memory bandwidth


Какая метрика производительности показывает отношение числа векторных операций к числу векторных инструкций, выполняемых потоком?

compute to data access ratio
cycles per instruction, CPI
memory bandwidth
vectorization intensity


Для использования функций из библиотеки MKL необходимо слинковать вашу программу с одной из следующих библиотек: mkl_intel_thread.lib или mkl_sequential.lib. В чём основное отличие этих библиотек?

эти библиотеки реализуют разные соглашения о вызове функций (стандартный вызов языка C или stdcall)
одна библиотека содержит реализацию параллельных версий функций, вторая – последовательных
одна библиотека содержит реализацию параллельных версий функций, вторая – последовательных


Для использования функций из библиотеки MKL необходимо слинковать вашу программу с одной из следующих библиотек: mkl_intel_c.lib или mkl_intel_s.lib. В чём основное отличие этих библиотек?

одна библиотека содержит реализацию параллельных версий функций, вторая – последовательных
одна библиотека содержит реализацию потокобезопасных функции, вторая – нет
эти библиотеки реализуют разные соглашения о вызове функций (стандартный вызов языка C или stdcall)


Библиотека MKL содержит функции slasrt и dlasrt (из стандарта BLAS), предназначенные для сортировки массивов данных. Чем отличаются эти функции?

функции предназначены для сортировки разных типов данных (вещественные числа одинарной и двойной точности)
функции одинаковые (одна из функций осталась для совместимости из предыдущей версии библиотеки)
функции предназначены для сортировки массивов в разном порядке (возрастающем и убывающем)


Вы написали параллельную программу с использованием OpenMP на языке C. Эта программа работает корректно на подготовленных тестовых данных. Вы запустили вашу программу два раза на 4-хядерной машине. Первый раз вы запустили программу в один поток, и она работала 39 секунд, второй – в 4 потока и она работала 34 секунды. Чем вы воспользуетесь в первую очередь при дальнейшей разработке программы?

Parallel Inspector в режиме Memory Errors
Parallel Amplifier в режиме Hotspots
Parallel Inspector в режиме Threading Errors
Parallel Amplifier в режиме Concurrency


Какие из приведенных ниже типов функций BLAS библиотеки Intel MKL могут работать на сопроцессоре в «нативном» (native) режиме:

*TRSM и *TRMM
Все функции BLAS
*GEMM, *TRSM и *TRMM
*GEMM


После Hotspots анализа Intel Parallel Amplifier показал, что на выполнение функции, которая выполняет 5 арифметических действий с вещественными числами, тратиться 35 % работы программы. Какова наиболее вероятная причина произошедшего?

программа работает очень быстро, и рассматриваемая функция действительно выполняется 35 % времени работы программы
Intel Parallel Amplifier ошибся, т.к. это инструмент статистического анализа
рассматриваемая функция вызывалась большое количество раз


Каким образом можно указать компилятору, что на нулевой сопроцессор должно приходиться 70% нагрузки при вызове функций библиотеки Intel MKL в режиме Automatic Offload:

используя переменную окружения MKL_MIC_0_WORKDIVISION=0.3
используя функцию mkl_mic_set_Workdivision(MKL_TARGET_MIC, 0, 0.7)
используя переменную окружения MKL_MIC_0_WORKDIVISION=0.7
используя функцию mkl_mic_set_Workdivision(MKL_TARGET_MIC, 0, 0.3)


Каким образом можно сказать уомпилятору, что на сопроцессор с номером 1 должно приходиться 30% нагрузки при вызове функций библиотеки Intel MKL в режиме Automatic Offload:

используя переменную окружения MKL_MIC_1_WORKDIVISION=0.3
используя переменную окружения MKL_MIC_0_WORKDIVISION=0.7
используя функцию mkl_mic_set_Workdivision(MKL_TARGET_MIC, 0, 0.3)
используя функцию mkl_mic_set_Workdivision(MKL_TARGET_MIC, 1, 0.7)


Каким образом можно указать компилятору, что на сопроцессор с номером 1 должно приходиться 70% нагрузки при вызове функций библиотеки Intel MKL в режиме Automatic Offload:

используя функцию mkl_mic_set_Workdivision(MKL_TARGET_MIC, 0, 0.3)
используя переменную окружения MKL_MIC_1_WORKDIVISION=0.3
используя переменную окружения MKL_MIC_0_WORKDIVISION=0.7
используя функцию mkl_mic_set_Workdivision(MKL_TARGET_MIC, 1, 0.7)


Какую информацию о ходе выполнения программы можно получить, воспользовавшись ключами компилятора Intel "-profile-functions -profile-loops=all -profile-loops-report=2":

среднее, минимальное и максимальное время работы каждой из функций программы
какие функции работают дольше всего
среднее, минимальное и максимальное число итераций циклов
какие циклы работают дольше всего


Инструмент Intel VTune Amplifier позволяет:

получать рекомендации касательно возможности распараллеливания определенных участков кода с указанием возможной эффективности распараллеливания
находить функции и участки кода, на выполнение которых расходуется больше всего времени. Анализирует стеки вызовов и исходный код
определять количество внутренних событий процессора, которые влияют на производительность. Например, промахи кэша разных уровней, неверно предсказанные ветвления и др.
определять время ожидания в блокировках потоков, а также уровень загрузки CPU


Каким инструментом Intel следует пользоваться для выявления ошибок работы с памятью и ошибок многопоточности в программе:

Intel VTune Amplifier XE
Intel Inspector XE
Intel Compiler с ключами "-profile-functions -profile-loops=all -profile-loops-report=2" и Loop Profile Viewer


Каким инструментом Intel следует пользоваться для получения информации об эффективности многопоточного выполнения программы:

Intel Inspector XE
Intel Compiler с ключами "-profile-functions -profile-loops=all -profile-loops-report=2" и Loop Profile Viewer
Intel VTune Amplifier XE


Каким инструментом Intel следует пользоваться для получения информации о функциях и циклах, занимающих больше всего времени, а также о среднем, минимальном и максимальном числе итераций этих циклов:

Intel VTune Amplifier XE
Intel Compiler с ключами "-profile-functions -profile-loops=all -profile-loops-report=2" и Loop Profile Viewer
Intel Inspector XE


В случае работы с приложением для Intel Xeon Phi инструмент Intel Inspector XE рекомендуется использовать для:

получения информации о функциях и циклах, занимающих больше всего времени, а также о среднем, минимальном и максимальном числе итераций этих циклов
выявления в коде таких ошибок, как зависимость по данным, тупики и т.п. при работе на CPU (с отключенной функцией offload). После исправления всех выявленных ошибок можно включать offload режим и продолжать отладку на сопроцессоре
выявления проблем эффективности распараллеливания при работе на CPU (с отключенной функцией offload). После того, как удастся устранить все проблемы, нужно переходить к работе с сопроцессором и проводить на нем дальнейшую оптимизацию


Инструмент Intel Loop Profile Viewer (+ соответствующие ключи компилятора) рекомендуется использовать для:

выявления в коде таких ошибок, как зависимость по данным, тупики и т.п. при работе на CPU (с отключенной функцией offload). После исправления всех выявленных ошибок можно включать offload режим и продолжать отладку на сопроцессоре
получения информации о функциях и циклах, занимающих больше всего времени, а также о среднем, минимальном и максимальном числе итераций этих циклов
выявления проблем эффективности распараллеливания при работе на CPU (с отключенной функцией offload). После того, как удастся устранить все проблемы, нужно переходить к работе с сопроцессором и проводить на нем дальнейшую оптимизацию


В случае работы с приложением для Intel Xeon Phi инструмент Intel VTune Amplifier XE рекомендуется использовать для:

выявления в коде таких ошибок, как зависимость по данным, тупики и т.п. при работе на CPU (с отключенной функцией offload). После исправления всех выявленных ошибок можно включать offload режим и продолжать отладку на сопроцессоре
получения информации о функциях и циклах, занимающих больше всего времени, а также о среднем, минимальном и максимальном числе итераций этих циклов
выявления проблем эффективности распараллеливания при работе на CPU (с отключенной функцией offload). После того, как удастся устранить все проблемы, нужно переходить к работе с сопроцессором и проводить на нем дальнейшую оптимизацию


Для запуска приложения "./program_name" с единственным параметром "10" с помощью GUI компонента Intel VTune Amplifier XE в режиме offload необходимо:

в качестве приложения для запуска (поле Application) необходимо указать "./program_name 10", а поле параметров приложения (Application parameters) оставить пустым
в качестве приложения для запуска (поле Application) необходимо указать "ssh", а в качестве параметров приложения (поле Application parameters) - "mic0 ./program_name 10"
в качестве приложения для запуска (поле Application) необходимо указать "./program_name", а в качестве параметров приложения (поле Application parameters) - "10"
в качестве приложения для запуска (поле Application) необходимо указать "ssh mic0 ./program_name", а в качестве параметров приложения (поле Application parameters) - "10"


Для запуска приложения "./program_name" с единственным параметром "10" с помощью GUI компонента Intel VTune Amplifier XE в нативном (native) режиме необходимо:

в качестве приложения для запуска (поле Application) необходимо указать "ssh mic0 ./program_name", а в качестве параметров приложения (поле Application parameters) - "10"
в качестве приложения для запуска (поле Application) необходимо указать "ssh", а в качестве параметров приложения (поле Application parameters) - "mic0 ./program_name 10"
в качестве приложения для запуска (поле Application) необходимо указать "./program_name", а в качестве параметров приложения (поле Application parameters) - "10"
в качестве приложения для запуска (поле Application) необходимо указать "./program_name 10", а поле параметров приложения (Application parameters) оставить пустым


Для запуска мониторинга приложения с помощью Intel VTune Amplifier XE с указанием конкретных счетчиков производительности в режиме offload нужно выполнить команду:

amplxe-cl –collect knc-lightweight-hotspots –knob target-cards=0,1 –result-dir ./program_cmd -- ./program.out

amplxe-cl –collect knc-lightweight-hotspots –reslut-dir ./program-cmd -- ssh mic0 “export LD_LIBRARY_PATH=~/;
export OMP_NUM_THREADS=244; export KMP_AFFINITY=balanced;
./program.out”

amplxe-cl –collect-with runsa-knc –knob event-config=CPU_CLK_UNHALTED,L2_DATA_READ_MISS_MEM_FILL:
sa=1000,L2_DATA_WRITE_MISS_MEM_FILL,L2_VICTIM_REQ_WITH_DATA,SNP_HINT_L2,HWP_L2MISS –knob target-cards=0,1 –result-dir ./program-cmd -- ./program.out


Для запуска мониторинга приложения с помощью Intel VTune Amplifier XE с предопределенным типом анализа Lightweight Hotspots в режиме offload нужно выполнить команду:

amplxe-cl –collect knc-lightweight-hotspots –reslut-dir ./program-cmd -- ssh mic0 “export LD_LIBRARY_PATH=~/;
export OMP_NUM_THREADS=244; export KMP_AFFINITY=balanced;
./program.out”

amplxe-cl –collect knc-lightweight-hotspots –knob target-cards=0,1 –result-dir ./program_cmd -- ./program.out

amplxe-cl –collect-with runsa-knc –knob event-config=CPU_CLK_UNHALTED,L2_DATA_READ_MISS_MEM_FILL:
sa=1000,L2_DATA_WRITE_MISS_MEM_FILL,L2_VICTIM_REQ_WITH_DATA,SNP_HINT_L2,HWP_L2MISS –knob target-cards=0,1 –result-dir ./program-cmd -- ./program.out


Для запуска мониторинга приложения с помощью Intel VTune Amplifier XE с предопределенным типом анализа Lightweight Hotspots в нативном (native) режиме нужно выполнить команду:

amplxe-cl –collect knc-lightweight-hotspots –knob target-cards=0,1 –result-dir ./program_cmd -- ./program.out

amplxe-cl –collect knc-lightweight-hotspots –reslut-dir ./program-cmd -- ssh mic0 “export LD_LIBRARY_PATH=~/;
export OMP_NUM_THREADS=244; export KMP_AFFINITY=balanced;
./program.out”

amplxe-cl –collect-with runsa-knc –knob event-config=CPU_CLK_UNHALTED,L2_DATA_READ_MISS_MEM_FILL:
sa=1000,L2_DATA_WRITE_MISS_MEM_FILL,L2_VICTIM_REQ_WITH_DATA,SNP_HINT_L2,HWP_L2MISS –knob target-cards=0,1 –result-dir ./program-cmd -- ./program.ou


Для просмотра списка наиболее медленных функций по конкретному запуску приложения с помощью Intel VTune Amplifier необходимо выполнить команду:

amplxe-cl –report hw-events –r ./offload_cmd/
amplxe-cl –report summary –r ./offload_cmd/
amplxe-cl –report hotspots –r ./offload_cmd/


Для просмотра общей статистики по конкретному запуску приложения с помощью Intel VTune Amplifier необходимо выполнить команду:

amplxe-cl –report summary –r ./offload_cmd/
amplxe-cl –report hotspots –r ./offload_cmd/
amplxe-cl –report hw-events –r ./offload_cmd/


Для получения информации об аппаратных событиях, произошедших за время работы приложения, запущенного с помощью Intel VTune Amplifier, необходимо выполнить команду:

amplxe-cl –report hw-events –r ./offload_cmd/
amplxe-cl –report hotspots –r ./offload_cmd/

Вы можете обратится к нам напрямую, через:

skype По Skype: molodoyberkut
telegram По Telegram: @MolodoyBerkut
icq По ICQ: 657089516

Или через форму обратной связи на нашем сайте
Пока сочиняется...
4.png