Вопросы к Поиску с Алисой
Для параллельного вычисления нескольких квадратных корней чисел двойной точности на ПК можно использовать векторные процессорные инструкции. yandex.ru stackoverflow.com Они выполняют одну и ту же операцию со всеми векторными элементами параллельно. stackoverflow.com
Также для этой задачи можно применить инструкцию fsqrt в x86-процессорах, которая аппаратно реализует квадратный корень с расширенной точностью. otvet.mail.ru
Ещё один вариант — использовать инструкцию sqrtpd. stackoverflow.com Современные процессоры выполняют её параллельно, не запуская через более узкий исполнительный модуль по одному за раз. stackoverflow.com
Также для параллельных вычислений можно применить инструкции CUDA, например, CUDA Toolkit Documentation, CUDA Math API, CUDA Thrust Library, CUDA Best Practices Guide, h2sqrt, thrust.transform. yandex.ru