Параллельная обработка данных в потоковых мультипроцессорах работает следующим образом: каждая операция в программе рассматривается как отдельный процесс. 2 Такая операция ждёт своих входных данных (операндов), которые должны быть переданы ей другими процессами. 2 По их получении операция выполняется, и её результат передаётся тем процессам, которые в нём нуждаются. 2
Например, в платформе CUDA параллельная обработка данных осуществляется через коммуникацию между потоками через память. 1 Потоки могут читать входные данные, изменять выходные данные либо обмениваться «промежуточными» результатами. 1
Также в потоковых мультипроцессорах используется концепция SIMD (от англ. Single Instruction — Multiple Data — одна инструкция для множества данных). 5 Она обеспечивает параллельное использование большого количества «вычислителей» без явного управления ими: распределения задач, синхронизации вычислений и коммуникации между параллельными расчётами. 5