C++ memcpy每秒字节速率

C++ memcpy每秒字节速率,c++,c,linux,memcpy,C++,C,Linux,Memcpy,memcpy将从缓冲区中每复制10000个元素的CPU使用率提高到100%。有没有办法优化memcpy以减少CPU的使用?这个问题在回答这个问题后已经被完全重写了 您的代码可以更改为在Linux上运行,如下所示: #include <stdio.h> #include <stdlib.h> #include <string.h> #include <time.h> const size_t NUM_ELEMENTS = 2*1024 * 1024

memcpy将从缓冲区中每复制10000个元素的CPU使用率提高到100%。有没有办法优化memcpy以减少CPU的使用?

这个问题在回答这个问题后已经被完全重写了

您的代码可以更改为在Linux上运行,如下所示:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>

const size_t NUM_ELEMENTS = 2*1024 * 1024;
const size_t ITERATIONS = 10000;

int main(int argc, char *argv[])
{
    struct timespec start, stop;
    unsigned short * src = (unsigned short *) malloc(sizeof(unsigned short) * NUM_ELEMENTS);
    unsigned short * dest = (unsigned short *) malloc(sizeof(unsigned short) * NUM_ELEMENTS);

    for(int ctr = 0; ctr < NUM_ELEMENTS; ctr++)
    {
        src[ctr] = rand();
    }

    clock_gettime(CLOCK_MONOTONIC, &start);

    for(int iter = 0; iter < ITERATIONS; iter++){
        memcpy(dest, src, NUM_ELEMENTS * sizeof(unsigned short));
    }

    clock_gettime(CLOCK_MONOTONIC, &stop);

    double duration_d = (double)(stop.tv_sec - start.tv_sec) + (stop.tv_nsec - start.tv_nsec) / 1000000000.0;

    double bytes_sec = (ITERATIONS * (NUM_ELEMENTS/1024/1024) * sizeof(unsigned short)) / duration_d;

    printf("Duration: %.5lfs for %d iterations, %.3lfMB/sec\n", duration_d, ITERATIONS, bytes_sec);

    free(src);
    free(dest);

    return 0;
}

您可能需要与-lrt链接以获取clock\u gettime函数。

您需要以毫秒为单位的时间。您的程序不执行任何I/O。如果它只占用您CPU时间的20%,那么其他80%的时间将被浪费或被其他进程占用。为什么这是一个目标?我被告知CPU使用率在我的程序中应该至少达到20%。但是,当我运行该程序并使用htop时,它显示CPU使用率为60%。@user1596226:如果您的CPU使用率应为mininum 20%,为什么?那么60%满足您的要求。CPU使用率越高,意味着您的CPU使用效率越高。另一方面,如果您编写一个循环,在每次迭代中复制一个字节并休眠一秒钟,那么您的CPU使用率可能会低于1%。