Java 除非线程的run（）方法中放入了Thread.sleep（1），否则超过2个线程的运行速度比1或2个线程慢_Java_Multithreading_Threadpool_Executorservice_Collatz

Java 除非线程的run（）方法中放入了Thread.sleep（1），否则超过2个线程的运行速度比1或2个线程慢

java multithreading

Java 除非线程的run（）方法中放入了Thread.sleep（1），否则超过2个线程的运行速度比1或2个线程慢,java,multithreading,threadpool,executorservice,collatz,Java,Multithreading,Threadpool,Executorservice,Collatz,我试图实现的任务是使用多个线程在设定的时间间隔内查找数字的Collatz序列，并查看与一个线程相比有多少改进然而，无论我选择2个线程，一个线程总是更快（编辑。2个线程更快，但不多，而4个线程比1个线程慢，我不知道为什么。（我甚至可以说线程越多，速度越慢）。我希望有人能解释。也许我做错了什么下面是我到目前为止编写的代码。我使用ThreadPoolExecutor执行任务（一个任务=间隔中一个数字的一个Collatz序列） Collatz类： public class ParallelC

我试图实现的任务是使用多个线程在设定的时间间隔内查找数字的Collatz序列，并查看与一个线程相比有多少改进

然而，无论我选择2个线程，一个线程总是更快（编辑。2个线程更快，但不多，而4个线程比1个线程慢，我不知道为什么。（我甚至可以说线程越多，速度越慢）。我希望有人能解释。也许我做错了什么

下面是我到目前为止编写的代码。我使用ThreadPoolExecutor执行任务（一个任务=间隔中一个数字的一个Collatz序列）

Collatz类：

    public class ParallelCollatz implements Runnable {
    private long result;
    private long inputNum;

    public long getResult() {
        return result;
    }
    public void setResult(long result) {
        this.result = result;
    }
    public long getInputNum() {
        return inputNum;
    }
    public void setInputNum(long inputNum) {
        this.inputNum = inputNum;
    }
    public void run() {

        //System.out.println("number:" + inputNum);
        //System.out.println("Thread:" + Thread.currentThread().getId());
        //int j=0;
        //if(Thread.currentThread().getId()==11) {
        //  ++j;
        //  System.out.println(j);
        //}

            long result = 1;

            //main recursive computation
            while (inputNum > 1) {

                if (inputNum % 2 == 0) {
                    inputNum = inputNum / 2;
                } else {
                    inputNum = inputNum * 3 + 1;
                }
                ++result;
            }
           // try {
                //Thread.sleep(10);
            //} catch (InterruptedException e) {
                // TODO Auto-generated catch block
        //      e.printStackTrace();
            //}
            this.result=result;
            return;
        }

}

以及我运行线程的主类（是的，现在我创建了两个具有相同编号的列表，因为在运行一个线程后，初始值丢失）：

ThreadPoolExecutor executor=（ThreadPoolExecutor）Executors.newFixedThreadPool（1）；
ThreadPoolExecutor Executor 2=（ThreadPoolExecutor）Executors.newFixedThreadPool（4）；
列表任务=新建ArrayList（）；
对于（int i=1；i您不是在等待任务完成，而是在测量将任务提交给执行者所需的时间
executor.shutdown（）
不会等待所有任务完成。之后需要调用executor.waitTermination

executor.shutdown();
executor.awaitTermination(5, TimeUnit.HOURS);


更新
我相信我们的测试方法是有缺陷的。我在我的机器上重复了你的测试，（1个处理器，2个内核，4个逻辑处理器），每次运行的时间差别很大
我相信主要原因如下：

JVM启动和JIT编译时间。开始时，代码以解释模式运行
计算结果被忽略了。我没有直觉，JIT删除了什么，我们实际测量的是什么
代码中的打印行

为了测试这一点，我将您的测试转换为JMH。
特别是：

我将runnable转换为callable，并返回结果的总和以防止内联（或者，您可以使用JMH中的BlackHole）
我的任务没有状态，我将所有移动部件移动到局部变量。清理任务不需要GC
我仍然在每一轮中创建执行者。这并不完美，但我决定保持原样

我在下面收到的结果与我的预期一致：一个内核在主线程中等待，工作在单个内核上执行，数量几乎相同
Benchmark                  Mode  Cnt    Score    Error  Units
SpeedTest.multipleThreads  avgt   20  559.996 ± 20.181  ms/op
SpeedTest.singleThread     avgt   20  562.048 ± 16.418  ms/op

更新代码：
public class ParallelCollatz implements Callable<Long> {

    private final long inputNumInit;

    public ParallelCollatz(long inputNumInit) {
        this.inputNumInit = inputNumInit;
    }


    @Override
    public Long call() {
        long result = 1;
        long inputNum = inputNumInit;
        //main recursive computation
        while (inputNum > 1) {

            if (inputNum % 2 == 0) {
                inputNum = inputNum / 2;
            } else {
                inputNum = inputNum * 3 + 1;
            }
            ++result;
        }
        return result;
    }

}

公共类ParallelCollatz实现了可调用{
私人最终长输入；
公共并行Collatz（长输入）{
this.inputNumInit=inputNumInit；
}
@凌驾
公共长途电话（）{
长期结果=1；
长inputNum=inputnumini；
//主递归计算
while（inputNum>1）{
如果（inputNum%2==0）{
inputNum=inputNum/2；
}否则{
inputNum=inputNum*3+1；
}
++结果；
}
返回结果；
}
}

以及基准本身：
@State(Scope.Benchmark)
public class SpeedTest {
private static final int NUM_TASKS = 1000000;

    private static List<ParallelCollatz> tasks = buildTasks();

    @Benchmark
    @Fork(value = 1, warmups = 1)
    @BenchmarkMode(Mode.AverageTime)
    @OutputTimeUnit(TimeUnit.MILLISECONDS)
    @SuppressWarnings("unused")
    public long singleThread() throws Exception {
        ThreadPoolExecutor executorOneThread = (ThreadPoolExecutor) Executors.newFixedThreadPool(1);
        return measureTasks(executorOneThread, tasks);
    }

    @Benchmark
    @Fork(value = 1, warmups = 1)
    @BenchmarkMode(Mode.AverageTime)
    @OutputTimeUnit(TimeUnit.MILLISECONDS)
    @SuppressWarnings("unused")
    public long multipleThreads() throws Exception {
        ThreadPoolExecutor executorMultipleThread = (ThreadPoolExecutor) Executors.newFixedThreadPool(4);
        return measureTasks(executorMultipleThread, tasks);
    }

    private static long measureTasks(ThreadPoolExecutor executor, List<ParallelCollatz> tasks) throws InterruptedException, ExecutionException {
        long sum = runTasksInExecutor(executor, tasks);
       return sum;
    }

    private static long runTasksInExecutor(ThreadPoolExecutor executor, List<ParallelCollatz> tasks) throws InterruptedException, ExecutionException {
        List<Future<Long>> futures = new ArrayList<>(NUM_TASKS);
        for (int i = 0; i < NUM_TASKS; i++) {
            Future<Long> f = executor.submit(tasks.get(i));
            futures.add(f);
        }
        executor.shutdown();

        boolean tempFirst = false;
        try {
            tempFirst = executor.awaitTermination(5, TimeUnit.HOURS);
        } catch (InterruptedException e1) {
            // TODO Auto-generated catch block
            e1.printStackTrace();
        }
        long sum = 0l;
        for (Future<Long> f : futures) {
            sum += f.get();
        }
        //System.out.println(sum);
        return sum;
    }

    private static List<ParallelCollatz> buildTasks() {
        List<ParallelCollatz> tasks = new ArrayList<>();
        for (int i = 1; i <= NUM_TASKS; i++) {
            ParallelCollatz task = new ParallelCollatz((long) (i + NUM_TASKS));

            tasks.add(task);

        }
        return tasks;
    }

}

@State（Scope.Benchmark）
公开课速考{
私有静态最终int NUM_任务=1000000；
私有静态列表任务=buildTasks（）；
@基准
@叉（值=1，预热=1）
@基准模式（模式平均时间）
@OutputTimeUnit（时间单位毫秒）
@抑制警告（“未使用”）
公共长单线程（）引发异常{
ThreadPoolExecutor executorOneThread=（ThreadPoolExecutor）Executors.newFixedThreadPool（1）；
返回度量任务（executorOneThread，tasks）；
}
@基准
@叉子（值=1，预热=1）
@基准模式（模式平均时间）
@OutputTimeUnit（时间单位毫秒）
@抑制警告（“未使用”）
public long multipleThreads（）引发异常{
ThreadPoolExecutor Executor MultipleThread=（ThreadPoolExecutor）Executors.newFixedThreadPool（4）；
返回度量任务（executorMultipleThread，任务）；
}
私有静态长度量任务（ThreadPoolExecutor executor，List tasks）引发InterruptedException，ExecutionException{
长和=运行任务执行器（执行器，任务）；
回报金额；
}
私有静态长时间运行任务执行器（ThreadPoolExecutor，executor，List tasks）引发InterruptedException，ExecutionException{
列表未来=新数组列表（NUM_任务）；
对于（int i=0；i对于（int i=1；i您不是在等待任务完成，而是在测量将任务提交给执行者所需的时间
executor.shutdown（）
不会等待所有任务完成。之后需要调用executor.waitTermination

executor.shutdown();
executor.awaitTermination(5, TimeUnit.HOURS);


更新
我相信我们的测试方法是有缺陷的。我在我的机器上重复了你的测试，（1个处理器，2个内核，4个逻辑处理器），每次运行的时间差别很大
我相信主要原因如下：

JVM启动和JIT编译时间。开始时，代码以解释模式运行
计算的结果被忽略了。我没有直觉什么